Image Cover
Avatar

Sun* AI Research Team

level partner

Nhà sáng tạo nội dung hạng Bạc

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Bài viết được ghim

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
14.1K
57
28 8

Tất cả bài viết

Thumbnail Image
3.4K
25
10 4
Avatar Bui Tien Tung thg 8 18, 2021 5:08 CH
28 phút đọc

Video Understanding: Tổng quan

"Thợ lặn" hơi lâu, sau sự kiện MayFest thì đến bây giờ cũng là 3 tháng rồi mình không viết thêm bài mới. Thế nên là, hôm nay mình lại ngoi lên, đầu tiên là để luyện lại văn viết một chút, tiếp theo cũng là muốn chia sẻ thêm với mọi người về một lớp bài toán khá hay ho mà mình cũng đang tìm hiểu gần đây: Video Understanding.

Đương nhiên, hay ho thì sẽ luôn đi kèm với nhiều thách thức, do đó, để...

Thumbnail Image
5.4K
13
2 6
Avatar Cao Minh Hiếu thg 8 17, 2021 3:11 CH
19 phút đọc

Làm chủ Stacking Ensemble Learning

Chào mọi người, trong quá trình viết về AdaBoost của, mình có tìm được 2 bài về Ensemble Learning Ensemble learning và các biến thể (P1) và Gradient Boosting - Tất tần tật về thuật toán mạnh mẽ nhất trong Machine Learning của các anh. Hai bài đã giải thích rất rõ để mọi người hiểu thế nào là mô hình học yếu, cách để kết h...

Thumbnail Image
9.9K
57
10 9
Avatar Nguyen Thanh Huyen thg 8 16, 2021 12:45 SA
22 phút đọc

[Paper explained] Some Face Recognition Approaches: Facenet, ArcFace, CosFace

Các kiến thức trong bài viết hôm nay bao gồm:

  • Core idea của bài toán Face Recognition
  • FaceNet with Triplet Loss
  • CosFace
  • ArcFace
  1. Bài toán Face Recognition Chắc hẳn mọi người đều đã từng nghe đến bài toán Face Recognition. Face Recognition có thể nói bao gồm hai bài toán con:
  • Face identification (nhận diện khuôn mặt): là bài toán one-to-many. Input là ảnh một khuôn mặt, và mô hình c...
Thumbnail Image
743
11
2 5
Avatar Trần Đức Trung thg 8 15, 2021 1:17 CH
22 phút đọc

Giải thích cách thức mô hình hoạt động với Layer-Wise Relevance Propagation

Để một mô hình học máy có thể khái quát hóa tốt, người ta cần đảm bảo rằng các quyết định của nó được hỗ trợ bởi các mẫu có ý nghĩa trong dữ liệu đầu vào. Tuy nhiên, điều kiện tiên quyết là để mô hình có thể tự giải thích, ví dụ: bằng cách làm nổi bật các đặc trưng đầu vào mà nó sử dụng để hỗ trợ dự đoán của nó. Layer-Wise Relevance Propagation hay LRP là một kỹ thuật mang lại khả năng giải thí...

Thumbnail Image
423
6
1 0
Avatar Ngoc N Tran thg 8 13, 2021 10:13 SA
27 phút đọc

Noisy training cho Adversarial Defense

Mở bài

Vấn đề về adversarial attacks chắc hẳn đã không còn xa lạ sau khi đọc bài kia của mình rồi nhỉ 😄 Đó là khi một ảnh có thể bị thay đổi đôi chút sao cho người nhìn không nhận ra khác nhau, nhưng mô hình thì lại đưa ra dự đoán sai.

Lại là cái ảnh thần thánh của FGSM

Vậy ngoài các cách phòng thủ trong bài trên ra còn những phương pháp nào nữa? Một cách chúng ta có thể làm là x...

Thumbnail Image
502
4
0 2
Avatar Do Dang Hung thg 8 8, 2021 10:36 SA
11 phút đọc

Sinh tín hiệu hình sine với mô hình GAN

Giới thiệu Các ứng dụng về GAN ở domain về ảnh thì vô cùng nhiều nhưng trong domain tín hiệu time-series thì chưa có nhiều. Với ý tưởng là các tín hiệu phức tạp thì theo fourier có thể phân tách được nhiều tín hiệu dạng sin. Nên khi mô hình có thể tạo ra được tín hiệu sin thì theo nguyên lý sẽ tạo được các tín hiệu phức tạp hơn, vì vậy trong bài này mình sẽ xây dựng mô hình GAN để sinh tín hiệu...

Thumbnail Image
1.6K
14
3 0
Avatar Bui Quang Manh thg 8 8, 2021 6:15 SA
5 phút đọc

Tool nhận dạng chữ tiếng Việt qua ảnh

Xin chào mọi người, đợt dịch này cuối tuần rảnh rỗi không đi chơi đâu được nên mình học về cách triển khai mô hình deep learning bằng ba công cụ: torchserve, streamlit và docker. Và mình có áp dụng những kiến thức mình học được để làm một project nho nhỏ để chia sẻ cho mọi người. Đó là tool Nhận diện chữ tiếng Việt qua ảnh. Các bạn có thể tải toàn bộ mã nguồn ở đây nhé..

. <img src="https...

Thumbnail Image
1.5K
7
0 0
Avatar Nguyen Dinh Thien thg 8 6, 2021 8:54 SA
11 phút đọc

Các giải thuật tìm kiếm thường được sử dụng trong Natural Language Generation

Chào mọi người, trong bài viết này mình sẽ cùng mọi người tìm hiểu một số thuật toán tìm kiếm được sử dụng trong Natural Language Generation.

I. Tổng quan về Natural Language Generation Natural Language Generation là gì? Natural Language Generation(NLG) là việc sử dụng AI để tạo ra các câu chuyện viết hoặc nói từ một tập dữ liệu. NLG liên quan đến tương tác giữa người với máy và máy với người,...

Thumbnail Image
805
11
6 0
Avatar Chung Pham Van thg 7 31, 2021 4:37 CH
5 phút đọc

Tìm kiếm từ đồng nghĩa và loại suy - Word Similarity and Analogy

[IMG]

Glove embedding

Trong xử lý ngôn ngữ tự nhiên, có rất nhiều kỹ thuật có thể ánh xạ từ ngữ sang vector số thực, còn được gọi là embedding từ (word embedding). Có rất nhiều kỹ thuật, đơn giản nhất là sử dụng vector one-hot để đại diện cho từ. Tuy nhiên, kỹ thuật này lại không biểu diễn được độ tương quan giữa các từ.

Một kỹ thuật tốt hơn là Word2Vec, nó biểu diễn 1 từ bằng 1 vector có độ dài c...

Thumbnail Image
4.7K
14
4 3
Avatar Bui Quang Manh thg 7 30, 2021 8:03 SA
6 phút đọc

Thử áp dụng mô hình dịch máy vào bài toán tự động sửa lỗi tiếng Việt

Toàn bộ phần mã nguồn của bài toán các bạn có thể tham khảo github của mình nhé: VietnameseOcrCorrection

  1. Mục đích bài toán. Bài toán sửa lỗi tiếng Việt hiện tại đã được nhiều ông lớn trong làng công nghệ sử dụng trong nhiều ứng dụng quen thuộc mà các bạn có thể đã từng dùng như: tính năng phát hiện lỗi sai trong Google Docx hay Mircosoft Word , .... Vậy công nghệ này sẽ giúp ích như thế nào ...
Thumbnail Image
1.1K
12
8 0
Avatar Chung Pham Van thg 7 22, 2021 5:42 SA
8 phút đọc

Cơ chế Attention và các hàm tính Attention Scoring

Cơ chế Attention là gì?

Trong lĩnh vực ML, DL, bài toán dịch máy với mạng neural (Neural Machine Translation) chắc hẳn không còn xa lạ gì với mọi người. Ý tưởng đơn giản nhất để giải quyết bài toán này là sử dụng mô hình Sequence to Sequence, với 2 khối encoder và decoder, mỗi khối chỉ sử dụng lớp embedding và mạng hồi tiếp mà thôi. Với mỗi chuỗi nguồn đầu vào input, chúng được mã hóa bởi mạng...

Thumbnail Image
15.3K
33
12 13
Avatar Quang Trần thg 7 21, 2021 12:50 CH
24 phút đọc

Nhận diện khuôn mặt với mạng MTCNN và FaceNet (Phần 2)

Chào mừng các bạn đã quay lại với series "Nhận diện khuôn mặt với mạng MTCNN và FaceNet" của mình. Ở phần 1, mình đã giải thích qua về lý thuyết và nền tảng của 2 mạng là MTCNN và FaceNet. Nếu chưa đọc phần 1, các bạn có thể đọc qua trước khi qua phần này để hiểu cơ chế hoạt động dễ dàng hơn nhé, link phần 1 tại đây. Về bài này, mình sẽ hướng dẫn các bạn cách để xây dựng và inference một model ...

Thumbnail Image
945
7
1 0
Avatar Nguyen Viet Hoai thg 7 20, 2021 1:47 SA
32 phút đọc

XÂY DỰNG MÔ HÌNH 1 PHA PHÁT HIỆN VÀ NHẬN DẠNG VĂN BẢN NHIỀU DÒNG

Tổng quan Tổng quan bài toán: Trong lĩnh vực xử lí ảnh trong Học sâu, đặc biệt là liên quan đến bài toán nhận dạng kí tự quan học, các bài toán phát hiện và nhận dạng văn bản vẫn đang là một bài toán thử thách và có tính ứng dụng cao trong cộng đồng phân tích tài liệu văn bản. Không những về độ khó đòi hỏi mô hình xử lí có cấu trúc phức tạp mà nó còn là một đề tài nghiên cứu có tính ứng dụng c...

Thumbnail Image
5.7K
25
14 1
Avatar Thao Hoang Thu thg 7 19, 2021 5:01 CH
13 phút đọc

Chia sẻ kinh nghiệm thi chứng chỉ Tensorflow Developer Certificate

Trong bài này mình sẽ giới thiệu sơ bộ về chứng chỉ Tensorflow Developer Certificate cùng với chia sẻ kinh nghiệm học và thi đỗ chứng chỉ này của mình

  1. Giới thiệu về chứng chỉ Tensorflow Developer Certificate

TensorFlow là chứng chỉ được Google cấp cho các lập trình viên, kỹ sư máy tính, làm việc trong lĩnh vực trí tuệ nhân tạo và học máy. Từ tháng 3/2020, công ty này thông báo bắt đầu mở đơ...

Thumbnail Image
560
5
1 3
Avatar Thao Hoang Thu thg 7 16, 2021 12:25 CH
4 phút đọc

Paraphrase text trên Python với Parrot

Nếu từng có trải nghiệm làm chatbot (ví dụ với Rasa), chắc hẳn bạn cũng từng phải vò đầu bứt tai cố nghĩ ra các cách nói khác nhau (paraphrase) của cùng một user intent để tạo training data cho chatbot. Paraphrase với tiếng mẹ đẻ là tiếng Việt đã rất nản và mất thời gian rồi chứ đừng nói đến những ngôn ngữ khác. Ngoài ra khi augment data cho một số task NLU khác (ví dụ slot-filling) chúng ta c...

Thumbnail Image
7.5K
12
7 2
Avatar Do Dang Hung thg 7 16, 2021 10:14 SA
8 phút đọc

Tìm hiểu về kiến trúc Transformer

Giới thiệu Với sự ra đời của cơ chế attention thì vào năm 2017 paper Attention is all you need đã giới thiệu một kiến trúc mới dành cho các bài toán NLP mà không có sự xuất hiện của các mạng nơ-ron hồi tiếp (RNN, LSTM,...) hay là mạng nơ-rơn tích chập (CNN) - đó là Transformer. Như đã giới thiệu ở bài viết trước, trong các bài toán seq2seq các cấu trúc RNN hay LSTM đều có những hạn chế nhất địn...

Thumbnail Image
1.0K
7
0 1
Avatar Long Lại Phi thg 7 16, 2021 9:22 SA
8 phút đọc

Adversarial Attack: Tấn công One-pixel

Giới thiệu

Nếu như chỉ được xây dựng một cách thông thường và không có ý định ngay từ ban đầu thì các mô hình Deep Learning tồn tại rất nhiều lỗ hổng về bảo mật. Một số cách tấn công mô hình rất phổ biến đó là tạo nên advesarial example bằng các thêm "noise" hay sử dụng các véc tơ để bóp méo ảnh đầu vào khiến cho ảnh tuy không có gì thay đổi với nhận thức của con người nhưng có thể khiến cho m...

Thumbnail Image
18.6K
24
9 0
Avatar Quang Trần thg 7 15, 2021 12:23 CH
13 phút đọc

Nhận diện khuôn mặt với mạng MTCNN và FaceNet (Phần 1)

Nhận diện khuôn mặt (Face Recognition) là một trong những thách thức lớn mà các nhà nghiên cứu về Học máy - Học sâu đã và đang phải đối mặt. Bài toán này có thể được áp dụng ở rất nhiều lĩnh vực khác nhau, đặc biệt trong những lĩnh vực yêu cầu độ chính xác và bảo mật cao như eKYC trong E-Comercial và nhận diện danh tính qua surveillance camera (CCTV). Ta sẽ chia bài toán này ra thành 2 vấn đề c...

Thumbnail Image
2.2K
11
4 3
Avatar Nguyen Dinh Thien thg 7 13, 2021 3:48 CH
6 phút đọc

Xây dựng mô hình Transformer cơ bản dịch tiếng Nhật sang tiếng Việt

I. Mở đầu

Trong bài viết này, mình sẽ hướng dẫn mọi người xây dựng mô hình transformer cơ bản cho dịch ngôn ngữ Nhật-Việt, trong bài viết trước đó của mình về Neural Machine Translation mình đã nêu ra một số khái niệm cơ bản của Seq2Seq(link ở phần tài liệu tham khảo), bởi vì trên Viblo đã có khá nhiều bài viết về Transformer cũng như Self-Attention hay, nên mình sẽ tiến hành hướng dẫn mọi ngư...

Thumbnail Image
6.7K
22
5 2
Avatar Blink thg 7 5, 2021 2:45 SA
13 phút đọc

Các kỹ thuật Dimensionality Reduction

Introduction

Với kỷ nguyên dữ liệu như hiện nay, một tập dữ liệu high-dimension (đa chiều) với hàng nghìn feature hay cột đã trở thành điều không quá xa lạ. High-dimension data mở hướng cho nhiều cách xử lý các bài toán phức tạp trong thực tế, có thể kể đến dự đoán cấu trúc protein liên quan COVID-19, phân tích hình ảnh MEG scan não, v.v. Tuy nhiên, một tập dữ liệu high-dimension lại thường ch...

Thành viên nổi bật
Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí