Image Cover
Avatar

Sun* AI Research Team

level partner

Nhà sáng tạo nội dung hạng Bạc

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Bài viết được ghim

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
14.1K
57
28 8

Tất cả bài viết

Thumbnail Image
314
8
0 1
Avatar Trần Đức Trung thg 1 20, 2022 6:28 CH
23 phút đọc

[Paper Explain] Reading Race: AI Recognises Patient's Racial Identity In Medical Images

Trong bài báo Reading Race: AI Recognises Patient's Racial Identity In Medical Images nhóm tác gả đã chỉ ra rằng các mô hình AI có thể học cách phát hiện chủng tộc của ai đó từ nhiều phương thức xử lý hình ảnh khác nhau (bao gồm cả chụp X-quang ngực trắng và đen) và điều này thật kỳ lạ, bởi vì ngay cả những bác sĩ chuyên môn cũng không thể làm được điều này. Để tìm hiểu về điều đó, nhóm tác giả...

Thumbnail Image
1.1K
6
0 0
Avatar Nguyen Tung Thanh thg 1 20, 2022 11:48 SA
11 phút đọc

[Paper Explain] Communication-Efficient Learning of Deep Networks from Decentralized Data

[IMG]

Đặt vấn đề Trong thời đại smartphone, laptop, tablet (trong tương lai là cả các thiết bị IoT) đã quá phổ biến như hiện nay. Lượng dữ liệu sản sinh từ các thiết bị này hàng ngày là vô cùng lớn. Với các kỹ sư AI luôn "đói" dữ liệu thì đây quả là nguồn tài nguyên khao khát được khai thác. Tuy nhiên, chủ nhân của những thiết bị này không dễ dàng trao đi dữ liệu (và cả tài nguyên tính toán, năng lư...

Thumbnail Image
1.0K
6
0 0
Avatar Quang thg 1 19, 2022 6:13 SA
12 phút đọc

Giới thiệu về mô hình neural ODE

Ở bài trước, chúng ta đã tìm hiểu về một mô hình thời gian liên tục sử dụng SDE. Nếu chúng ta bỏ đi hệ số diffusion, phương trình này sẽ trở thành phương trình vi phân toàn phần theo thời gian . Lúc này, việc thay đổi trạng thái sẽ trở nên tất định, do đó chúng ta có thể mô hình sự thay đổi của xác suất trạng thái theo thời gian, từ đó có thể mô hình một phiên bản tương tự của normalizing flow ...

Thumbnail Image
1.6K
10
3 3
Avatar Trung Đức thg 1 17, 2022 9:05 SA
6 phút đọc

Đôi dòng về Pseudo Labeling trong Machine Learning

Giới thiệu Nhân một ngày đang hì hục với cái đồ án môn học mà chưa biết xử lý thế nào khi muốn cải tiến kết quả với dataset nhỏ, lại được ngồi nghe Seminar của anh Leader, mình có cảm hứng để viết bài viết này chia sẻ kiến thức cho chính bản thân cũng như mọi người về việc sử dụng pseudo labeling trong các bài toán Machine Learning.

Có thể nói việc sử dụng Pseudo Label có vai trò rất to lớn tr...

Thumbnail Image
6.2K
21
2 3
Avatar Bui Quang Manh thg 1 7, 2022 12:46 SA
7 phút đọc

Tản mạn về Graph Convolution Networks (Phần 1)

Lấy cảm hứng từ bài viết [Deep Learning] Graph Neural Network - A literature review and applications của tác giả @PhanHoang, nhân dịp đầu xuân năm mới mình dự định bắt đầu một chuỗi bài viết về chủ đề Grap Convolution Networks (GCN). Khởi đầu chuỗi bài viết này, chúng ta sẽ tìm hiểu về mô hình GCN qua bài nghiên cứu [SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS](https://arx...

Thumbnail Image
2.4K
16
3 2
Avatar Bui Quang Manh thg 12 19, 2021 3:12 SA
10 phút đọc

Quantization với Pytorch (Phần 2)

  1. Giải thuật quantization (Tiếp theo) Tiếp tục phần giới thiệu giải thiệu quantization với pytorch, ta đến thuật toán đạt hiệu quả cao nhất trong ba phương pháp mà mình có đề cập trong bài Quantization với Pytorch (Phần 1): Quantize Aware Training.

3.3. Quantize Aware Training (QAT)

3.1. QAT hoạt động như thế nào ? QAT mô hình hóa những ảnh hưởng của quantization trong suốt quá trình huấn lu...

Thumbnail Image
7.9K
9
4 2
Avatar Trung Đức thg 12 17, 2021 4:50 SA
10 phút đọc

Tìm hiểu về Autoencoder

Giới thiệu Làm về xử lý ảnh, chắc hẳn các bạn sẽ bắt gặp 1 số bài toán như tái tạo ảnh, giảm nhiễu ảnh, làm sáng ảnh, hay bài toàn giảm chiều dữ liệu, … Gặp các bài toán này thì cũng có khá nhiều phương pháp để xử lý, với cá nhân mình thì mình nghỉ ngày tới kỹ thuật Autoencoder. Lướt một vòng google search thì mình chỉ tìm thấy các bài viết nước ngoài hoặc 1 số blog của các anh Việt Nam, còn Vi...

Thumbnail Image
2.8K
26
5 0
Avatar Quang thg 12 11, 2021 4:57 SA
27 phút đọc

Sinh dữ liệu với mô hình diffusion và mô hình dạng SDE tổng quát

Trong bài viết này, mình sẽ giới thiệu về mô hình diffusion, một mô hình sinh với sự đột phá gần đây, cùng với mô hình score matching đã vượt qua GAN trong việc sinh dữ liệu. Hai mô hình này có thể xem như trường hợp đặc biệt của phương trình vi phân ngẫu nhiên, và được tổng quát thành mô hình dạng phương trình vi phân ngẫu nhiên (Stochastic differential equation - SDE), đưa ra một góc nhìn mới...

Thumbnail Image
3.9K
18
5 3
Avatar Bui Quang Manh thg 12 9, 2021 12:08 CH
8 phút đọc

Quantization với Pytorch (Phần 1)

I. Quantization là gì ?

<img src="https://developer-blogs.nvidia.com/wp-content/uploads/2021/07/qat-training-precision.png" >

Ảnh minh họa (Nguồn Internet)

Quantization là phương pháp hữu hiệu giúp tăng tốc thời gian xử lý của các mô hình học sâu mà đảm bảo độ chính xác không giảm đi đáng kể bằng cách tính toán và lưu trữ tensor ở kiểu dữ liệu có số bit thấp hơn kiểu dữ liệu float.

Như ...

Thumbnail Image
716
5
1 1
Avatar Trung Đức thg 12 8, 2021 4:37 SA
7 phút đọc

[Paper Explain] Boosting masked Face recognition with Multi-task ArcFace

Source paper: https://arxiv.org/pdf/2104.09874.pdf

Giới thiệu Tiếp nối về bài viết [Paper Explain] EFFICIENT MASKED FACE RECOGNITION METHOD DURING THECOVID-19 PANDEMIC, hôm nay mình sẽ gửi tới các bạn 1 bài Paper Explain khác cũng cùng chủ đề là Masked face recognition.

Ý tưởng chính của paper này là dựa trên hoạt động của ArcFace, với một số chỉnh sửa trong backbone và loss function. Từ tập ...

Thumbnail Image
865
14
2 0
Avatar Do Dang Hung thg 11 27, 2021 1:06 SA
13 phút đọc

Imbalance Problem in Object Detection

  1. Giới thiệu Trong lĩnh vực thị giác máy tính bài toán về nhận diện vật thể - Object Detection đóng vai trò quan trọng vì nó mang lại nhiều ứng dụng to lớn. Nhiều năm trở lại đây, các mạng học sâu đã liên tục ra đời cho bài toán này. Như chúng ta đã biết thì trong các bài toán ML, DL nói chung imbalance problem có ảnh hưởng xấu đến chất lượng mô hình như thế này. Vì thế các vấn đề về sự mất câ...
Thumbnail Image
735
8
0 2
Avatar Quang thg 11 25, 2021 7:41 SA
9 phút đọc

Sinh dữ liệu với mô hình dựa trên score

Chúng ta đã tìm hiểu về cách huấn luyện mô hình score và cách lấy mẫu với Langevin dynamics. Tuy nhiên cách làm trực tiếp đó chưa đủ để sinh ra dữ liệu tốt. Trong bài này chúng ta sẽ tìm hiểu về cách để xây dựng một mô hình score mạnh. Ước lượng score của biến ngẫu nhiên ẩn Thay vì ước lượng trực tiếp score của dữ liệu ban đầu, ta có thể áp dụng score matching cho biến ẩn của mô hình sinh. Ví ...

Thumbnail Image
3.6K
19
7 2
Avatar Bui Quang Manh thg 11 21, 2021 3:22 CH
7 phút đọc

Vision Transformer - An Image is Worth 16×16 Words: Transformers for Image Recognition at Scale

I. Giới thiệu

Nghiên cứu và ứng dụng mô hình Transformer trong bài toán xử lý ngôn ngữ (natural language processing) đã trở nên vô cùng phổ biến. Tuy nhiên trong thị giác máy tính thì ứng dụng và nghiên cứu mô hình Transformer còn hạn chế. Khi gặp những bài toán thị giác máy tính như object detection, object segmentation, ... kiến trúc tích chập vẫn là kiến trúc quen thuộc mà chúng ta thường s...

Thumbnail Image
2.9K
22
11 0
Avatar Trung Đức thg 11 19, 2021 3:55 SA
9 phút đọc

Knowledge Distillation – Chắt lọc tri thức từ những mô hình thành công

Giới thiệu Khi nhắc tới việc cải thiện hiệu suất của các tác vụ học máy, chắc hẳn các bạn sẽ nghĩ tới 1 cách đơn giản nhất chính là đào tạo nhiều mô hình trên cùng 1 tập dữ liệu, sau đó tính trung bình dự đoán của chúng hoặc chọn ra mô hình có độ chính xác tốt nhất (thông thường là lấy trung bình dự đoán). Tuy nhiên cách này tức là mình sẽ sử dụng toàn bộ các mô hình, chưa nói đến việc các mô h...

Thumbnail Image
462
9
2 0
Avatar Nguyen Tung Thanh thg 11 14, 2021 12:55 SA
13 phút đọc

[Paper Explain] Lottery Ticket Hypothesis

Sau khi phát triển được một mô hình (model) đạt được độ chính xác theo yêu cầu. Việc tiếp theo có lẽ chúng ta sẽ phải làm trước khi triển khai mô hình là tối ưu về tốc độ(speed), bộ nhớ(memory footprint) và năng lượng(energy). Những cách phổ biến có thể nghĩ đến là lượng tử hóa(quantization), chưng cất hiểu biết(knowledge distillation) và cắt tỉa trọng số(weight pruning). Trong bài này, chúng t...

Thumbnail Image
771
16
2 5
Avatar Trung Đức thg 11 5, 2021 3:13 SA
12 phút đọc

[Paper Explain] EFFICIENT MASKED FACE RECOGNITION METHOD DURING THECOVID-19 PANDEMIC

Source paper: https://arxiv.org/pdf/2105.03026.pdf

Giới thiệu Trong thời kì địa dịch Covid-19 bùng nổ trên khắp toàn cầu, có thể nói khẩu trang là một vật dụng vô cùng thiết yếu. Với lĩnh vực Computer Vision thì một bài toán mới được sinh ra: làm thể nào để nhận diện khuôn mặt khi khuôn mặt đó đeo khẩu trang (khi mà một nửa khuôn mặt đã bị che khuất). Mình đã tìm kiếm khá nhiều tuy nhiên đây l...

Thumbnail Image
6.7K
42
15 4
Avatar Nguyen Thanh Huyen thg 11 2, 2021 1:36 SA
27 phút đọc

Tổng quan về Face Anti-Spoofing - Bài toán chống giả mạo khuôn mặt

Mình hi vọng bài viết này có thể cung cấp một cái nhìn toàn cảnh về bài toán Face Anti-spoofing.

Các phần mình sẽ giới thiệu lần lượt là:

  • Giới thiệu tổng quan
  • Các cách tấn công giả mạo - Attack methods
  • Các phương pháp chống giả mạo - Anti-spoofing methods
  • Cách đánh giá mô hình - Evaluate metrics
  • Bốn loại giao thức đánh giá - Evaluation Protocols
  • Tổng quan về Deep Learning based me...
Thumbnail Image
1.0K
14
2 3
Avatar Hieu Bui thg 10 24, 2021 2:41 CH
6 phút đọc

Phát hiện và xóa con dấu trong ảnh tài liệu bằng thư viện Stamp Processing

Introduction Trong thời gian gần đây, chúng ta thường nghe đến các như khái niệm chuyển đổi số hay một bài toán con cuả nó là số hóa tài liệu được nhắc đến rất nhiều trên các phương tiện truyền thông đại chúng. Số hóa tài liệu là quá trình chuyển đổi từ các dạng văn bản, tài liệu vật lý như chữ viết tay, giấy in.. thành những dữ liệu số mà máy tính có thể lưu trữ, đọc hiểu được. Số hóa tà...

Thumbnail Image
1.9K
24
5 11
Avatar Bui Quang Manh thg 10 21, 2021 3:01 SA
16 phút đọc

Thư viện Table Reconstruction và bài toán tái cấu trúc bảng

I. Lời mở đầu Nhận dạng cấu trúc bảng là một vấn đề tương đối phức tạp trong bài toán xử lý và phân tích cấu trúc của một văn bản. Dữ liệu bảng được sử dụng rộng rãi trong các loại văn bản và chứa rất nhiều thông tin. Chúng ta có thể nhìn thấy dữ liệu dạng bảng trong nhiều lĩnh vực, trong nhiều cơ quan hành chính chính phủ hay các công ty như ngân hàng,... Họ đều phải xử lý hàng triệu dữ liệu b...

Thumbnail Image
8.8K
21
8 1
Avatar Quang Trần thg 10 12, 2021 4:51 CH
15 phút đọc

MediaPipe: Live ML Solutions và ứng dụng vẽ bằng Hands Gestures

AI (Trí tuệ nhân tạo) đang dần "xâm chiếm" hầu như tất cả các lĩnh vực trong cuộc sống. Với tính chất tự động hóa cao, có thể thực hiện các công việc khó và có độ chính xác ngày càng được cải thiện, AI đang dần trở thành một công cụ khó có thể thay thế được. Tuy nhiên, các mô hình AI hiện tại được đánh giá là "nặng, yêu cầu phần cứng cao" khiến cho việc áp dụng vào trong các dự án thực tế trở n...

Thành viên nổi bật
Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí