Image Cover
Avatar

Sun* AI Research Team

level partner

Silver Content Creator

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Pinned Posts

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
11.9K
53
22 8

All posts

Thumbnail Image
583
20
3 7
Avatar Nguyễn Văn Quân thg 12 15, 2022 8:39 SA
15 min read

[paper explain] Scaling Up Your Kernels to 31x31: Sự trở lại mạnh mẽ của CNN trên đường đua ImageNet

Lời mở đầu Kể từ khi transformer được áp dụng vào bài toán vision, chúng ta đã được chứng kiến sự nhảy vọt ngoạn mục của họ mô hình này khi liên tục những SoTA trên tập ImageNet được xô đổ bởi , ,... Trong khi đó, người anh em CNN lại có vẻ khá im ắng khi chưa có mô hình nào đạt được nghiên cứu mang tính nhảy vọt để có thể sánh vai với transformer. Thế nhưng năm 2022 này lại mở ra một bức tranh...

Thumbnail Image
1.7K
15
5 2
Avatar Pham Thi Hong Anh thg 12 14, 2022 3:04 SA
4 min read

Polars - thư viện xử lý dữ liệu DataFrame nhanh hơn cả Pandas!!!!

Hello mọi người, hẳn là mọi người vẫn hay dùng Pandas để xử lý dữ liệu dạng DataFrame đúng không nhỉ? Hôm nay mình sẽ giới thiệu một thư viện mới Polars - một thư viện xử lý dữ liệu dạng bảng biểu được base trên Rust, tốc độ xử lý của thư viện này nhanh hơn cả Pandas mà mọi người vẫn hay dùng. Bên cạnh đó thư viện này cũng dễ dùng và hữu ích không thua kém gì Pandas. Chúng ta cùng nhau tìm hiểu...

Thumbnail Image
1.1K
16
2 0
Avatar Nguyen Mai thg 12 13, 2022 4:03 SA
15 min read

[Paper Explain] TOOD: Thống nhất Classification và Localization cho Object Detection

Tại sao lại là TOOD?

  • Vì trong paper này có một phần mà các paper về Object Detection hiện nay áp dụng khá nhiều, tiêu biểu là YOLOv6 hay DAMO-YOLO mới ra gần đây.
  • Cách giải quyết vấn đề dễ hiểu, trực quan, kèm theo chứng minh về mặt hình ảnh rõ ràng
  • Author thân thiện :v

Task conflict, Task misalignment Trong Object Detection (OD), ta phải làm 2 nhiệm vụ: Xác định vật thể nằm ở đâu trong ...

Thumbnail Image
151
5
0 0
Avatar Trần Đức Trung thg 12 6, 2022 9:10 SA
11 min read

[Progressive Rollouts với Iter8]: A/B Testing là gì?

Đôi khi đưa ra một quyết định có thể quyết định việc thành bại của một giải pháp và chẳng ai muốn mình phải chịu trách nhiệm về một quyết định mang đến kết quả xấu, được đưa ra theo bản năng cả. Tất nhiên đó là một điều tốt và may mắn thay, có rất nhiều cách để lấy thông tin mà không cần phải dựa trên bản năng của một người. Một trong những phương pháp phổ biến nhất, và cũng thường được sử dụng...

Thumbnail Image
1.0K
9
2 0
Avatar Thao Hoang Thu thg 12 2, 2022 9:56 SA
3 min read

Chạy cronjob trong Docker container với Python

Trong quá trình phát triển, sẽ không thiếu những lúc mà chúng ta cần chạy định kỳ một vài script hoặc chạy một tác vụ nào đó vào thời gian nhất định. Những lúc như vậy thì Cron là một công cụ vô cùng hữu hiệu.

Cron cũng rất dễ sử dụng. Tuy nhiên khi đóng gói cronjob vào Docker thì mình đã gặp một vài khó khăn và phải thử qua mấy solution mới làm nó chạy được. Do vậy mình viết bài này để ghi ch...

Thumbnail Image
534
13
5 10
Avatar Nguyen Mai thg 11 23, 2022 7:57 SA
17 min read

[Paper Explain] Rep-Optimizer: Re-params Optimizer thay vì Re-params model của bạn

Một số khái niệm cần nắm được

  • Re-parameterize: Là kĩ thuật thay đổi parameters của một layers (kernel của một lớp Conv) theo dạng biểu diễn khác. Về chi tiết hơn một chút, các bạn có thể đọc ở đây
  • Convolution (Conv): Phép tích chập, là phép tính toán chủ đạo trong CNN. Với một input feature maps có chiều , nếu ta thực hiện conv với một filter với same padding thì sẽ tạo ra output feature m...
Thumbnail Image
438
9
1 0
Avatar Nguyen Toan Thinh thg 11 21, 2022 8:23 SA
24 min read

[Paper Explain]:Spatial Dual-Modality Graph Reasoning - Bài toán trích xuất thông tin với mô hình Graph

Giới thiệu chung Trích xuất thông tin chính từ tài liệu văn bản như CV, hóa đơn, biên lai, ... là điều tối quan trọng trong tự động hóa văn phòng. Thông thường các phương pháp tiếp cận đều chỉ tập trung vào một số template cố định nên không thể tổng quát hóa tốt cho các tài liệu mà không theo 1 định dạng cho trước. Khi gặp các template chưa từng xuất hiện thì kết quả trích xuất sẽ rất tệ. Trong...

Thumbnail Image
1.8K
12
1 1
Avatar Phạm Văn Toàn thg 11 17, 2022 2:46 SA
12 min read

Mờ Lờ Óp #3 - Hiện tượng Concept Drift và Data Drift

Mở đầu

Nghĩ đi anh... đâu ai chung tình được mãi - đó là lời của một bài hát rất nổi tiếng gần đây. Trong tình yêu thì là vậy còn trong Machine Learning cũng có một hiện tượng như thế, mình tạm gọi là làm gì có mô hình nào tốt được mãi ngay cả khi chất lượng dữ liệu có tốt thì việc mô hình bị giảm chất lượng theo thời gian cũng thường xuyên diễn ra. Điều này có ý nghĩa và ảnh hưởng gì đến việc...

Thumbnail Image
1.0K
11
5 0
Avatar Phạm Văn Toàn thg 11 17, 2022 2:46 SA
10 min read

Mờ Lờ Óp #2 - Quá trình Deployment

Mở bài

Như chúng ta đã biết Deploy là một bước không thể thiếu trong quá trình Đưa mô hình AI đến tay người dùng. Trong bài trước chúng ta đã tìm hiểu đến bước deployment với ví dụ của hệ thống Speech Recognition và trong bài này chúng ta sẽ đi chi tiết hơn vào nó nhé. OK bắt đầu thôi

Các vấn đề chính trong Deployment

Thường sẽ phải đối mặt với hai thử thách lớn đó là ML & statistical issue...

Thumbnail Image
2.1K
24
3 0
Avatar Phạm Văn Toàn thg 11 17, 2022 2:45 SA
7 min read

Mờ Lờ Óp #1 - Tổng quan về Mờ Lờ Óp

Mở đầu Trong Kinh Thánh có một câu nói nổi tiếng rằng Đức tin mà không có việc làm là một ĐỨC TIN CHẾT. Cũng như vậy, trong lĩnh vực AI cũng có một câu nói như thế rằng MÔ HÌNH AI mà chỉ nằm trên Jupyter Notebook là một MÔ HÌNH CHẾT. Bạn có thấy câu nói này nổi tiếng không, chắc là chưa phải không (vì mình với mới nghĩ ra mà 😀😀😀. Dù chưa được nổi tiếng lắm nhưng điều mình muốn nhấn mạnh rằng dù...

Thumbnail Image
2.4K
18
3 1
Avatar Trần Đức Trung thg 10 14, 2022 10:22 SA
16 min read

Cấu hình cụm Kubernetes để sử dụng Nvidia GPU

Là một nền tảng mã nguồn mở để tự động hóa việc triển khai, scaling và quản lý các ứng dụng đã được container hóa, Kubernetes thường được lựa chọn để triển khai các web service nói chung và trong đó bao gồm cả các ứng dụng có sử dụng các mô hình ML. Trên cơ sở đó, trong bài viết này, chúng ta sẽ cùng tìm hiểu về cách các thành phần của Kubernetes tương tác với Nvidia GPU cũng như thực hành với ...

Thumbnail Image
3.8K
31
10 0
Avatar Nguyen Mai thg 10 14, 2022 10:11 SA
16 min read

Một chút về cơ chế Attention trong Computer Vision

Mở đầu Cơ chế Attention (Attention mechanism) là một cơ chế vô cùng hay và nhận được rất nhiều sự phát triển gần đây. Có những model được tạo thành lấy trọng tâm từ cơ chế này như: Transformer trong Attention is All You Need; VAN trong Visual Attention Network; ViT trong Vision Transformer;...

Trong bài viết này, mình sẽ giải thích nhanh về cơ chế Attention hay được sử dụng trong Computer Visi...

Thumbnail Image
4.4K
20
4 7
Avatar Nguyen Mai thg 10 10, 2022 1:09 CH
17 min read

[Paper Explain] YOLOv7: Sử dụng các "trainable bag-of-freebies" đưa YOLO lên một tầm cao mới (phần 3)

Mở đầu Trong phần 1 của series giới thiệu YOLOv7, mình đã nói qua về các khái niệm, kĩ thuật sẽ xuất hiện trong YOLOv7, các bạn có thể đọc lại ở đây: https://viblo.asia/p/paper-explain-yolov7-su-dung-cac-trainable-bag-of-freebies-dua-yolo-len-mot-tam-cao-moi-phan-1-zXRJ8BGOVGq Và phần 2 của series này mình đã tập trung nói về Label Assignment (LA), một vấn đề khá là khó nhưng lại cần thiết cho ...

Thumbnail Image
676
14
1 0
Avatar Nguyễn Văn Quân thg 10 10, 2022 3:06 SA
7 min read

Thiết kế mạng Quantum Neural Network với Pytorch và Qiskit

Mở đầu Ở các phần trước, mình đã giới thiệu qua về lý thyết cơ bản để xây dựng một mạng nơ-ron lượng tử đồng thời kết hợp code ví dụ với thư viện Paddle Quantum. Tiếp tục với chuỗi bài về mạng nơ-ron lượng tử, ở phần này mình sẽ giới thiệu tới các bạn cách xây dựng QNN với một thư viện khá quen thuộc trong lĩnh vực Deep Learning đó là Pytorch, kết hợp với framework Qiskit được cung cấp bởi IBM...

Thumbnail Image
910
15
4 3
Avatar Nguyen Tung Thanh thg 9 30, 2022 4:52 CH
10 min read

SAM: Giải thuật tối ưu đang dần được ứng dụng rộng rãi

Cập nhật

[+ chạy SAM trên Pytorch Lightning]

Lời nói đầu

Trong quá trình training, chúng ta thường chỉ quan tâm đến giá trị training loss mà không quan tâm đến độ dốc (sharpness) của hình dạng đồ thị(landscape) loss quanh điểm đó. Mối quan hệ giữa hình dạng của đồ thị loss và tính tổng quát hoá (generalization) của mô hình đã được nghiên cứu trong các nghiên cứu trước. Một nghiên cứu thực ng...

Thumbnail Image
1.5K
10
3 0
Avatar Tung thg 9 29, 2022 3:32 SA
14 min read

[Paper Explain] RAFT: Recurrent All-Pairs Field Transforms - Mô hình Deep Learning cho bài toán Optical Flow

Bài toán ước lượng Optical Flow là một trong những bài toán quan trọng trong Computer Vision. Nhiệm vụ của bài toán là ước lượng vector 2 chiều mô tả chuyển động đối ứng với từng pixel trong ảnh. Bài viết này sẽ giới thiệu một mô hình Deep Learning cho bài toán ước lượng Optical Flow, mô hình có tên gọi RAFT: Recurrent All-Pairs Field Transforms, ra mắt năm 2020 và nhận giải thưởng ECCV 2020 Be...

Thumbnail Image
1.2K
16
3 0
Avatar Đặng Hồng Thanh thg 9 27, 2022 1:46 SA
4 min read

DINO: SOTA của Object Detection có gì hay ho

  1. Lời mở đầu Trong 2 bài review lần trước mình đã giới thiệu về DETR và Deformable DETR. Các tác giả tiếp theo đã đưa ra những cải tiến tích cực cho DETR như: DAB-DETR cải tiến bằng việc đưa ra kiểu query mới học trực tiếp anchor bằng query , hay như DN-DETR cải tiến bằng việc thêm noise để tăng tốc độ huấn luyện mô hình,... DINO đã kế thừa và cải tiến được những kĩ thuật này để cải tiến hiệu...
Thumbnail Image
1.4K
16
1 0
Avatar Nguyễn Văn Quân thg 9 19, 2022 8:14 SA
12 min read

[paper explain] RCNet: Kiến trúc FPN đỉnh cao cho object detection ?

Giới thiệu chung Kiến trúc FPN ( feature pyramid network) từ lâu đã được sử dụng trong object detection cho nhiệm vụ tăng cường thông tin của một mức scale bằng cách fusion đặc trưng từ scale trước đó. Sau FPN cũng đã có khá nhiều biến thể của nó được sinh ra, và tất cả chúng đều cho thấy sự cải thiện về hiệu quả một cách đáng kinh ngạc. Một số mô hình khá nổi tiếng có thể kể đến như : Nas-FPN...

Thumbnail Image
608
11
1 1
Avatar Thao Hoang Thu thg 9 18, 2022 3:21 CH
8 min read

Một số công cụ tách câu cho văn bản tiếng Nhật - Japanese sentence boundary disambiguation

  1. Vấn đề tách câu trong bài toán NLP tiếng Nhật

Bên cạnh các bước tiền xử lý văn bản như part-of-speech tagging, tokenization, stemming & lemmatization, vv., tách câu cũng là một bước quan trọng, nhất là đối với với các task NLP coi các câu là đơn vị xử lý (information retrieval, semantic search, vv.)

Tách câu, hay còn gọi là sentence boundary disambiguation, sentence segmentation, sentenciz...

Thumbnail Image
1.1K
15
5 0
Avatar Pham Thi Hong Anh thg 9 14, 2022 4:17 SA
6 min read

Model-Centric và Data-Centric là gì vậy?

Xin chào mọi người hôm nay mình sẽ viết 1 bài chủ đề hơi khác một chút xíu so với mọi ngày. Model centric và Data centric là gì và nó khác nhau như thế nào? Như mọi người cũng biết Data và model đều là nền tảng quan trọng trong hệ thống AI. Cả hai thành phần này đều đóng một vai trò quan trọng trong việc phát triển một mô hình mạnh mẽ nhưng bạn nên tập trung vào thành phần nào hơn? Trong bài ...

Featured member
Viblo
Let's register a Viblo Account to get more interesting posts.