Sun* AI Research Team

Nhà sáng tạo nội dung hạng Bạc

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Bài viết được ghim

Phạm Văn Toàn

thg 5 7, 2023 6:13 SA 27 phút đọc

Langchain #1 - Điểm qua các chức năng sừng sỏ nhất của Langchain - một framework cực bá đạo khi làm việc với LLM

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator

11.4K

Thao Hoang Thu

Bạn đã biết gì về prompt engineering? - Tổng hợp các tips tạo lời nhắc cho ChatGPT

Mayfest2023 ContentCreator ChatGPT Generative AI

5.7K

Nguyen Mai

[Paper Explain] YOLOv7: Sử dụng các "trainable bag-of-freebies" đưa YOLO lên một tầm cao mới (phần 3)

ContentCreator Object detection Yolo

4.3K

Trần Đức Trung

[Paper Explain] Reading Race: AI Recognises Patient's Racial Identity In Medical Images

ContentCreator Race Detection Medical imaging

305

Phan Huy Hoang

[Deep Learning] Graph Neural Network - A literature review and applications

Machine Learning Deep Learning Graph Neural Network Graph Representation Learning Graph Convolution Network

31.5K

187

Nguyen Mai

[Vinh danh Paper] QLoRA: Quantize để training mô hình hàng tỷ tham số trên Google Colab

ContentCreator Deep Learning LLM PEFT

3.1K

Tất cả bài viết

1.0K

Thao Hoang Thu thg 12 2, 2022 9:56 SA

3 phút đọc

Chạy cronjob trong Docker container với Python

Trong quá trình phát triển, sẽ không thiếu những lúc mà chúng ta cần chạy định kỳ một vài script hoặc chạy một tác vụ nào đó vào thời gian nhất định. Những lúc như vậy thì Cron là một công cụ vô cùng hữu hiệu.

Cron cũng rất dễ sử dụng. Tuy nhiên khi đóng gói cronjob vào Docker thì mình đã gặp một vài khó khăn và phải thử qua mấy solution mới làm nó chạy được. Do vậy mình viết bài này để ghi ch...

ContentCreator CronJob Docker Python

529

Nguyen Mai thg 11 23, 2022 7:57 SA

17 phút đọc

[Paper Explain] Rep-Optimizer: Re-params Optimizer thay vì Re-params model của bạn

Một số khái niệm cần nắm được

Re-parameterize: Là kĩ thuật thay đổi parameters của một layers (kernel của một lớp Conv) theo dạng biểu diễn khác. Về chi tiết hơn một chút, các bạn có thể đọc ở đây
Convolution (Conv): Phép tích chập, là phép tính toán chủ đạo trong CNN. Với một input feature maps có chiều , nếu ta thực hiện conv với một filter với same padding thì sẽ tạo ra output feature m...

ContentCreator Computer Vision

432

Nguyen Toan Thinh thg 11 21, 2022 8:23 SA

24 phút đọc

[Paper Explain]:Spatial Dual-Modality Graph Reasoning - Bài toán trích xuất thông tin với mô hình Graph

Giới thiệu chung Trích xuất thông tin chính từ tài liệu văn bản như CV, hóa đơn, biên lai, ... là điều tối quan trọng trong tự động hóa văn phòng. Thông thường các phương pháp tiếp cận đều chỉ tập trung vào một số template cố định nên không thể tổng quát hóa tốt cho các tài liệu mà không theo 1 định dạng cho trước. Khi gặp các template chưa từng xuất hiện thì kết quả trích xuất sẽ rất tệ. Trong...

ContentCreator graph Deep Learning

1.7K

Phạm Văn Toàn thg 11 17, 2022 2:46 SA

12 phút đọc

Mờ Lờ Óp #3 - Hiện tượng Concept Drift và Data Drift

Mở đầu

Nghĩ đi anh... đâu ai chung tình được mãi - đó là lời của một bài hát rất nổi tiếng gần đây. Trong tình yêu thì là vậy còn trong Machine Learning cũng có một hiện tượng như thế, mình tạm gọi là làm gì có mô hình nào tốt được mãi ngay cả khi chất lượng dữ liệu có tốt thì việc mô hình bị giảm chất lượng theo thời gian cũng thường xuyên diễn ra. Điều này có ý nghĩa và ảnh hưởng gì đến việc...

ContentCreator mlops

993

Phạm Văn Toàn thg 11 17, 2022 2:46 SA

10 phút đọc

Mờ Lờ Óp #2 - Quá trình Deployment

Mở bài

Như chúng ta đã biết Deploy là một bước không thể thiếu trong quá trình Đưa mô hình AI đến tay người dùng. Trong bài trước chúng ta đã tìm hiểu đến bước deployment với ví dụ của hệ thống Speech Recognition và trong bài này chúng ta sẽ đi chi tiết hơn vào nó nhé. OK bắt đầu thôi

Các vấn đề chính trong Deployment

Thường sẽ phải đối mặt với hai thử thách lớn đó là ML & statistical issue...

ContentCreator mlops

2.0K

Phạm Văn Toàn thg 11 17, 2022 2:45 SA

7 phút đọc

Mờ Lờ Óp #1 - Tổng quan về Mờ Lờ Óp

Mở đầu Trong Kinh Thánh có một câu nói nổi tiếng rằng Đức tin mà không có việc làm là một ĐỨC TIN CHẾT. Cũng như vậy, trong lĩnh vực AI cũng có một câu nói như thế rằng MÔ HÌNH AI mà chỉ nằm trên Jupyter Notebook là một MÔ HÌNH CHẾT. Bạn có thấy câu nói này nổi tiếng không, chắc là chưa phải không (vì mình với mới nghĩ ra mà 😀😀😀. Dù chưa được nổi tiếng lắm nhưng điều mình muốn nhấn mạnh rằng dù...

ContentCreator mlops

2.3K

Trần Đức Trung thg 10 14, 2022 10:22 SA

16 phút đọc

Cấu hình cụm Kubernetes để sử dụng Nvidia GPU

Là một nền tảng mã nguồn mở để tự động hóa việc triển khai, scaling và quản lý các ứng dụng đã được container hóa, Kubernetes thường được lựa chọn để triển khai các web service nói chung và trong đó bao gồm cả các ứng dụng có sử dụng các mô hình ML. Trên cơ sở đó, trong bài viết này, chúng ta sẽ cùng tìm hiểu về cách các thành phần của Kubernetes tương tác với Nvidia GPU cũng như thực hành với ...

ContentCreator Kubernetes Nvidia GPU

3.6K

Nguyen Mai thg 10 14, 2022 10:11 SA

16 phút đọc

Một chút về cơ chế Attention trong Computer Vision

Mở đầu Cơ chế Attention (Attention mechanism) là một cơ chế vô cùng hay và nhận được rất nhiều sự phát triển gần đây. Có những model được tạo thành lấy trọng tâm từ cơ chế này như: Transformer trong Attention is All You Need; VAN trong Visual Attention Network; ViT trong Vision Transformer;...

Trong bài viết này, mình sẽ giải thích nhanh về cơ chế Attention hay được sử dụng trong Computer Visi...

ContentCreator attention Computer Vision

4.3K

Nguyen Mai thg 10 10, 2022 1:09 CH

17 phút đọc

[Paper Explain] YOLOv7: Sử dụng các "trainable bag-of-freebies" đưa YOLO lên một tầm cao mới (phần 3)

Mở đầu Trong phần 1 của series giới thiệu YOLOv7, mình đã nói qua về các khái niệm, kĩ thuật sẽ xuất hiện trong YOLOv7, các bạn có thể đọc lại ở đây: https://viblo.asia/p/paper-explain-yolov7-su-dung-cac-trainable-bag-of-freebies-dua-yolo-len-mot-tam-cao-moi-phan-1-zXRJ8BGOVGq Và phần 2 của series này mình đã tập trung nói về Label Assignment (LA), một vấn đề khá là khó nhưng lại cần thiết cho ...

ContentCreator Object detection Yolo

663

Nguyễn Văn Quân thg 10 10, 2022 3:06 SA

7 phút đọc

Thiết kế mạng Quantum Neural Network với Pytorch và Qiskit

Mở đầu Ở các phần trước, mình đã giới thiệu qua về lý thyết cơ bản để xây dựng một mạng nơ-ron lượng tử đồng thời kết hợp code ví dụ với thư viện Paddle Quantum. Tiếp tục với chuỗi bài về mạng nơ-ron lượng tử, ở phần này mình sẽ giới thiệu tới các bạn cách xây dựng QNN với một thư viện khá quen thuộc trong lĩnh vực Deep Learning đó là Pytorch, kết hợp với framework Qiskit được cung cấp bởi IBM...

ContentCreator Deep Learning @Quantum

900

Nguyen Tung Thanh thg 9 30, 2022 4:52 CH

10 phút đọc

SAM: Giải thuật tối ưu đang dần được ứng dụng rộng rãi

Cập nhật

[+ chạy SAM trên Pytorch Lightning]

Lời nói đầu

Trong quá trình training, chúng ta thường chỉ quan tâm đến giá trị training loss mà không quan tâm đến độ dốc (sharpness) của hình dạng đồ thị(landscape) loss quanh điểm đó. Mối quan hệ giữa hình dạng của đồ thị loss và tính tổng quát hoá (generalization) của mô hình đã được nghiên cứu trong các nghiên cứu trước. Một nghiên cứu thực ng...

ContentCreator Deep Learning

1.4K

Tung thg 9 29, 2022 3:32 SA

14 phút đọc

[Paper Explain] RAFT: Recurrent All-Pairs Field Transforms - Mô hình Deep Learning cho bài toán Optical Flow

Bài toán ước lượng Optical Flow là một trong những bài toán quan trọng trong Computer Vision. Nhiệm vụ của bài toán là ước lượng vector 2 chiều mô tả chuyển động đối ứng với từng pixel trong ảnh. Bài viết này sẽ giới thiệu một mô hình Deep Learning cho bài toán ước lượng Optical Flow, mô hình có tên gọi RAFT: Recurrent All-Pairs Field Transforms, ra mắt năm 2020 và nhận giải thưởng ECCV 2020 Be...

ContentCreator Deep Learing Computer Vision

1.2K

Đặng Hồng Thanh thg 9 27, 2022 1:46 SA

4 phút đọc

DINO: SOTA của Object Detection có gì hay ho

Lời mở đầu Trong 2 bài review lần trước mình đã giới thiệu về DETR và Deformable DETR. Các tác giả tiếp theo đã đưa ra những cải tiến tích cực cho DETR như: DAB-DETR cải tiến bằng việc đưa ra kiểu query mới học trực tiếp anchor bằng query , hay như DN-DETR cải tiến bằng việc thêm noise để tăng tốc độ huấn luyện mô hình,... DINO đã kế thừa và cải tiến được những kĩ thuật này để cải tiến hiệu...

ContentCreator Deep Learning Object detection Transformer

1.3K

Nguyễn Văn Quân thg 9 19, 2022 8:14 SA

12 phút đọc

[paper explain] RCNet: Kiến trúc FPN đỉnh cao cho object detection ?

Giới thiệu chung Kiến trúc FPN ( feature pyramid network) từ lâu đã được sử dụng trong object detection cho nhiệm vụ tăng cường thông tin của một mức scale bằng cách fusion đặc trưng từ scale trước đó. Sau FPN cũng đã có khá nhiều biến thể của nó được sinh ra, và tất cả chúng đều cho thấy sự cải thiện về hiệu quả một cách đáng kinh ngạc. Một số mô hình khá nổi tiếng có thể kể đến như : Nas-FPN...

ContentCreator Deep Learning Object detection

595

Thao Hoang Thu thg 9 18, 2022 3:21 CH

8 phút đọc

Một số công cụ tách câu cho văn bản tiếng Nhật - Japanese sentence boundary disambiguation

Vấn đề tách câu trong bài toán NLP tiếng Nhật

Bên cạnh các bước tiền xử lý văn bản như part-of-speech tagging, tokenization, stemming & lemmatization, vv., tách câu cũng là một bước quan trọng, nhất là đối với với các task NLP coi các câu là đơn vị xử lý (information retrieval, semantic search, vv.)

Tách câu, hay còn gọi là sentence boundary disambiguation, sentence segmentation, sentenciz...

ContentCreator NLP Japanese

1.1K

Pham Thi Hong Anh thg 9 14, 2022 4:17 SA

6 phút đọc

Model-Centric và Data-Centric là gì vậy?

Xin chào mọi người hôm nay mình sẽ viết 1 bài chủ đề hơi khác một chút xíu so với mọi ngày. Model centric và Data centric là gì và nó khác nhau như thế nào? Như mọi người cũng biết Data và model đều là nền tảng quan trọng trong hệ thống AI. Cả hai thành phần này đều đóng một vai trò quan trọng trong việc phát triển một mô hình mạnh mẽ nhưng bạn nên tập trung vào thành phần nào hơn? Trong bài ...

ContentCreator Deep Learning Machine Learning Data Centric Model Centric

2.1K

Pham Minh Hoang thg 9 12, 2022 7:42 SA

29 phút đọc

Tất tần tật về WanDB (P1)

Lời mở đầu

Thứ nhất, bài viết này tham khảo từ W&B documentation, có sửa đổi một chút: chắt lọc các thông tin, chức năng quan trọng của W&B mà người dùng cần
Thứ hai, bài viết này mới chỉ cover được 2/7 phần của W&B, nếu có gì thiếu sót xin mọi người bỏ qua cho. Trong thời gian tới tôi sẽ cập nhật các phần tiếp theo
Thứ ba, bài viết này khá dài, mọi người có thể tìm phần mình cảm th...

ContentCreator Machine Learning

4.7K

Nguyen Mai thg 9 7, 2022 4:17 CH

18 phút đọc

[Paper Explain] YOLOv7: Sử dụng các "trainable bag-of-freebies" đưa YOLO lên một tầm cao mới (phần 2)

Mở đầu Ở bài viết lần trước, mình đã trình bày sơ qua các kiến thức các bạn sẽ gặp phải trong YOLOv7, nếu muốn các bạn có thể đọc lại ở đây: https://viblo.asia/p/paper-explain-yolov7-su-dung-cac-trainable-bag-of-freebies-dua-yolo-len-mot-tam-cao-moi-phan-1-zXRJ8BGOVGq. Ở phần 1, mình có nhắc tới khái niệm Label Assignment và đã giải thích sơ qua. Tuy nhiên, đối với các model Object Detection th...

ContentCreator Object detection Yolo

1.1K

Pham Thi Hong Anh thg 8 31, 2022 7:39 SA

4 phút đọc

Pandas, Dask và Datatable - Package nào hiệu quả và hữu ích hơn?

Khi nhắc đến xử lý dữ liệu bảng thì đa số chúng ta sẽ lựa chọn Pandas để đọc và thao tác với dữ liệu, và mình cũng không ngoại lệ. Tuy nhiên, mình vừa đọc được một bài viết khá là hay để xem xem liệu rằng Pandas có phải là lựa chọn tốt nhất không? Ở bài viết này chúng ta sẽ cùng so sánh hiệu suất của các package: Pandas, Dask, Datatable.

Pandas Pandas là một thư viện của Python được mọi người ...

ContentCreator Datatable Pandas Dask

9.5K

Nguyen Mai thg 8 25, 2022 7:19 CH

13 phút đọc

[Paper Explain] YOLOv7: Sử dụng các "trainable bag-of-freebies" đưa YOLO lên một tầm cao mới (Phần 1)

Mở đầu Chắc hẳn mọi người đã không còn xa lạ gì với cái tên YOLO, làm mưa làm gió trong bài toán Object Detection với tốc độ cực nhanh mà vẫn có độ chính xác khá cao. Bộ đôi WongKinYiu và Alexey đã có khá nhiều đóng góp cho họ nhà YOLO với YOLOv4, Scaled-YOLOv4, YOLOR và đến gần đây là một bản cập nhật cực kì khủng khiếp: YOLOv7. Mình xin dịch nguyên cái tóm tắt cực kì trẻ trâu của YOLOv7 như ...

ContentCreator Object detection Yolo