Sun* AI Research Team

Nhà sáng tạo nội dung hạng Bạc

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Bài viết được ghim

Phạm Văn Toàn

thg 5 7, 2023 6:13 SA 27 phút đọc

Langchain #1 - Điểm qua các chức năng sừng sỏ nhất của Langchain - một framework cực bá đạo khi làm việc với LLM

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator

18.3K

Thao Hoang Thu

Bạn đã biết gì về prompt engineering? - Tổng hợp các tips tạo lời nhắc cho ChatGPT

Mayfest2023 ContentCreator ChatGPT Generative AI

8.3K

Nguyen Mai

[Paper Explain] YOLOv7: Sử dụng các "trainable bag-of-freebies" đưa YOLO lên một tầm cao mới (phần 3)

ContentCreator Object detection Yolo

5.1K

Trần Đức Trung

[Paper Explain] Reading Race: AI Recognises Patient's Racial Identity In Medical Images

ContentCreator Race Detection Medical imaging

322

Phan Huy Hoang

[Deep Learning] Graph Neural Network - A literature review and applications

Machine Learning Deep Learning Graph Neural Network Graph Representation Learning Graph Convolution Network

35.9K

195

Nguyen Mai

[Vinh danh Paper] QLoRA: Quantize để training mô hình hàng tỷ tham số trên Google Colab

ContentCreator Deep Learning LLM PEFT

6.1K

Tất cả bài viết

4.8K

Tiểu Hoàng Hạnh thg 8 25, 2022 3:51 SA

10 phút đọc

Keyword Extraction: Giải pháp nhanh cho chọn lọc thông tin

Tổng quan Hiện nay với sự phát triển của công nghệ, các nền tảng mảng xã hội, báo trí, truyền thông ...vv. Chúng ta liên tục được tiếp cận với nhiều nguồn thông tin khác nhau, do đó nhu cầu của con người trong việc chọn lọc và sử dụng thông tin cũng ngày càng cao. Các bài toán về gợi ý người dùng, tìm kiếm xu hướng (trending), chat bot ... đã và đang ngày càng được cải tiến và phát triển. Vậy t...

ContentCreator NLP

1.3K

Nguyễn Văn Quân thg 8 25, 2022 2:28 SA

13 phút đọc

[Paper Explain] Colonformer: mô hình SOTA thuần việt cho bài toán xử lý ảnh y tế

Giới thiệu chung Áp dụng học sâu vào lĩnh vực xử lý ảnh y tế từ trước tới nay luôn chiếm khá nhiều quan tâm của giới học giả nghiên cứu vì tính thách thức cũng như khả năng ứng dụng thực tế. Chính vì thế mà các mô hình ưu việt cứ cách một khoảng thời gian ngắn lại được đề xuất. Gần đây thầy cô trường đại học Bách Khoa Hà Nội kết hợp với các thầy cô khác đến từ đhqg Hồ Chí Minh và học viện nô...

ContentCreator Transformer Deep Learning

694

Trần Đức Trung thg 8 24, 2022 3:57 CH

25 phút đọc

GLiT: Neural Architecture Search for Global and Local Image Transformer

Mở đầu

Trong thời gian qua, các kiến trúc dựa trên Convolutional Neural Networks (CNN) đã và đang có những thành công đáng kể trong các tác vụ học sâu. Tiếp đó, được lấy cảm hứng từ thành công vượt trội của Transformer trong các tác vụ xử lý tự nhiên, một lượng lớn nghiên cứu được công bố trong thời gian qua đã và đang tập trung việc phát triển các kiến trúc hiệu quả hơn dựa trên Transformer m...

ContentCreator Deep Leanring Machine Learning Neural Architecture Search Transformer

2.7K

Pham Thi Hong Anh thg 8 21, 2022 3:12 CH

7 phút đọc

Attention trong Seq2seq Model

Xin chào các bạn, bài viết hôm nay mình sẽ chia sẻ về Attention trong Sequence 2 sequence model. Như các bạn cũng biết Attention là một state-of-the-art model và cũng đã được mọi người ứng dụng và thử nghiệm trong nhiều bài toán. Và chúng ta cùng theo dõi xem vì sao Attention lại góp phần vào sự thành công của nhiều model deep learning khác trong đó có Seq2Seq mà mình sẽ chia sẻ ở dưới đây.

At...

ContentCreator deeplearning

23.3K

Pham Minh Hoang thg 8 18, 2022 8:02 SA

16 phút đọc

Tất tần tật về Airflow (P1)

Lời mở đầu Chào các bạn,

Do dòng đời xô đẩy nên tôi lại viết tiếp đây. Chủ đề hôm này là Airflow, chi tiết sẽ có trong các mục phía dưới

Do lượng kiến thức về framework này khá lớn nên tôi sẽ cố gắng viết các phần nối tiếp nhau, bạn đọc chú ý.

Khái niệm về Airflow Airflow là một công cụ lập lịch trình cho luồng công việc của bạn cũng như hỗ trợ quản lý, theo dõi từng phần trong quy trình giú...

ContentCreator airflow

2.2K

Đặng Hồng Thanh thg 8 12, 2022 3:49 SA

7 phút đọc

[Paper Explain] Deformable DETR: Transformer kiểu mới cho bài toán Object Detection

Giới thiệu chung Trong bài viết lần trước mình đã giới thiệu về DETR một hướng tiếp cận mới cho bài toán Object Detection để hiểu một cách chọn vẹn Deformable DETR mình khuyến nghị mọi người nên đọc bài viết về DETR của mình trước https://viblo.asia/p/object-detection-with-transfromer-detr-eW65GpmjKDO. Mặc dù hướng tiếp cận khá hay nhưng DETR vẫn còn một số vấn đề như:

DETR có kết quả khá ...

ContentCreator Object detection Transformer Deep Learning

2.1K

Pham Minh Hoang thg 8 5, 2022 4:17 SA

19 phút đọc

Trải nghiệm mệt mỏi khi thử training mô hình trên nhiều node (multi-node training)

Lời mở đầu Chào các bạn, lâu rồi không viết bài trên Viblo nên hôm nay tôi tâm sự chút trải nghiệm của mình khi huấn luyện mô hình trên nhiều máy tính (multi-node training).

Chả là, đồng nghiệp tôi toàn kháo nhau về huấn luyện mô hình trên một máy có nhiều gpu (distributed training on single node) ... ờ thì lúc đầu tôi chẳng thấy hứng thú gì cho lắm, cho đến khi dính phải một cái dự án cần tra...

ContentCreator Machine Learning

3.2K

Đặng Hồng Thanh thg 8 4, 2022 2:19 SA

6 phút đọc

[Paper Explain] Object Detection with Transfromer: DETR

Sơ bộ về Self-Attention và Transformer 1.1 Self Attention

Trong ví dụ trên, đầu vào bao gồm hai câu: "the rabbit quickly hopped" và "the turtile slowly crawled". [SEP] là token đặc biệt ngăn cách giữa các câu, [CLS] là token được thêm vào đầu câu sử dụng cho classification tasks. Hình ảnh biểu diễn cho mỗi từ ở bên trái với những từ ở bên phải sẽ có trọng số nhất định. Độ đậm của màu thể hi...

ContentCreator Object detection Transformer

2.6K

Trần Quang Vinh thg 7 29, 2022 4:46 SA

8 phút đọc

[Paper Explained] Dùng mạng GAN để upscale ảnh trông chân thực hơn

Giới thiệu Mặc dù việc upscale ảnh bằng mạng CNN đã đạt được nhiều tiến bộ đáng kể về độ chính xác và thời gian chạy, ta vẫn còn một vấn đề lớn vẫn chưa được giải quyết: làm sao để khôi phục được các chi tiết trên bề mặt các object, nhất là khi hệ số upscale lớn (3x, 4x,...)? Bài báo "Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network" sẽ giải quyết vấn đề này ...

ContentCreator Generative Adversarial Network Super Resolution

4.2K

Bui Quang Manh thg 7 29, 2022 4:30 SA

11 phút đọc

SVTR NET - Lời giải hoàn hảo cho bài toán OCR ?

I. Tổng quan

<img src="https://images.viblo.asia/f42e0229-a318-4346-8f4f-d6b0ba476f02.png" >
   Ứng dụng bài toán Text Recognition (ảnh mạng)

Bài toán nhận dạng chữ đến nay đã thu hút rất nhiều học giả nghiên cứu vì tính thách thức cũng như khả năng ứng dụng thực tế của bài toán này. Bài toán này có nhiệm vụ chuyển vùng chữ được xác định bởi mô hình phát hiện chữ ở dạng ảnh về dạng c...

ContentCreator Text Recognition SVTR Japanese OCR Nhận dạng chữ

793

Trần Đức Trung thg 7 28, 2022 7:08 SA

17 phút đọc

Xây dựng workflow với Flyte

Trái ngược với việc Machine Learning đã và đang có vô vàn ứng dụng trong thực tế trong hơn vài thập kỷ qua, công cụ hỗ trợ các nhà nghiên cứu và kỹ sư trong lĩnh vực này vẫn đang phát triển. Vậy nên khi các mô hình trở nên phức tạp và các nguồn dữ liệu trở nên đa dạng, cơ sở hạ tầng, đặc biệt là các cơ sở hạ tầng cấp thấp như Kubernetes, mạng, trình điều khiển GPU, quản lý tài nguyên, v.v sẽ tr...

ContentCreator Flyte DAG Python Machine Learning Workflow and Pipeline Orchestration Tools

946

Tiểu Hoàng Hạnh thg 7 25, 2022 6:00 SA

7 phút đọc

[Paper Explain] Ứng dụng Semi-Supervised cho bài toán về Semantic Segmentation

Giới thiệu Trong những năm trở lại đây semi-supervised learning đã và đang trở thành chủ đề được ứng dụng và nghiên cứu trong nhiều lĩnh vực khác nhau(xử lý hình ảnh, xử lý ngôn ngữ, tiếng nói ..vv). Trong đó việc ứng dụng semi-supervised learning để cải thiện hiệu quả cho các bài toán về segmentation đang được xem là một trong số những xu hướng nghiên cứu những năm gần đây. Trong bài viết lần ...

ContentCreator segmentation SSL

3.0K

Bui Quang Manh thg 7 23, 2022 9:33 SA

11 phút đọc

Bài toán phát hiện chữ (Text Detection) và mô hình DB (Phần 2)

I. Giới thiệu Ở trong phần 1 của bài viết Bài toán phát hiện chữ (Text Detection) và mô hình DB (Phần 1) , tôi đã giới thiệu tổng quan các mô hình phát hiện chữ và mô hình phát hiện chữ DB. Trong bài viết hôm nay, tôi sẽ giới thiệu cho các bạn một phiên bản cải tiến của mô hình DB là DB++ được giới th...

ContentCreator mô hình phát hiện chữ Real-Time Scene Text Detection with Differentiable Binarization and Adaptive Scale Fusion text detection model db plus plus

4.7K

Bui Quang Manh thg 7 23, 2022 3:25 SA

11 phút đọc

Bài toán phát hiện chữ (Text Detection) và mô hình DB (Phần 1)

I. Tổng quan bài toán phát hiện chữ

<img src="https://images.viblo.asia/78e9f605-137f-4e93-88f2-9fe6807b9885.png" >

Ảnh 1: Minh họa ứng dụng phát hiện chữ trong thực tế

Bài toán phát hiện chữ trong ảnh là bài toán xác định vị trị vùng có chữ trong ảnh đã trở nên phổ biến cả về mặt ứng dụng và nghiên cứu vì khả năng ứng dụng của nó . Đến hiện tại, bài toán phát hiện chữ trong ảnh thường ...

ContentCreator db mô hình phát hiện chữ text detection model

2.1K

Nguyen Mai thg 7 12, 2022 6:50 CH

21 phút đọc

[Paper Explain] VoVNet - Backbone tiết kiệm điện năng cho Object Detection

Mở đầu Đây là một paper khá hay phân tích về việc làm thế nào để thiết kế một model thực sự là hiệu quả về mặt tốc độ, điện năng tiêu thụ và độ chính xác. Nó đạp đổ toàn bộ những mạng nơ-ron tự xưng là cực nhẹ và tốc độ cao ra đời trước đó như MobileNet, ShuffleNet,... bổ sung thêm những kiến thức cần thiết cho việc thiết kế một model nhẹ. Hơn nữa, mình thấy paper này có những cách đặt vấn đề v...

ContentCreator Object detection Paper Explain

3.7K

Nguyen Mai thg 7 5, 2022 3:48 CH

12 phút đọc

Explainable AI - Bạn có hiểu model của bạn không?

Giới thiệu Explainable AI Sự thành công của Deep Neural Network (DNN - mạng nơ-ron sâu) đã mang đến những bước tiến lớn trong các ứng dụng, nghiên cứu A.I (trí tuệ nhân tạo). Mặc dù vô cùng thành công, nhưng DNN hoạt động giống như một chiếc hộp đen, ta không biết tại sao mạng nơ-ron lại đưa ra một quyết định cụ thể. Do đó, khi một hệ thống A.I dự đoán sai, ta không hề biết tại sao hệ thống đó ...

ContentCreator Deep Learning Explainable AI

361

Trần Đức Trung thg 6 30, 2022 10:20 SA

42 phút đọc

[Paper Explain] Deep Learning on a Data Diet: Finding Important Examples Early in Training

Có thể nói rằng thành công gần đây của của các mô hình Deep Learning một phần được thúc đẩy bởi việc huấn luyện trên các bộ dữ liệu có kích cỡ ngày càng lớn. Tuy vậy, đôi khi hẳn ta sẽ tự hỏi kiểu như "Liệu bao nhiêu dữ liệu trong 10 triệu mẫu kia là không cần thiết?", "Liệu có những mẫu dữ liệu nào quan trọng cho việc tổng quát hóa không và ta tìm thấy chúng như thế nào? Bài viết này trình bày...

Data Pruning Machine Learning

16.2K

Nguyen Mai thg 6 24, 2022 4:27 SA

14 phút đọc

Tổng hợp kiến thức từ YOLOv1 đến YOLOv5 (Phần 3)

Mở đầu Đây là bài viết cuối cùng trong chuỗi series giải thích họ nhà YOLO, lần này tập trung vào YOLOv4 và YOLOv5. Bài viết này gồm rất nhiều những kiến trúc, ý tưởng mới nên có chỗ nào khó hiểu, mình highly recommend các bạn nên đọc paper về phần đấy để có thể nắm được rõ nhất. Phần này sẽ tóm tắt và phân tích ngắn gọn về những thay đổi trong kiến trúc (backbone + neck), các kĩ thuật xử lý da...

Object detection Yolo

2.1K

Nguyen Mai thg 6 19, 2022 11:28 SA

8 phút đọc

Tăng tốc thử nghiệm Object Detection với MMDetection

Giới thiệu MMDetection MMDetection là một thư viện chuyên phục vụ cho các bài toán liên quan đến Object Detection, được tạo ra bởi OpenMMLab, cha đẻ của rất nhiều thư viện khác như MMCV, MMSegmentation,... Lưu ý, nên xem bài viết này trong lúc mở sẵn github của MMDetection hoặc một IDE có MMDetection để có thể hiểu được tốt nhất Ưu điểm

Tính module hóa cực cao, mọi...

Object detection OpenMMLab

1.3K

Phạm Văn Toàn thg 6 15, 2022 9:47 SA

18 phút đọc

Làm gì khi mô hình học máy thiếu dữ liệu có nhãn - Phần 3 - Self Supervised Representation Learning

Lời mở đầu Các mô hình Deep Learning thường có xu hướng đối dữ liệu - data hungry. Đối với các nhiệm vụ cụ thể, nếu như được cung cấp một lượng đầy đủ dữ liệu có những thì các thuật toán supervised learning có thể xử lý rất tốt. Để đạt được hiệu năng cao thì mô hình thường đòi hỏi một lượng khá lớn các dữ liệu có nhãn và chi phí để gán nhãn dữ liệu thường là rất đắt đỏ. Ngược lại, các nguồn dữ...

SSL