Sun* AI Research Team

Nhà sáng tạo nội dung hạng Bạc

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Bài viết được ghim

Phạm Văn Toàn

thg 5 7, 2023 6:13 SA 27 phút đọc

Langchain #1 - Điểm qua các chức năng sừng sỏ nhất của Langchain - một framework cực bá đạo khi làm việc với LLM

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator

19.9K

Thao Hoang Thu

Bạn đã biết gì về prompt engineering? - Tổng hợp các tips tạo lời nhắc cho ChatGPT

Mayfest2023 ContentCreator ChatGPT Generative AI

10.0K

Nguyen Mai

[Paper Explain] YOLOv7: Sử dụng các "trainable bag-of-freebies" đưa YOLO lên một tầm cao mới (phần 3)

ContentCreator Object detection Yolo

5.4K

Trần Đức Trung

[Paper Explain] Reading Race: AI Recognises Patient's Racial Identity In Medical Images

ContentCreator Race Detection Medical imaging

355

Phan Huy Hoang

[Deep Learning] Graph Neural Network - A literature review and applications

Machine Learning Deep Learning Graph Neural Network Graph Representation Learning Graph Convolution Network

38.3K

199

Nguyen Mai

[Vinh danh Paper] QLoRA: Quantize để training mô hình hàng tỷ tham số trên Google Colab

ContentCreator Deep Learning LLM PEFT

8.1K

Tất cả bài viết

1.0K

Tiểu Hoàng Hạnh thg 7 25, 2022 6:00 SA

7 phút đọc

[Paper Explain] Ứng dụng Semi-Supervised cho bài toán về Semantic Segmentation

Giới thiệu Trong những năm trở lại đây semi-supervised learning đã và đang trở thành chủ đề được ứng dụng và nghiên cứu trong nhiều lĩnh vực khác nhau(xử lý hình ảnh, xử lý ngôn ngữ, tiếng nói ..vv). Trong đó việc ứng dụng semi-supervised learning để cải thiện hiệu quả cho các bài toán về segmentation đang được xem là một trong số những xu hướng nghiên cứu những năm gần đây. Trong bài viết lần ...

ContentCreator segmentation SSL

3.5K

Bui Quang Manh thg 7 23, 2022 9:33 SA

11 phút đọc

Bài toán phát hiện chữ (Text Detection) và mô hình DB (Phần 2)

I. Giới thiệu Ở trong phần 1 của bài viết Bài toán phát hiện chữ (Text Detection) và mô hình DB (Phần 1) , tôi đã giới thiệu tổng quan các mô hình phát hiện chữ và mô hình phát hiện chữ DB. Trong bài viết hôm nay, tôi sẽ giới thiệu cho các bạn một phiên bản cải tiến của mô hình DB là DB++ được giới th...

ContentCreator mô hình phát hiện chữ Real-Time Scene Text Detection with Differentiable Binarization and Adaptive Scale Fusion text detection model db plus plus

5.3K

Bui Quang Manh thg 7 23, 2022 3:25 SA

11 phút đọc

Bài toán phát hiện chữ (Text Detection) và mô hình DB (Phần 1)

I. Tổng quan bài toán phát hiện chữ

<img src="https://images.viblo.asia/78e9f605-137f-4e93-88f2-9fe6807b9885.png" >

Ảnh 1: Minh họa ứng dụng phát hiện chữ trong thực tế

Bài toán phát hiện chữ trong ảnh là bài toán xác định vị trị vùng có chữ trong ảnh đã trở nên phổ biến cả về mặt ứng dụng và nghiên cứu vì khả năng ứng dụng của nó . Đến hiện tại, bài toán phát hiện chữ trong ảnh thường ...

ContentCreator db mô hình phát hiện chữ text detection model

2.5K

Nguyen Mai thg 7 12, 2022 6:50 CH

21 phút đọc

[Paper Explain] VoVNet - Backbone tiết kiệm điện năng cho Object Detection

Mở đầu Đây là một paper khá hay phân tích về việc làm thế nào để thiết kế một model thực sự là hiệu quả về mặt tốc độ, điện năng tiêu thụ và độ chính xác. Nó đạp đổ toàn bộ những mạng nơ-ron tự xưng là cực nhẹ và tốc độ cao ra đời trước đó như MobileNet, ShuffleNet,... bổ sung thêm những kiến thức cần thiết cho việc thiết kế một model nhẹ. Hơn nữa, mình thấy paper này có những cách đặt vấn đề v...

ContentCreator Object detection Paper Explain

4.7K

Nguyen Mai thg 7 5, 2022 3:48 CH

12 phút đọc

Explainable AI - Bạn có hiểu model của bạn không?

Giới thiệu Explainable AI Sự thành công của Deep Neural Network (DNN - mạng nơ-ron sâu) đã mang đến những bước tiến lớn trong các ứng dụng, nghiên cứu A.I (trí tuệ nhân tạo). Mặc dù vô cùng thành công, nhưng DNN hoạt động giống như một chiếc hộp đen, ta không biết tại sao mạng nơ-ron lại đưa ra một quyết định cụ thể. Do đó, khi một hệ thống A.I dự đoán sai, ta không hề biết tại sao hệ thống đó ...

ContentCreator Deep Learning Explainable AI

420

Trần Đức Trung thg 6 30, 2022 10:20 SA

42 phút đọc

[Paper Explain] Deep Learning on a Data Diet: Finding Important Examples Early in Training

Có thể nói rằng thành công gần đây của của các mô hình Deep Learning một phần được thúc đẩy bởi việc huấn luyện trên các bộ dữ liệu có kích cỡ ngày càng lớn. Tuy vậy, đôi khi hẳn ta sẽ tự hỏi kiểu như "Liệu bao nhiêu dữ liệu trong 10 triệu mẫu kia là không cần thiết?", "Liệu có những mẫu dữ liệu nào quan trọng cho việc tổng quát hóa không và ta tìm thấy chúng như thế nào? Bài viết này trình bày...

Data Pruning Machine Learning

17.3K

Nguyen Mai thg 6 24, 2022 4:27 SA

14 phút đọc

Tổng hợp kiến thức từ YOLOv1 đến YOLOv5 (Phần 3)

Mở đầu Đây là bài viết cuối cùng trong chuỗi series giải thích họ nhà YOLO, lần này tập trung vào YOLOv4 và YOLOv5. Bài viết này gồm rất nhiều những kiến trúc, ý tưởng mới nên có chỗ nào khó hiểu, mình highly recommend các bạn nên đọc paper về phần đấy để có thể nắm được rõ nhất. Phần này sẽ tóm tắt và phân tích ngắn gọn về những thay đổi trong kiến trúc (backbone + neck), các kĩ thuật xử lý da...

Object detection Yolo

2.4K

Nguyen Mai thg 6 19, 2022 11:28 SA

8 phút đọc

Tăng tốc thử nghiệm Object Detection với MMDetection

Giới thiệu MMDetection MMDetection là một thư viện chuyên phục vụ cho các bài toán liên quan đến Object Detection, được tạo ra bởi OpenMMLab, cha đẻ của rất nhiều thư viện khác như MMCV, MMSegmentation,... Lưu ý, nên xem bài viết này trong lúc mở sẵn github của MMDetection hoặc một IDE có MMDetection để có thể hiểu được tốt nhất Ưu điểm

Tính module hóa cực cao, mọi...

Object detection OpenMMLab

1.4K

Phạm Văn Toàn thg 6 15, 2022 9:47 SA

18 phút đọc

Làm gì khi mô hình học máy thiếu dữ liệu có nhãn - Phần 3 - Self Supervised Representation Learning

Lời mở đầu Các mô hình Deep Learning thường có xu hướng đối dữ liệu - data hungry. Đối với các nhiệm vụ cụ thể, nếu như được cung cấp một lượng đầy đủ dữ liệu có những thì các thuật toán supervised learning có thể xử lý rất tốt. Để đạt được hiệu năng cao thì mô hình thường đòi hỏi một lượng khá lớn các dữ liệu có nhãn và chi phí để gán nhãn dữ liệu thường là rất đắt đỏ. Ngược lại, các nguồn dữ...

SSL

11.7K

Nguyen Mai thg 6 14, 2022 1:58 SA

11 phút đọc

Tổng hợp kiến thức từ YOLOv1 đến YOLOv5 (Phần 2)

Mở đầu

Ở bài viết lần trước, mình đã trình bày về YOLOv1: Lý do tại sao YOLO lại ra đời, đồng thời phân tích ý tưởng chính và hàm Loss của YOLOv1. Tiếp tục với series phân tích YOLO, lần này mình sẽ trình bày về 2 phiên bản khác trong họ nhà YOLO, cụ thể là YOLOv2 và YOLOv3. Mình sẽ tập trung phân tích về kiến trúc mạng, những thay đổi trong quá trình training, cách sử dụng Anchor Box cũng như...

Yolo Object detection

6.0K

Phạm Văn Toàn thg 6 3, 2022 7:48 SA

27 phút đọc

Làm gì khi mô hình học máy thiếu dữ liệu có nhãn - Phần 2 - Semi Supervised Learning

Xin chào các bạn, tiếp nối bài viết trước về Active Learning - một trong những phương pháp hữu hiệu để xử lý đối với trường hợp thiếu dữ liệu có nhãn. Bài viết này mình xin phép được chia sẻ với các bạn một phương pháp khác đó là semi-supervised learning hay còn gọi với cái tên khác là học bán giám sát. Và không còn chần chừ gì nữa chúng ta sẽ bắt đầu ngay thôi. Gét gô.

Semi supervised learnin...

Reconnection

1.1K

Hung Tien Nguyen thg 6 2, 2022 9:40 SA

12 phút đọc

Tìm hiểu 1 số mô hình về Text-To-Speech (P2)

FastSpeech 2

3.1 Giới thiệu

1 số mô hình non-autoregressive TTS như FastSpeech có khả năng sinh giọng nói nhanh hơn các mô hình autoregressive với độ chính xác tương đương. Việc huấn luyện mô hình FastSpeech phụ thuộc vào autoregressive teacher model để dự đoán thời lượng âm vị và knowledge distillation (chắt lọc tri thức), có thể giải quyết tốt các vấn đề one-to-many (1 văn bản có thể si...

Speech processing Text to speech Deep Learning

1.1K

Đinh Trọng Huy thg 6 2, 2022 8:34 SA

9 phút đọc

Tóm tắt vài mô hình Text-to-Speech (p4) - GlowTTS

Tổng quan

Các mô hình non-autogressive TTS song song trước đó, ví dụ như FastSpeech, có thể sinh mel-spectrogram nhanh hơn rõ rết so với autogressive models như Tacotron, cũng như giảm các lỗi về ngữ âm (lặp, mất từ). Tuy vậy, các nhược điểm trên được xử lý phần lớn nhờ attention map giữa text và speech.
Các mô hình TTS song song trước thường sử dụng aligners từ bên ngoài như pre-trained...

Machine Learning Deep Leanring

1.1K

Nguyen Tu Xuan Cong thg 5 31, 2022 4:57 CH

5 phút đọc

Hello world với Reinforcement Learning

Xin chào các bạn. Tiếp nối series về Reinforcement Learning (RL), hôm nay mình xin giới thiệu một ví dụ đơn giản có thể coi như là "Hello world" của RL.

Giới thiệu Trong bài trước Đôi điều cơ bản về học tăng cường mình đã giới thiệu một số khái niệm của RL. Trong đó môi trường và các trạng thái, phần thưởng là những yếu tố quan trọng. Để cho có thể học được những chiến lược tối ưu hoặc tìm...

MayFest2022 Reconnection Reinforcement learning

1.1K

Bui Tien Tung thg 5 31, 2022 4:56 CH

12 phút đọc

[Paper Explain] Learning Temporally Invariant and Localizable Features via Data Augmentation for Video Recognition - Bàn luận 1 chút về video augmentation.

Tiếp tục series Paper Explain đang dang dở về topic Action Recognition, trong bài viết này, mình muốn bàn một chút về data: Data Augmentation.

Chắc mọi người cũng đã biết rồi, bên cạnh một model tốt, thứ ảnh hưởng trực tiếp đến kết quả đầu ra, đó là chất lượng của dữ liệu. Việc xây dựng được một bộ dữ liệu sạch, số lượng lớn, tính tổng quát cao đôi khi improve còn tốt hơn việc sử dụng những mo...

MayFest2022 Reconnection Action Recognition Computer Vision Deep Learning

1.6K

Đinh Trọng Huy thg 5 31, 2022 2:02 CH

9 phút đọc

Tóm tắt vài mô hình Text-to-Speech (p3) - FastSpeech2

FastSpeech2 có gì mới? FastSpeech - một non-aggressive model - có khả năng sinh ra giọng nói nhanh vượt trội so với các aggressive model thời bấy giờ với chất lượng gần tương đương nhờ xử lý khá tốt vấn đề one-to-many (1 phoneme ứng với nhiều mel-spectrogram). Dù vậy, nó vẫn có các nhược điểm:

Việc xây dựng teacher-student pipeline theo phương pháp Knowledge distillation rất phức tạp và tố...

MayFest2022 Reconnection Text to speech Machine Learning

3.1K

Nguyen Thanh Huyen thg 5 31, 2022 1:41 CH

30 phút đọc

Deformable DETR: Phương pháp tiếp cận end-to-end cho bài toán object detection

Bài viết hôm nay là về một bài toán cực lỳ phổ biến mà ai làm việc trong ngành này cũng từng không ít lần thử sức, đó là bài toán object detection. Trên Papers with code, bài toán này ghi nhận 2080 papers, 191 dataset, 61 benchmarks cả thẩy, và số lượng thực tế đương nhiên còn nhiều hơn thế. Ngay bây giờ, kể cả khi rất nhiều SOTA đã được trình bày, các vấn đề xoay quanh bài toán này vẫn đang ti...

MayFest2022 Reconnection ContentCreator Object detection Transformer

2.1K

Nguyen Thanh Huyen thg 5 31, 2022 1:40 CH

15 phút đọc

[Paper Explain][Face Anti-Spoofing phần 2] SGTD - Tận dụng thông tin không gian và thời gian cho bài toán Face Anti-spoofing

Xin chào, đây là bài viết thứ 2 của mình trong chuỗi series về Face Anti-Spoofing.

Xin chào, ở bài viết trước, mình đã giới thiệu tổng quan các vấn đề trong bài toán Face Anti-Spoofing, bài toán chống giả mạo khuôn mặt. Những chia sẻ ở bài viết trước bao gồm: giới thiệu bài toán, các phương pháp tấn công giả mạo (face attack methods), các phương pháp chống tấn công giả mạo phổ biến (face anti-...

MayFest2022 Reconnection ContentCreator Face Anti-Spoofing

8.0K

Nguyen Tu Xuan Cong thg 5 31, 2022 5:34 SA

11 phút đọc

Đôi điều cơ bản về học tăng cường

Giới thiệu

Ắt hẳn các bạn đang đọc đã từng biết đến ít nhất một môn cờ (cờ caro, cờ vua, cờ tướng, cờ vây, ...). Mỗi một môn cờ có những luật chơi, chiến thuật và không gian các nước đi khác nhau, như số nước đi hợp lệ trong cờ vua là $10^{120}2.10^{170}10^{78}10^{82}$ nguyên tử (Universe today). Nếu bạn vẫn chưa hình dung ra nó nhiều như thế nào 😑 thì hãy cứ xem rằng nó rất rất lớn đến mức...

MayFest2022 Reconnection Reinforcement learning

5.3K

Hung Tien Nguyen thg 5 29, 2022 11:06 CH

19 phút đọc

Tìm hiểu về Automatic Speech Recognition

Hiểu được ngôn ngữ nói, hoặc là chuyển được âm thanh thành dạng chữ viết là 1 trong những mục tiêu đầu tiên của xử lý ngôn ngữ máy tính. Thực tế, xử lý tiếng nói đã được tiến hành bởi máy tính nhiều thập kỉ trước. Mục tiêu của automatic speech recognition (công nghệ tự nhận dạng giọng nói) là ánh xạ bất kì waveform nào:

về dạng chữ viết:

Tự động nhận dạng tiếng nói bởi bất kì người nào trong ...

MayFest2022 Reconnection Speech Recognition Deep Learning