Image Cover
Avatar

Sun* AI Research Team

level partner

Nhà sáng tạo nội dung hạng Bạc

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Bài viết được ghim

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
16.6K
65
31 8

Tất cả bài viết

Thumbnail Image
21.8K
34
19 6
Avatar Pham Minh Hoang thg 8 18, 2022 8:02 SA
16 phút đọc

Tất tần tật về Airflow (P1)

Lời mở đầu Chào các bạn,

Do dòng đời xô đẩy nên tôi lại viết tiếp đây. Chủ đề hôm này là Airflow, chi tiết sẽ có trong các mục phía dưới

Do lượng kiến thức về framework này khá lớn nên tôi sẽ cố gắng viết các phần nối tiếp nhau, bạn đọc chú ý.

Khái niệm về Airflow Airflow là một công cụ lập lịch trình cho luồng công việc của bạn cũng như hỗ trợ quản lý, theo dõi từng phần trong quy trình giú...

Thumbnail Image
2.1K
17
5 0
Avatar Đặng Hồng Thanh thg 8 12, 2022 3:49 SA
7 phút đọc

[Paper Explain] Deformable DETR: Transformer kiểu mới cho bài toán Object Detection

  1. Giới thiệu chung Trong bài viết lần trước mình đã giới thiệu về DETR một hướng tiếp cận mới cho bài toán Object Detection để hiểu một cách chọn vẹn Deformable DETR mình khuyến nghị mọi người nên đọc bài viết về DETR của mình trước https://viblo.asia/p/object-detection-with-transfromer-detr-eW65GpmjKDO. Mặc dù hướng tiếp cận khá hay nhưng DETR vẫn còn một số vấn đề như:
  • DETR có kết quả khá ...
Thumbnail Image
2.0K
29
7 3
Avatar Pham Minh Hoang thg 8 5, 2022 4:17 SA
19 phút đọc

Trải nghiệm mệt mỏi khi thử training mô hình trên nhiều node (multi-node training)

Lời mở đầu Chào các bạn, lâu rồi không viết bài trên Viblo nên hôm nay tôi tâm sự chút trải nghiệm của mình khi huấn luyện mô hình trên nhiều máy tính (multi-node training).

Chả là, đồng nghiệp tôi toàn kháo nhau về huấn luyện mô hình trên một máy có nhiều gpu (distributed training on single node) ... ờ thì lúc đầu tôi chẳng thấy hứng thú gì cho lắm, cho đến khi dính phải một cái dự án cần tra...

Thumbnail Image
2.8K
19
4 1
Avatar Đặng Hồng Thanh thg 8 4, 2022 2:19 SA
6 phút đọc

[Paper Explain] Object Detection with Transfromer: DETR

  1. Sơ bộ về Self-Attention và Transformer 1.1 Self Attention

Trong ví dụ trên, đầu vào bao gồm hai câu: "the rabbit quickly hopped" và "the turtile slowly crawled". [SEP] là token đặc biệt ngăn cách giữa các câu, [CLS] là token được thêm vào đầu câu sử dụng cho classification tasks. Hình ảnh biểu diễn cho mỗi từ ở bên trái với những từ ở bên phải sẽ có trọng số nhất định. Độ đậm của màu thể hi...

Thumbnail Image
2.5K
16
2 0
Avatar Trần Quang Vinh thg 7 29, 2022 4:46 SA
8 phút đọc

[Paper Explained] Dùng mạng GAN để upscale ảnh trông chân thực hơn

Giới thiệu Mặc dù việc upscale ảnh bằng mạng CNN đã đạt được nhiều tiến bộ đáng kể về độ chính xác và thời gian chạy, ta vẫn còn một vấn đề lớn vẫn chưa được giải quyết: làm sao để khôi phục được các chi tiết trên bề mặt các object, nhất là khi hệ số upscale lớn (3x, 4x,...)? Bài báo "Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network" sẽ giải quyết vấn đề này ...

Thumbnail Image
4.0K
29
9 5
Avatar Bui Quang Manh thg 7 29, 2022 4:30 SA
11 phút đọc

SVTR NET - Lời giải hoàn hảo cho bài toán OCR ?

I. Tổng quan

<img src="https://images.viblo.asia/f42e0229-a318-4346-8f4f-d6b0ba476f02.png" >
   Ứng dụng bài toán Text Recognition (ảnh mạng)

Bài toán nhận dạng chữ đến nay đã thu hút rất nhiều học giả nghiên cứu vì tính thách thức cũng như khả năng ứng dụng thực tế của bài toán này. Bài toán này có nhiệm vụ chuyển vùng chữ được xác định bởi mô hình phát hiện chữ ở dạng ảnh về dạng c...

Thumbnail Image
761
13
1 0
Avatar Trần Đức Trung thg 7 28, 2022 7:08 SA
17 phút đọc

Xây dựng workflow với Flyte

Trái ngược với việc Machine Learning đã và đang có vô vàn ứng dụng trong thực tế trong hơn vài thập kỷ qua, công cụ hỗ trợ các nhà nghiên cứu và kỹ sư trong lĩnh vực này vẫn đang phát triển. Vậy nên khi các mô hình trở nên phức tạp và các nguồn dữ liệu trở nên đa dạng, cơ sở hạ tầng, đặc biệt là các cơ sở hạ tầng cấp thấp như Kubernetes, mạng, trình điều khiển GPU, quản lý tài nguyên, v.v sẽ tr...

Thumbnail Image
901
14
2 0
Avatar Trinh Quang thg 7 25, 2022 6:00 SA
7 phút đọc

[Paper Explain] Ứng dụng Semi-Supervised cho bài toán về Semantic Segmentation

Giới thiệu Trong những năm trở lại đây semi-supervised learning đã và đang trở thành chủ đề được ứng dụng và nghiên cứu trong nhiều lĩnh vực khác nhau(xử lý hình ảnh, xử lý ngôn ngữ, tiếng nói ..vv). Trong đó việc ứng dụng semi-supervised learning để cải thiện hiệu quả cho các bài toán về segmentation đang được xem là một trong số những xu hướng nghiên cứu những năm gần đây. Trong bài viết lần ...

Thumbnail Image
2.9K
16
3 0
Avatar Bui Quang Manh thg 7 23, 2022 9:33 SA
11 phút đọc

Bài toán phát hiện chữ (Text Detection) và mô hình DB (Phần 2)

I. Giới thiệu Ở trong phần 1 của bài viết Bài toán phát hiện chữ (Text Detection) và mô hình DB (Phần 1) , tôi đã giới thiệu tổng quan các mô hình phát hiện chữ và mô hình phát hiện chữ DB. Trong bài viết hôm nay, tôi sẽ giới thiệu cho các bạn một phiên bản cải tiến của mô hình DB là DB++ được giới th...

Thumbnail Image
4.5K
20
4 0
Avatar Bui Quang Manh thg 7 23, 2022 3:25 SA
11 phút đọc

Bài toán phát hiện chữ (Text Detection) và mô hình DB (Phần 1)

I. Tổng quan bài toán phát hiện chữ

<img src="https://images.viblo.asia/78e9f605-137f-4e93-88f2-9fe6807b9885.png" >

Ảnh 1: Minh họa ứng dụng phát hiện chữ trong thực tế

Bài toán phát hiện chữ trong ảnh là bài toán xác định vị trị vùng có chữ trong ảnh đã trở nên phổ biến cả về mặt ứng dụng và nghiên cứu vì khả năng ứng dụng của nó . Đến hiện tại, bài toán phát hiện chữ trong ảnh thường ...

Thumbnail Image
2.0K
21
2 3
Avatar Nguyen Mai thg 7 12, 2022 6:50 CH
21 phút đọc

[Paper Explain] VoVNet - Backbone tiết kiệm điện năng cho Object Detection

Mở đầu Đây là một paper khá hay phân tích về việc làm thế nào để thiết kế một model thực sự là hiệu quả về mặt tốc độ, điện năng tiêu thụ và độ chính xác. Nó đạp đổ toàn bộ những mạng nơ-ron tự xưng là cực nhẹ và tốc độ cao ra đời trước đó như MobileNet, ShuffleNet,... bổ sung thêm những kiến thức cần thiết cho việc thiết kế một model nhẹ. Hơn nữa, mình thấy paper này có những cách đặt vấn đề v...

Thumbnail Image
3.4K
24
10 5
Avatar Nguyen Mai thg 7 5, 2022 3:48 CH
12 phút đọc

Explainable AI - Bạn có hiểu model của bạn không?

Giới thiệu Explainable AI Sự thành công của Deep Neural Network (DNN - mạng nơ-ron sâu) đã mang đến những bước tiến lớn trong các ứng dụng, nghiên cứu A.I (trí tuệ nhân tạo). Mặc dù vô cùng thành công, nhưng DNN hoạt động giống như một chiếc hộp đen, ta không biết tại sao mạng nơ-ron lại đưa ra một quyết định cụ thể. Do đó, khi một hệ thống A.I dự đoán sai, ta không hề biết tại sao hệ thống đó ...

Thumbnail Image
348
9
3 0
Avatar Trần Đức Trung thg 6 30, 2022 10:20 SA
42 phút đọc

[Paper Explain] Deep Learning on a Data Diet: Finding Important Examples Early in Training

Có thể nói rằng thành công gần đây của của các mô hình Deep Learning một phần được thúc đẩy bởi việc huấn luyện trên các bộ dữ liệu có kích cỡ ngày càng lớn. Tuy vậy, đôi khi hẳn ta sẽ tự hỏi kiểu như "Liệu bao nhiêu dữ liệu trong 10 triệu mẫu kia là không cần thiết?", "Liệu có những mẫu dữ liệu nào quan trọng cho việc tổng quát hóa không và ta tìm thấy chúng như thế nào? Bài viết này trình bày...

Thumbnail Image
15.4K
24
6 7
Avatar Nguyen Mai thg 6 24, 2022 4:27 SA
14 phút đọc

Tổng hợp kiến thức từ YOLOv1 đến YOLOv5 (Phần 3)

Mở đầu Đây là bài viết cuối cùng trong chuỗi series giải thích họ nhà YOLO, lần này tập trung vào YOLOv4 và YOLOv5. Bài viết này gồm rất nhiều những kiến trúc, ý tưởng mới nên có chỗ nào khó hiểu, mình highly recommend các bạn nên đọc paper về phần đấy để có thể nắm được rõ nhất. Phần này sẽ tóm tắt và phân tích ngắn gọn về những thay đổi trong kiến trúc (backbone + neck), các kĩ thuật xử lý da...

Thumbnail Image
2.0K
16
6 1
Avatar Nguyen Mai thg 6 19, 2022 11:28 SA
8 phút đọc

Tăng tốc thử nghiệm Object Detection với MMDetection

Giới thiệu MMDetection MMDetection là một thư viện chuyên phục vụ cho các bài toán liên quan đến Object Detection, được tạo ra bởi OpenMMLab, cha đẻ của rất nhiều thư viện khác như MMCV, MMSegmentation,... ❗️ Lưu ý, nên xem bài viết này trong lúc mở sẵn github của MMDetection hoặc một IDE có MMDetection để có thể hiểu được tốt nhất ❗️ Ưu điểm

  • Tính module hóa cực cao, mọi...
Thumbnail Image
1.2K
13
3 0
Avatar Phạm Văn Toàn thg 6 15, 2022 9:47 SA
18 phút đọc

Làm gì khi mô hình học máy thiếu dữ liệu có nhãn - Phần 3 - Self Supervised Representation Learning

Lời mở đầu Các mô hình Deep Learning thường có xu hướng đối dữ liệu - data hungry. Đối với các nhiệm vụ cụ thể, nếu như được cung cấp một lượng đầy đủ dữ liệu có những thì các thuật toán supervised learning có thể xử lý rất tốt. Để đạt được hiệu năng cao thì mô hình thường đòi hỏi một lượng khá lớn các dữ liệu có nhãn và chi phí để gán nhãn dữ liệu thường là rất đắt đỏ. Ngược lại, các nguồn dữ...

Thumbnail Image
10.7K
37
8 2
Avatar Nguyen Mai thg 6 14, 2022 1:58 SA
11 phút đọc

Tổng hợp kiến thức từ YOLOv1 đến YOLOv5 (Phần 2)

Mở đầu

Ở bài viết lần trước, mình đã trình bày về YOLOv1: Lý do tại sao YOLO lại ra đời, đồng thời phân tích ý tưởng chính và hàm Loss của YOLOv1. Tiếp tục với series phân tích YOLO, lần này mình sẽ trình bày về 2 phiên bản khác trong họ nhà YOLO, cụ thể là YOLOv2 và YOLOv3. Mình sẽ tập trung phân tích về kiến trúc mạng, những thay đổi trong quá trình training, cách sử dụng Anchor Box cũng như...

Thumbnail Image
4.6K
29
9 2
Avatar Phạm Văn Toàn thg 6 3, 2022 7:48 SA
27 phút đọc

Làm gì khi mô hình học máy thiếu dữ liệu có nhãn - Phần 2 - Semi Supervised Learning

Xin chào các bạn, tiếp nối bài viết trước về Active Learning - một trong những phương pháp hữu hiệu để xử lý đối với trường hợp thiếu dữ liệu có nhãn. Bài viết này mình xin phép được chia sẻ với các bạn một phương pháp khác đó là semi-supervised learning hay còn gọi với cái tên khác là học bán giám sát. Và không còn chần chừ gì nữa chúng ta sẽ bắt đầu ngay thôi. Gét gô.

Semi supervised learnin...

Thumbnail Image
931
10
2 1
Avatar Hung Tien Nguyen thg 6 2, 2022 9:40 SA
12 phút đọc

Tìm hiểu 1 số mô hình về Text-To-Speech (P2)

  1. FastSpeech 2

3.1 Giới thiệu

1 số mô hình non-autoregressive TTS như FastSpeech có khả năng sinh giọng nói nhanh hơn các mô hình autoregressive với độ chính xác tương đương. Việc huấn luyện mô hình FastSpeech phụ thuộc vào autoregressive teacher model để dự đoán thời lượng âm vị và knowledge distillation (chắt lọc tri thức), có thể giải quyết tốt các vấn đề one-to-many (1 văn bản có thể si...

Thumbnail Image
883
4
0 0
Avatar Đinh Trọng Huy thg 6 2, 2022 8:34 SA
9 phút đọc

Tóm tắt vài mô hình Text-to-Speech (p4) - GlowTTS

  1. Tổng quan
  • Các mô hình non-autogressive TTS song song trước đó, ví dụ như FastSpeech, có thể sinh mel-spectrogram nhanh hơn rõ rết so với autogressive models như Tacotron, cũng như giảm các lỗi về ngữ âm (lặp, mất từ). Tuy vậy, các nhược điểm trên được xử lý phần lớn nhờ attention map giữa text và speech.
  • Các mô hình TTS song song trước thường sử dụng aligners từ bên ngoài như pre-trained...
Thành viên nổi bật
Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí