Sun* AI Research Team

Nhà sáng tạo nội dung hạng Bạc

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Bài viết được ghim

Phạm Văn Toàn

May 7th, 2023 6:13 a.m. 27 phút đọc

Langchain #1 - Điểm qua các chức năng sừng sỏ nhất của Langchain - một framework cực bá đạo khi làm việc với LLM

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator

18.9K

Thao Hoang Thu

Bạn đã biết gì về prompt engineering? - Tổng hợp các tips tạo lời nhắc cho ChatGPT

Mayfest2023 ContentCreator ChatGPT Generative AI

8.5K

Nguyen Mai

[Paper Explain] YOLOv7: Sử dụng các "trainable bag-of-freebies" đưa YOLO lên một tầm cao mới (phần 3)

ContentCreator Object detection Yolo

5.1K

Trần Đức Trung

[Paper Explain] Reading Race: AI Recognises Patient's Racial Identity In Medical Images

ContentCreator Race Detection Medical imaging

325

Phan Huy Hoang

[Deep Learning] Graph Neural Network - A literature review and applications

Machine Learning Deep Learning Graph Neural Network Graph Representation Learning Graph Convolution Network

36.3K

196

Nguyen Mai

[Vinh danh Paper] QLoRA: Quantize để training mô hình hàng tỷ tham số trên Google Colab

ContentCreator Deep Learning LLM PEFT

6.3K

Tất cả bài viết

672

Blink Jun 18th, 2021 8:25 a.m.

10 phút đọc

Self-Attention Text Recognition Network

Giới thiệu Scene Text Recognition (STR) là một bài toán khó, đặc biệt khi Text trong ảnh không có hình dạng nhất định. Một phương pháp thú vị giới thiệu bởi các tác giả đến từ team Clova AI Research, NAVER. Trong paper này, Self-Attention Text Recognition Network (SATRN) được nghiên cứu và thực nghiệm nhằm giải quyết các bài toán Scene text recognition.

Tổng quan Với bài toán Scene Text Recogn...

Deep Learning

419

Blink Jun 18th, 2021 8:25 a.m.

7 phút đọc

DEMON - Momentum Decay cho mô hình NN

Giới thiệu Trong ML, DL các hàm/thuật toán tối ưu (optimizer) đóng vai trò không thể bàn cãi. Về cơ bản, thuật toán tối ưu là cơ sở để xây dựng mô hình neural network với mục đích "học " được các features của dữ liệu đầu vào, từ đó có thể tìm 1 cặp weights và bias phù hợp để tối ưu hóa mô hình.

Các thuật toán phổ biến hiện nay có thể kể đến như RMSProp, SGD, SGDM, AdaGrad và optimizer người n...

optimizer

1.6K

Nguyen Viet Hoai Jun 6th, 2021 8:01 a.m.

10 phút đọc

Cơ chế mã hóa vị trí 2 chiều giải quyết bài toán nhận dạng nhiều dòng

Giới thiệu Hầu hết các mô hình nhận dạng văn bản hiện nay đều xử lí trên dữ liệu 1 dòng . Về cơ bản mô hình nhận dạng sẽ có 3 thành phần là trích xuất , giải mã. Ở phần trích xuất sẽ là các mạng trích xuất đặc trưng như CNN,.. thu được một véc-tơ 1 chiều biểu diễn đặc trưng của các kí tự từ ảnh đầu vào. Vì vậy khi cho qua phần 2 đó là phần giải mã, phần này có nhiệm vụ dự đoán các giá trị phần ...

Deep Learning ocr

3.8K

Nguyen Dinh Thien Jun 4th, 2021 2:36 p.m.

13 phút đọc

Tổng quan về Neural Machine Translation

Machine Translation là gì? Machine Translation(MT) là nhiệm vụ dịch một đoạn văn bản từ ngôn ngữ nguồn(source language) sang một ngôn ngữ đích(target language). Đơn giản như lúc ta bật google dịch lên rồi dịch câu tiếng Nhật: ’皆さん、おはようございます’。Ta được câu tiếng Việt là: "Chào buổi sáng tất cả mọi người".

Lịch sử của Machine Translation Machine Translation bắt đầu được nghiên cứu từ những năm 50 ...

NLP NMT

2.8K

Bui Tien Tung May 31st, 2021 4:40 p.m.

30 phút đọc

CenterNet - CenterTrack - TraDeS: Từ object detection đến multiple object tracking

Mở đầu Xin chào các bạn, mình lại quay trở lại sau ... 2 ngày không ra bài mới . Còn ngày cuối cùng của sự kiện MayFest nên mình cũng cố gắng viết cho kịp thêm bài nữa để hưởng ứng trọn vẹn sự kiện như lời đã nói, cũng nhân dịp chia sẻ phần tìm hiểu khá hay ho gần đây của mình. Hm nay lại tiếp tục là một chủ đề mà mình chưa từng viết qua trước đây: Paper Explain

IEEE Conference on Compute...

CVPR2021 Computer Vision Deep Learning Object detection

2.3K

Nguyen Viet Hoai May 30th, 2021 3:36 p.m.

5 phút đọc

Hướng dẫn lưu video từ luồng camera sử dụng tkinter và opencv

Ở bài viết này thì mình sẽ hướng dẫn các bạn thiết kế 1 chương trình đơn giản để có thể show luồng camera từ máy tính hoặc luồng rtsp, sau đó có thể lưu video theo bao nhiêu giây đó tùy các bạn. Ở bài viết này mình sẽ sử dụng thư viện tkinter để làm giao diện và opencv để đọc luồng video và xử lí frame và xuất ra video. Không luyên thuyên nữa mình sẽ đi vào phần hướng dẫn tạo chương trình luôn ...

Open CV

3.8K

Nguyen Viet Hoai May 30th, 2021 10:54 a.m.

14 phút đọc

[Domain adaptation - P1] Tổng quan về kỹ thuật transfer learning và domain adaptation

Giới thiệu

Transfer learning là một kỹ thuật rất hay trong lĩnh vực học sâu, nhờ đó chúng ta có thể giải quyết một nhiệm vụ mới với kiến thức thu được từ một nhiệm vụ cũ để giải quyết việc thiếu dữ liệu được gắn nhãn. Đặc biệt, deep domain adaptation (một nhánh của transfer learning) được chú ý nhiều nhất trong các bài báo gần đây. Các mạng nơ-ron sâu thường có số lượng tham số lớn để học cách...

Deep Learning

42.0K

Bui Tien Tung May 28th, 2021 10:47 a.m.

21 phút đọc

Gradient Boosting - Tất tần tật về thuật toán mạnh mẽ nhất trong Machine Learning

Xin chào các bạn, sau 1 thời gian vắng bóng vì cạn ý tưởng viết bài và cũng cảm thấy bản thân chưa làm được điều gì nên hồn để chia sẻ, mình đã quay trở lại với Viblo để viết về một chủ đề không mới, về một thuật toán không mới, tuy nhiên không phải ai cũng hoàn toàn hiểu được và vận dụng được nó : Gradient Boosting.

Ý tưởng để gợi lên mình viết bài viết này có lẽ bắt nguồn từ bài viết Ensembl...

Machine Learning Gradient Boosting Ensemble Learning

3.8K

Thao Hoang Thu May 26th, 2021 9:49 a.m.

13 phút đọc

Phân tích nội dung và tạo đám mây từ khóa (word cloud) từ đoạn văn bản tiếng Nhật

Chắc hẳn là khái niệm đám mây từ khóa (word cloud) đã không còn xa lạ gì trong thời đại thông tin số bùng nổ như ngày nay. Chúng ta thường thấy nó xuất hiện trên các bài báo, công cụ tìm kiếm, thể hiện những từ khóa được tìm kiếm nhiều nhất hoặc là chủ đề của một nội dung nào đó.

Đám mây từ khóa hoặc đám mây thẻ (tag cloud) là biểu diễn dưới dạng đồ họa của tần suất xuất hiện của các từ, qua đ...

NLP Japanese

10.5K

Cao Minh Hiếu May 25th, 2021 11:19 a.m.

3 phút đọc

Data visualization với Seaborn

Trong bài viết này mình giới thiệu với mọi người các biểu đồ mình hay dùng để visualize dữ liệu bằng seaborn.

Vì là intro nên để hiểu rõ hơn ý nghĩa của từng biểu đồ, mọi người có thể đọc thêm tại series data visualization của anh Ngọc tại đây và của anh Khánh tại đây

I. Seaborn vs Matplotlib

Seaborn là mở rộng của matplotlib, có nghĩa là seaborn kế thừa từ matplotlib và cũng chính vì vậy, s...

Visualization

10.8K

Chung Pham Van May 23rd, 2021 10:48 a.m.

5 phút đọc

Kỹ thuật Dropout (Bỏ học) trong Deep Learning

[IMG]

Trong bài viết này, mình xin phép giới thiệu về Dropout (Bỏ học) trong mạng Neural, sau đó là mình sẽ có 1 số đoạn code để xem Dropout ảnh hưởng thế nào đến hiệu suất của mạng Neural.

Lý thuyết 1.1. Dropout trong mạng Neural là gì Theo Wikipedia) - Thuật ngữ 'Dropout' đề cập đến việc bỏ qua các đơn vị (units) ẩn và hiện trong 1 mạng Neural.

Hiểu 1 cách đơn giản thì Dropout là việc bỏ qua c...

Deep Learning Machine Learning AI Dropout

4.2K

Bui Quang Manh May 23rd, 2021 1:53 a.m.

8 phút đọc

Tạo dữ liệu cho bài toán OCR Tiếng Việt trong 5 bước.

Bài toán OCR hay nhận dạng chữ Tiếng Việt đã không còn xa lạ và đã được ứng dụng vào rất nhiều cuộc sống như ứng dụng trích xuất thông tin văn bản, số hóa dữ liệu, ... đã thu được rất nhiều thành quả đáng kinh ngạc. Và bài toán OCR cũng là một chủ đề có độ khó vừa phải để những người mới bắt đầu cũng có thể học, nghiên cứu thu thập nhiều kiến thức mới. Tuy nhiên làm sao để chúng ta tạo được nhữ...

Tạo dữ liệu nhận dạng chữ tiếng Việt Image Text Generator Synthesize Ocr Data

2.8K

Trần Đức Trung May 21st, 2021 10:22 a.m.

22 phút đọc

Một số hàm mất mát sử dụng cho Object Detection

Object Detection hay phát hiện đối tượng là một trong các tác vụ chính được quan tâm nhiều nhất của thị giác máy, thường hướng tới việc phát hiện các thể hiện của các đối tượng của một lớp nhất định trong một ảnh. Trong suốt thời gian nghiên cứu xung quanh tác vụ này có rất nhiều mô hình và các thành phần bổ trợ như hàm mất mát được đề xuất cũng như không ngừng được cải tiến. Bài viết này liệt ...

Object detection Loss Function

444

Nguyen Dinh Thien May 21st, 2021 8:19 a.m.

7 phút đọc

Autocorrect

I. Autocorrect là gì? Autocorrect (Tự động sửa ) là việc điện thoại, máy tính bảng và máy tính tự sửa chữa những từ sai chính tả khi người dùng đang gõ văn bản hoặc nhắn tin, .v.v. Ví dụ:

Như minh họa ở trên, từ "nao" đã được gợi ý thành "nào" hoặc "bảo", còn từ "gi" được gợi ý thành "gì" hoặc "giấy".

II. Các bước thực hiện Để triển khai autocorrect, chúng ta cần thực hiện các bước sau:

NLP

5.6K

Chung Pham Van May 20th, 2021 10:01 a.m.

10 phút đọc

Không còn đau đầu với thuật toán phức tạp vì đã có Google OR-Tools

[IMG]

Giới thiệu Google OR-Tools

OR-Tools là 1 phần mềm mã nguồn mở do Google phát triển, dùng để giải quyết các bài toán tối ưu hóa tổ hợp, nhằm tìm kiếm lời giải tốt nhất cho 1 bài toán trong số rất nhiều lời giải khả thi.

Dưới đây là 1 số bài toán mà OR-Tools giải quyết:

Lộ trình xe (Vehicle routing): Tìm đường đi tối ưu cho xe nhận và giao các đơn hàng có các ràng buộc nhất định
- ...

Google OR-Tools

2.6K

Bui Quang Manh May 20th, 2021 9:56 a.m.

10 phút đọc

Nhận diện biển báo giao thông cùng RepVGG

I. Giới thiệu Bài toán nhận diện biển báo giao thông có lẽ đã vô cùng quen thuộc với mọi người rồi. Và mục đích chủ yếu bài viết hôm nay của mình cũng không phải để giải quyết bài toán này mà thông qua bài viết này mình sẽ giải thích chi tiết các mô đun trong mô hìnhcó phần code ví dụ. Mình hy vọng các bạn qua đây có thể hiểu rõ hơn về mô hình RepVGG cũng như sử dụng nó trong các bài toán thực ...

Deep Learning Traffic Sign Recognition

6.4K

Nguyen Thanh Huyen May 20th, 2021 9:30 a.m.

10 phút đọc

Tìm hiểu bài toán OCR với CRNN và CTC loss - OCR from scratch with PyTorch (P1)

Bài viết bao gồm những kiến thức cơ bản của bản thân mình trong bài toán OCR. Hi vọng có thể cung cấp cho các bạn beginner một tutorial khởi đầu dễ hiểu và đầy đủ nhất. Bắt đầu nhé.

Kiến thức cần có trước khi đọc bài: CNN, RNN.

OCR là gì ? OCR (Optical Character Recognition) là bài toán nhận dạng kí tự quang học.

Yêu cầu đặt ra là phải chuyển những hình ảnh văn bản kỹ thuật số hoặc văn bản...

ocr

4.8K

Bui Tien Tung May 17th, 2021 5:31 p.m.

12 phút đọc

Pytorch - Một số tips hay, tối ưu cho quá trình huấn luyện model của bạn

Xin chào các bạn, cũng lâu rồi mình mới quay trở lại ngồi viết mấy bài chia sẻ trên viblo. Chẹp, dạo này làm remote nên lười vận động, lười cả viết bài hẳn. Tuy nhiên thì sau bài này mình cũng sẽ cố ra thêm 2 bài nữa để hưởng ứng May Fest với mọi người cho xôm nào

Âu kây, quay trở lại với chủ đề của bài viết hôm nay, mình muốn chia sẻ về 1 thứ gì đó mới mẻ hơn 1 chút, dù sao thì lí thuyết,...

PyTorch Machine Learning Deep Learning Tips&Trick

1.5K

Việt Hoàng May 16th, 2021 4:32 a.m.

12 phút đọc

Triển khai các mô hình với OpenVINO

[IMG]

I. Giới thiệu Xin chào các bạn và lại là mình đây, trong thời gian gần đây mình có tìm hiểu về cách triển khai các mô hình deep learning trên các thiết bị Edge và trong bài viết lần trước mình có giới thiệu tới mọi người bài viết về Hướng dẫn convert Pytorch sang TF Lite các bạn nên đọc qua bài viết này của mình để có thể hiểu được các chuyển đổi mô hình từ Pytorch sang định dạng ONNX như thế ...

Computer Vision Machine Learning Deep Learing

713

Nguyen Viet Hoai May 15th, 2021 4:58 p.m.

11 phút đọc

[Text Spotting] ABCNet: Real-time Scene Text Spotting with Adaptive Bezier-Curve Network

Giới thiệu Ở bài trước về paper FOTS, chắc hẳn bạn đã có cái nhìn tổng quan về các mô hình text spotting. Hầu hết đều sử dụng chung một mạng CNN, sau đó đưa qua một mạng phát hiện vật thể (ở đây có thể cho mô hình học theo tọa độ box, hay phân đoạn kí tự để phát hiện box chứa text , ... ). Tiếp đến sử dụng một phương pháp để trích xuất ra các vùng thích nghi (có rất nhiều phương pháp và là mấu...

Text spotting