Image Cover
Avatar

Sun* AI Research Team

level partner

Nhà sáng tạo nội dung hạng Bạc

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Bài viết được ghim

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
13.3K
56
24 8

Tất cả bài viết

Thumbnail Image
2.9K
10
1 0
Avatar Nguyen Dinh Thien thg 6 4, 2021 2:36 CH
13 phút đọc

Tổng quan về Neural Machine Translation

Machine Translation là gì? Machine Translation(MT) là nhiệm vụ dịch một đoạn văn bản từ ngôn ngữ nguồn(source language) sang một ngôn ngữ đích(target language). Đơn giản như lúc ta bật google dịch lên rồi dịch câu tiếng Nhật: ’皆さん、おはようございます’。Ta được câu tiếng Việt là: "Chào buổi sáng tất cả mọi người".

Lịch sử của Machine Translation Machine Translation bắt đầu được nghiên cứu từ những năm 50 ...

Thumbnail Image
2.5K
38
15 9
Avatar Bui Tien Tung thg 5 31, 2021 4:40 CH
30 phút đọc

CenterNet - CenterTrack - TraDeS: Từ object detection đến multiple object tracking

  1. Mở đầu Xin chào các bạn, mình lại quay trở lại sau ... 2 ngày không ra bài mới 😄. Còn ngày cuối cùng của sự kiện MayFest nên mình cũng cố gắng viết cho kịp thêm bài nữa để hưởng ứng trọn vẹn sự kiện như lời đã nói, cũng nhân dịp chia sẻ phần tìm hiểu khá hay ho gần đây của mình. Hm nay lại tiếp tục là một chủ đề mà mình chưa từng viết qua trước đây: Paper Explain

IEEE Conference on Compute...

Thumbnail Image
2.1K
4
1 0
Avatar Nguyen Viet Hoai thg 5 30, 2021 3:36 CH
5 phút đọc

Hướng dẫn lưu video từ luồng camera sử dụng tkinter và opencv

Ở bài viết này thì mình sẽ hướng dẫn các bạn thiết kế 1 chương trình đơn giản để có thể show luồng camera từ máy tính hoặc luồng rtsp, sau đó có thể lưu video theo bao nhiêu giây đó tùy các bạn. Ở bài viết này mình sẽ sử dụng thư viện tkinter để làm giao diện và opencv để đọc luồng video và xử lí frame và xuất ra video. Không luyên thuyên nữa mình sẽ đi vào phần hướng dẫn tạo chương trình luôn ...

Thumbnail Image
2.8K
7
0 1
Avatar Nguyen Viet Hoai thg 5 30, 2021 10:54 SA
14 phút đọc

[Domain adaptation - P1] Tổng quan về kỹ thuật transfer learning và domain adaptation

Giới thiệu

Transfer learning là một kỹ thuật rất hay trong lĩnh vực học sâu, nhờ đó chúng ta có thể giải quyết một nhiệm vụ mới với kiến thức thu được từ một nhiệm vụ cũ để giải quyết việc thiếu dữ liệu được gắn nhãn. Đặc biệt, deep domain adaptation (một nhánh của transfer learning) được chú ý nhiều nhất trong các bài báo gần đây. Các mạng nơ-ron sâu thường có số lượng tham số lớn để học cách...

Thumbnail Image
31.0K
83
31 7
Avatar Bui Tien Tung thg 5 28, 2021 10:47 SA
21 phút đọc

Gradient Boosting - Tất tần tật về thuật toán mạnh mẽ nhất trong Machine Learning

Xin chào các bạn, sau 1 thời gian vắng bóng vì cạn ý tưởng viết bài và cũng cảm thấy bản thân chưa làm được điều gì nên hồn để chia sẻ, mình đã quay trở lại với Viblo để viết về một chủ đề không mới, về một thuật toán không mới, tuy nhiên không phải ai cũng hoàn toàn hiểu được và vận dụng được nó : Gradient Boosting.

Ý tưởng để gợi lên mình viết bài viết này có lẽ bắt nguồn từ bài viết Ensembl...

Thumbnail Image
3.0K
11
0 1
Avatar Thao Hoang Thu thg 5 26, 2021 9:49 SA
13 phút đọc

Phân tích nội dung và tạo đám mây từ khóa (word cloud) từ đoạn văn bản tiếng Nhật

Chắc hẳn là khái niệm đám mây từ khóa (word cloud) đã không còn xa lạ gì trong thời đại thông tin số bùng nổ như ngày nay. Chúng ta thường thấy nó xuất hiện trên các bài báo, công cụ tìm kiếm, thể hiện những từ khóa được tìm kiếm nhiều nhất hoặc là chủ đề của một nội dung nào đó.

Đám mây từ khóa hoặc đám mây thẻ (tag cloud) là biểu diễn dưới dạng đồ họa của tần suất xuất hiện của các từ, qua đ...

Thumbnail Image
8.8K
10
2 0
Avatar Cao Minh Hiếu thg 5 25, 2021 11:19 SA
3 phút đọc

Data visualization với Seaborn

Trong bài viết này mình giới thiệu với mọi người các biểu đồ mình hay dùng để visualize dữ liệu bằng seaborn.

Vì là intro nên để hiểu rõ hơn ý nghĩa của từng biểu đồ, mọi người có thể đọc thêm tại series data visualization của anh Ngọc tại đây và của anh Khánh tại đây

I. Seaborn vs Matplotlib

Seaborn là mở rộng của matplotlib, có nghĩa là seaborn kế thừa từ matplotlib và cũng chính vì vậy, s...

Thumbnail Image
8.4K
17
12 1
Avatar Chung Pham Van thg 5 23, 2021 10:48 SA
5 phút đọc

Kỹ thuật Dropout (Bỏ học) trong Deep Learning

[IMG]

Trong bài viết này, mình xin phép giới thiệu về Dropout (Bỏ học) trong mạng Neural, sau đó là mình sẽ có 1 số đoạn code để xem Dropout ảnh hưởng thế nào đến hiệu suất của mạng Neural.

  1. Lý thuyết 1.1. Dropout trong mạng Neural là gì Theo Wikipedia) - Thuật ngữ 'Dropout' đề cập đến việc bỏ qua các đơn vị (units) ẩn và hiện trong 1 mạng Neural.

Hiểu 1 cách đơn giản thì Dropout là việc bỏ qua c...

Thumbnail Image
3.2K
33
15 10
Avatar Bui Quang Manh thg 5 23, 2021 1:53 SA
8 phút đọc

Tạo dữ liệu cho bài toán OCR Tiếng Việt trong 5 bước.

Bài toán OCR hay nhận dạng chữ Tiếng Việt đã không còn xa lạ và đã được ứng dụng vào rất nhiều cuộc sống như ứng dụng trích xuất thông tin văn bản, số hóa dữ liệu, ... đã thu được rất nhiều thành quả đáng kinh ngạc. Và bài toán OCR cũng là một chủ đề có độ khó vừa phải để những người mới bắt đầu cũng có thể học, nghiên cứu thu thập nhiều kiến thức mới. Tuy nhiên làm sao để chúng ta tạo được nhữ...

Thumbnail Image
2.2K
10
0 0
Avatar Trần Đức Trung thg 5 21, 2021 10:22 SA
22 phút đọc

Một số hàm mất mát sử dụng cho Object Detection

Object Detection hay phát hiện đối tượng là một trong các tác vụ chính được quan tâm nhiều nhất của thị giác máy, thường hướng tới việc phát hiện các thể hiện của các đối tượng của một lớp nhất định trong một ảnh. Trong suốt thời gian nghiên cứu xung quanh tác vụ này có rất nhiều mô hình và các thành phần bổ trợ như hàm mất mát được đề xuất cũng như không ngừng được cải tiến. Bài viết này liệt ...

Thumbnail Image
334
5
0 0
Avatar Nguyen Dinh Thien thg 5 21, 2021 8:19 SA
7 phút đọc

Autocorrect

I. Autocorrect là gì? Autocorrect (Tự động sửa 😄) là việc điện thoại, máy tính bảng và máy tính tự sửa chữa những từ sai chính tả khi người dùng đang gõ văn bản hoặc nhắn tin, .v.v. Ví dụ:

Như minh họa ở trên, từ "nao" đã được gợi ý thành "nào" hoặc "bảo", còn từ "gi" được gợi ý thành "gì" hoặc "giấy".

II. Các bước thực hiện Để triển khai autocorrect, chúng ta cần thực hiện các bước sau:

  • ...
Thumbnail Image
4.2K
17
13 4
Avatar Chung Pham Van thg 5 20, 2021 10:01 SA
10 phút đọc

Không còn đau đầu với thuật toán phức tạp vì đã có Google OR-Tools

[IMG]

Giới thiệu Google OR-Tools

OR-Tools là 1 phần mềm mã nguồn mở do Google phát triển, dùng để giải quyết các bài toán tối ưu hóa tổ hợp, nhằm tìm kiếm lời giải tốt nhất cho 1 bài toán trong số rất nhiều lời giải khả thi.

Dưới đây là 1 số bài toán mà OR-Tools giải quyết:

  • Lộ trình xe (Vehicle routing): Tìm đường đi tối ưu cho xe nhận và giao các đơn hàng có các ràng buộc nhất định

    • ...
Thumbnail Image
2.4K
25
14 5
Avatar Bui Quang Manh thg 5 20, 2021 9:56 SA
10 phút đọc

Nhận diện biển báo giao thông cùng RepVGG

I. Giới thiệu Bài toán nhận diện biển báo giao thông có lẽ đã vô cùng quen thuộc với mọi người rồi. Và mục đích chủ yếu bài viết hôm nay của mình cũng không phải để giải quyết bài toán này mà thông qua bài viết này mình sẽ giải thích chi tiết các mô đun trong mô hìnhcó phần code ví dụ. Mình hy vọng các bạn qua đây có thể hiểu rõ hơn về mô hình RepVGG cũng như sử dụng nó trong các bài toán thực ...

Thumbnail Image
5.0K
26
7 4
Avatar Nguyen Thanh Huyen thg 5 20, 2021 9:30 SA
10 phút đọc

Tìm hiểu bài toán OCR với CRNN và CTC loss - OCR from scratch with PyTorch (P1)

Bài viết bao gồm những kiến thức cơ bản của bản thân mình trong bài toán OCR. Hi vọng có thể cung cấp cho các bạn beginner một tutorial khởi đầu dễ hiểu và đầy đủ nhất. Bắt đầu nhé.

Kiến thức cần có trước khi đọc bài: CNN, RNN.

  1. OCR là gì ? OCR (Optical Character Recognition) là bài toán nhận dạng kí tự quang học.

Yêu cầu đặt ra là phải chuyển những hình ảnh văn bản kỹ thuật số hoặc văn bản...

Thumbnail Image
3.9K
30
16 5
Avatar Bui Tien Tung thg 5 17, 2021 5:31 CH
12 phút đọc

Pytorch - Một số tips hay, tối ưu cho quá trình huấn luyện model của bạn

Xin chào các bạn, cũng lâu rồi mình mới quay trở lại ngồi viết mấy bài chia sẻ trên viblo. Chẹp, dạo này làm remote nên lười vận động, lười cả viết bài hẳn. Tuy nhiên thì sau bài này mình cũng sẽ cố ra thêm 2 bài nữa để hưởng ứng May Fest với mọi người cho xôm nào 😄

Âu kây, quay trở lại với chủ đề của bài viết hôm nay, mình muốn chia sẻ về 1 thứ gì đó mới mẻ hơn 1 chút, dù sao thì lí thuyết,...

Thumbnail Image
1.1K
9
2 0
Avatar Việt Hoàng thg 5 16, 2021 4:32 SA
12 phút đọc

Triển khai các mô hình với OpenVINO

[IMG]

I. Giới thiệu Xin chào các bạn và lại là mình đây, trong thời gian gần đây mình có tìm hiểu về cách triển khai các mô hình deep learning trên các thiết bị Edge và trong bài viết lần trước mình có giới thiệu tới mọi người bài viết về Hướng dẫn convert Pytorch sang TF Lite các bạn nên đọc qua bài viết này của mình để có thể hiểu được các chuyển đổi mô hình từ Pytorch sang định dạng ONNX như thế ...

Thumbnail Image
648
8
3 0
Avatar Nguyen Viet Hoai thg 5 15, 2021 4:58 CH
11 phút đọc

[Text Spotting] ABCNet: Real-time Scene Text Spotting with Adaptive Bezier-Curve Network

Giới thiệu Ở bài trước về paper FOTS, chắc hẳn bạn đã có cái nhìn tổng quan về các mô hình text spotting. Hầu hết đều sử dụng chung một mạng CNN, sau đó đưa qua một mạng phát hiện vật thể (ở đây có thể cho mô hình học theo tọa độ box, hay phân đoạn kí tự để phát hiện box chứa text , ... ). Tiếp đến sử dụng một phương pháp để trích xuất ra các vùng thích nghi (có rất nhiều phương pháp và là mấu...

Thumbnail Image
901
10
3 0
Avatar Nguyen Dinh Thien thg 5 15, 2021 9:39 SA
7 phút đọc

[NLP] Tổng quan về Word Representation

I. Word representation là gì ?

Word representation (biểu diễn từ) là nhiệm vụ tối quan trọng trong NLP (Natural Language Processing). Nó là một trong những basic buildings blocks trong NLP, đặc biệt với neural networks. Nó có ảnh hưởng đáng kể đến những mô hình Deep learning hiện nay. Trong bài viết này, mình sẽ giới thiệu đến mọi người một số cách tiếp cận để biểu diễn từ và đi sâu vào dist...

Thumbnail Image
903
11
1 2
Avatar Cao Minh Hiếu thg 5 13, 2021 5:32 SA
8 phút đọc

[OCR] Nhận dạng biểu thức toán học viết tay với Dense + MSA

I. Giới thiệu

Để mô tả các vấn đề trong toán học, vật lý, biểu thức toán học là vô cùng cần thiết. Cùng với sự trừu tượng của kiến thức, các biểu thức toán học cũng vô cùng trừu tượng đối với học máy với những khó khăn như: cấu trúc 2 chiều của biểu thức, sự khó khăn tự nhiên khi nhận dạng chữ viết tay và các biến thể của kí tự toán học.

Nhận dạng chữ viết tay bao gồm 2 vấn đề chính:

  • Nhận d...
Thumbnail Image
4.3K
37
17 10
Avatar Bui Quang Manh thg 5 12, 2021 4:23 SA
9 phút đọc

Những mô hình trợ thủ đắc lực trong các mô hình Deep learning [Phần 1]

I. Giới thiệu Khi làm việc với các bài toán về computer vision, chúng ta đã quá quen với các mô hình như ResNet, InceptionNet, EfficientNet, .... Các mô hình này thường đóng vai trò như một bộ trích xuất đặc trưng từ đầu vào. Có thể ví von rằng, làm một bài toán computer vision như tham gia vào một cuộc đọ súng. Trong đó hàm loss chính là quân địch, diệt càng nhiều càng tốt. Quân ta bao gồm lự...

Thành viên nổi bật
Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí