Image Cover
Avatar

Sun* AI Research Team

level partner

Nhà sáng tạo nội dung hạng Bạc

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Bài viết được ghim

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
14.1K
57
28 8

Tất cả bài viết

Thumbnail Image
351
5
0 0
Avatar Nguyen Dinh Thien thg 5 21, 2021 8:19 SA
7 phút đọc

Autocorrect

I. Autocorrect là gì? Autocorrect (Tự động sửa 😄) là việc điện thoại, máy tính bảng và máy tính tự sửa chữa những từ sai chính tả khi người dùng đang gõ văn bản hoặc nhắn tin, .v.v. Ví dụ:

Như minh họa ở trên, từ "nao" đã được gợi ý thành "nào" hoặc "bảo", còn từ "gi" được gợi ý thành "gì" hoặc "giấy".

II. Các bước thực hiện Để triển khai autocorrect, chúng ta cần thực hiện các bước sau:

  • ...
Thumbnail Image
4.5K
18
13 4
Avatar Chung Pham Van thg 5 20, 2021 10:01 SA
10 phút đọc

Không còn đau đầu với thuật toán phức tạp vì đã có Google OR-Tools

[IMG]

Giới thiệu Google OR-Tools

OR-Tools là 1 phần mềm mã nguồn mở do Google phát triển, dùng để giải quyết các bài toán tối ưu hóa tổ hợp, nhằm tìm kiếm lời giải tốt nhất cho 1 bài toán trong số rất nhiều lời giải khả thi.

Dưới đây là 1 số bài toán mà OR-Tools giải quyết:

  • Lộ trình xe (Vehicle routing): Tìm đường đi tối ưu cho xe nhận và giao các đơn hàng có các ràng buộc nhất định

    • ...
Thumbnail Image
2.4K
25
14 5
Avatar Bui Quang Manh thg 5 20, 2021 9:56 SA
10 phút đọc

Nhận diện biển báo giao thông cùng RepVGG

I. Giới thiệu Bài toán nhận diện biển báo giao thông có lẽ đã vô cùng quen thuộc với mọi người rồi. Và mục đích chủ yếu bài viết hôm nay của mình cũng không phải để giải quyết bài toán này mà thông qua bài viết này mình sẽ giải thích chi tiết các mô đun trong mô hìnhcó phần code ví dụ. Mình hy vọng các bạn qua đây có thể hiểu rõ hơn về mô hình RepVGG cũng như sử dụng nó trong các bài toán thực ...

Thumbnail Image
5.2K
26
8 4
Avatar Nguyen Thanh Huyen thg 5 20, 2021 9:30 SA
10 phút đọc

Tìm hiểu bài toán OCR với CRNN và CTC loss - OCR from scratch with PyTorch (P1)

Bài viết bao gồm những kiến thức cơ bản của bản thân mình trong bài toán OCR. Hi vọng có thể cung cấp cho các bạn beginner một tutorial khởi đầu dễ hiểu và đầy đủ nhất. Bắt đầu nhé.

Kiến thức cần có trước khi đọc bài: CNN, RNN.

  1. OCR là gì ? OCR (Optical Character Recognition) là bài toán nhận dạng kí tự quang học.

Yêu cầu đặt ra là phải chuyển những hình ảnh văn bản kỹ thuật số hoặc văn bản...

Thumbnail Image
4.1K
30
16 5
Avatar Bui Tien Tung thg 5 17, 2021 5:31 CH
12 phút đọc

Pytorch - Một số tips hay, tối ưu cho quá trình huấn luyện model của bạn

Xin chào các bạn, cũng lâu rồi mình mới quay trở lại ngồi viết mấy bài chia sẻ trên viblo. Chẹp, dạo này làm remote nên lười vận động, lười cả viết bài hẳn. Tuy nhiên thì sau bài này mình cũng sẽ cố ra thêm 2 bài nữa để hưởng ứng May Fest với mọi người cho xôm nào 😄

Âu kây, quay trở lại với chủ đề của bài viết hôm nay, mình muốn chia sẻ về 1 thứ gì đó mới mẻ hơn 1 chút, dù sao thì lí thuyết,...

Thumbnail Image
1.2K
10
2 1
Avatar Việt Hoàng thg 5 16, 2021 4:32 SA
12 phút đọc

Triển khai các mô hình với OpenVINO

[IMG]

I. Giới thiệu Xin chào các bạn và lại là mình đây, trong thời gian gần đây mình có tìm hiểu về cách triển khai các mô hình deep learning trên các thiết bị Edge và trong bài viết lần trước mình có giới thiệu tới mọi người bài viết về Hướng dẫn convert Pytorch sang TF Lite các bạn nên đọc qua bài viết này của mình để có thể hiểu được các chuyển đổi mô hình từ Pytorch sang định dạng ONNX như thế ...

Thumbnail Image
657
8
3 0
Avatar Nguyen Viet Hoai thg 5 15, 2021 4:58 CH
11 phút đọc

[Text Spotting] ABCNet: Real-time Scene Text Spotting with Adaptive Bezier-Curve Network

Giới thiệu Ở bài trước về paper FOTS, chắc hẳn bạn đã có cái nhìn tổng quan về các mô hình text spotting. Hầu hết đều sử dụng chung một mạng CNN, sau đó đưa qua một mạng phát hiện vật thể (ở đây có thể cho mô hình học theo tọa độ box, hay phân đoạn kí tự để phát hiện box chứa text , ... ). Tiếp đến sử dụng một phương pháp để trích xuất ra các vùng thích nghi (có rất nhiều phương pháp và là mấu...

Thumbnail Image
956
10
3 0
Avatar Nguyen Dinh Thien thg 5 15, 2021 9:39 SA
7 phút đọc

[NLP] Tổng quan về Word Representation

I. Word representation là gì ?

Word representation (biểu diễn từ) là nhiệm vụ tối quan trọng trong NLP (Natural Language Processing). Nó là một trong những basic buildings blocks trong NLP, đặc biệt với neural networks. Nó có ảnh hưởng đáng kể đến những mô hình Deep learning hiện nay. Trong bài viết này, mình sẽ giới thiệu đến mọi người một số cách tiếp cận để biểu diễn từ và đi sâu vào dist...

Thumbnail Image
945
11
1 2
Avatar Cao Minh Hiếu thg 5 13, 2021 5:32 SA
8 phút đọc

[OCR] Nhận dạng biểu thức toán học viết tay với Dense + MSA

I. Giới thiệu

Để mô tả các vấn đề trong toán học, vật lý, biểu thức toán học là vô cùng cần thiết. Cùng với sự trừu tượng của kiến thức, các biểu thức toán học cũng vô cùng trừu tượng đối với học máy với những khó khăn như: cấu trúc 2 chiều của biểu thức, sự khó khăn tự nhiên khi nhận dạng chữ viết tay và các biến thể của kí tự toán học.

Nhận dạng chữ viết tay bao gồm 2 vấn đề chính:

  • Nhận d...
Thumbnail Image
4.5K
37
17 10
Avatar Bui Quang Manh thg 5 12, 2021 4:23 SA
9 phút đọc

Những mô hình trợ thủ đắc lực trong các mô hình Deep learning [Phần 1]

I. Giới thiệu Khi làm việc với các bài toán về computer vision, chúng ta đã quá quen với các mô hình như ResNet, InceptionNet, EfficientNet, .... Các mô hình này thường đóng vai trò như một bộ trích xuất đặc trưng từ đầu vào. Có thể ví von rằng, làm một bài toán computer vision như tham gia vào một cuộc đọ súng. Trong đó hàm loss chính là quân địch, diệt càng nhiều càng tốt. Quân ta bao gồm lự...

Thumbnail Image
2.3K
4
3 0
Avatar Nguyen Viet Anh thg 5 8, 2021 5:19 CH
8 phút đọc

Một vài phương pháp tiền xử lý tín hiệu âm thanh

Giới thiệu Tiền xử lý dữ liệu tín hiệu nói chung và dữ liệu âm thanh nói riêng đóng vai trò cực kỳ quan trọng trong bất cứ một phương pháp học máy nào. Các mô hình học sâu cho tín hiệu âm thanh rất nhạy cảm với dữ liệu đầu vào, vì vậy bước làm sạch dữ liệu đầu vào sẽ quyết định hiệu suất mô hình tốt hay kém. Trong bài này mình sẽ giới thiệu một vài phương pháp tiền xử lý cho tín hiệu âm thanh. ...

Thumbnail Image
1.0K
4
2 1
Avatar Nguyen Viet Anh thg 5 8, 2021 5:18 CH
7 phút đọc

Audio Features: Đặc trưng Cepstral

Nếu như Spectral (spectrum, phổ tín hiệu) có được bằng cách thực hiện biến đổi Fourier rời rạc (DFT) thì đặc trưng Cepstral có được bằng cách biến đổi DFT (hoặc DCT) spectrum của tín hiệu đó. Các đặc trưng cepstral như Mel-frequency cepstral coefficients (MFCC) được sử dụng rộng rãi trong các bài toán xử lý tiếng nói vì tính trực quan của nó. Trong bài này mình sẽ giới thiệu hai đặc trưng cepst...

Thumbnail Image
1.0K
5
2 0
Avatar Nguyen Viet Anh thg 5 8, 2021 5:18 CH
7 phút đọc

Audio Features: Đặc trưng Spectral

Phổ Fourier (Fourier Spectrum) của một tín hiệu cho thấy nội dung tín hiệu đó trong miền tần số. Điều này làm cho phổ (Spectrum) trở thành một miền dễ chịu để làm việc bởi vì ta có thể kiểm tra các tín hiệu một cách trực quan. Trong thực tế, ta làm việc với các tín hiệu thời gian rời rạc, sao cho biến đổi miền thời gian-tần số tương ứng là biến đổi Fourier rời rạc. Phép biến đổi này ánh xạ tín...

Thumbnail Image
697
8
2 0
Avatar Pham Thi Hong Anh thg 5 8, 2021 3:37 CH
5 phút đọc

Visualize data với Altair trong Python

Xin chào mọi người hôm nay mình sẽ viết bài viết với chủ đề khá quen thuộc mà mình hay viết đó là: Data Visualization, ở những bài viết trước mình đã viết về Plotly, Cutecharts,... ở bài viết này mình sẽ thử với Lib để trực quan hóa dữ liệu mới: Altair. Altair là một thư viện trực quan hóa khai báo thống kê sử dụng với ngôn ngữ lập trình Python, dựa trên Vega và Vega-Lite. Thư viện này cung cấp...

Thumbnail Image
4.9K
18
8 0
Avatar Chung Pham Van thg 5 8, 2021 2:08 CH
11 phút đọc

GRU - Mạng Neural hồi tiếp với nút có cổng

  1. Mô hình ngôn ngữ Dữ liệu chuỗi là dạng dữ liệu mang có ý nghĩa và mang tính chất tuần tự, như: Âm nhạc, giọng nói, văn bản, phim ảnh, bước đi, ... Nếu chúng ta hoán vị chúng, chúng sẽ không còn mang nhiều ý nghĩa, ví dụ như tiêu đề 'Vợ chồng tỷ phú Bill Gates vừa ly hôn sau gần 30 năm bên nhau' thì mang nhiều ý nghĩa hơn tiêu đề 'Ly hôn tỷ phú vợ chồng Bill Gates sau gần 30 năm bên nhau'.

D...

Thumbnail Image
3.8K
49
20 3
Avatar Bui Quang Manh thg 5 8, 2021 11:24 SA
15 phút đọc

RepVGG - Sự trở lại của một tượng đài

I. Giới thiệu VGG - mô hình học sâu được đề xuất bởi K. Simonyan and A. Zisserman trong bài báo Very Deep Convolutional Networks for Large-Scale Image Recognition”. Khi xuất hiện mô hình này đã nhanh chóng chứng tỏ sức mạnh của mình vượt qua mô hình sota trước đó là AlexNet trên tập ImageNet. Tuy nhiên về sau khi các mô hình ngày càng phát triển sâu hơn phức tạp hơn, VGG đã lộ ra rất nhiều điểm...

Thumbnail Image
2.9K
11
2 2
Avatar Việt Hoàng thg 5 7, 2021 12:04 CH
6 phút đọc

Hướng dẫn convert Pytorch sang TF Lite

[IMG]

I. Giới thiệu Xin chào các bạn lâu lắm rồi mình mới ngóc lại sau một thời gian khá dài không chia sẻ bất cứ bài viết nào trên Viblo cả, kể cũng hơi buồn và nhớ viết lách. Một phần lý do là do mình lười và cũng không biết chọn chủ đề gì để chia sẻ tới mọi người, phần vì gần đây mình tham gia mấy cuộc thi nên cũng hơi bận thành ra lười hơn 😃

Như các bạn cũng biết rồi đó hiện nay các ứng dụng A...

Thumbnail Image
2.1K
12
5 0
Avatar Hieu Bui thg 5 7, 2021 8:08 SA
6 phút đọc

Một số cải tiến của cross-entropy loss cho Face Recognition

Introduction Bài toán face recognition trong vài năm trở lại đây đã đạt dược nhiều bước tiến lớn nhờ vào sự phát triển của học sâu (Deep learning), mà cụ thể hơn là mạng neural tích chập (Convolutional neural network - CNN). Các phương pháp deep learning based hầu hết dựa vào mạng CNN để trích xuất ra một vector đặc trưng đại diện cho một khuôn mặt gọi là vector face embedding. Các vector này...

Thumbnail Image
2.6K
28
4 1
Avatar Trần Đức Trung thg 5 7, 2021 7:02 SA
15 phút đọc

MLP-Mixer - Hướng giải quyết các bài toán Computer Vision mới bên cạnh CNN và Transformer

Có thể nói rằng Convolutional Neural Network hay CNN đã và đang được cho là mô hình vô cùng phù hợp cho thị giác máy tính. Bên cạnh đó các mạng dựa trên cơ chế attention, chẳng hạn như Vision Transformer, cũng dần được quan tâm và sử dụng nhiều hơn. Tuy vậy trong paper mới được publish của mình với tên gọi MLP-Mixer: An all-MLP Architecture for Vision, nhóm Google Brain ở Zurich và Berlin đã t...

Thumbnail Image
2.0K
18
6 1
Avatar Thao Hoang Thu thg 4 20, 2021 2:35 SA
19 phút đọc

Tìm hiểu về Text Steganography

[IMG]

  1. Steganography là gì ?

Nếu là một fan trinh thám hay các văn hóa phẩm về điệp viên, chắc hẳn bạn không còn lạ gì với việc truyền tin bằng những đoạn tin quảng cáo tưởng như rất bình thường trên báo, với mật mã "hình nhân nhảy múa" trong Sherlock Holmes, hay gần gũi nhất là hồi nhỏ chúng ta thử nghiệm mực vô hình: dùng nước chanh viết lên giấy, đợi khô rồi hơ nóng, thông điệp viết bằng nước ...

Thành viên nổi bật
Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí