Bài viết được ghim
Độ hot của Langchain
Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...
Tất cả bài viết
I. Autocorrect là gì? Autocorrect (Tự động sửa ) là việc điện thoại, máy tính bảng và máy tính tự sửa chữa những từ sai chính tả khi người dùng đang gõ văn bản hoặc nhắn tin, .v.v. Ví dụ:
Như minh họa ở trên, từ "nao" đã được gợi ý thành "nào" hoặc "bảo", còn từ "gi" được gợi ý thành "gì" hoặc "giấy".
II. Các bước thực hiện Để triển khai autocorrect, chúng ta cần thực hiện các bước sau:
- ...
[IMG]
Giới thiệu Google OR-Tools
OR-Tools là 1 phần mềm mã nguồn mở do Google phát triển, dùng để giải quyết các bài toán tối ưu hóa tổ hợp, nhằm tìm kiếm lời giải tốt nhất cho 1 bài toán trong số rất nhiều lời giải khả thi.
Dưới đây là 1 số bài toán mà OR-Tools giải quyết:
-
Lộ trình xe (Vehicle routing): Tìm đường đi tối ưu cho xe nhận và giao các đơn hàng có các ràng buộc nhất định
- ...
I. Giới thiệu Bài toán nhận diện biển báo giao thông có lẽ đã vô cùng quen thuộc với mọi người rồi. Và mục đích chủ yếu bài viết hôm nay của mình cũng không phải để giải quyết bài toán này mà thông qua bài viết này mình sẽ giải thích chi tiết các mô đun trong mô hìnhcó phần code ví dụ. Mình hy vọng các bạn qua đây có thể hiểu rõ hơn về mô hình RepVGG cũng như sử dụng nó trong các bài toán thực ...
Bài viết bao gồm những kiến thức cơ bản của bản thân mình trong bài toán OCR. Hi vọng có thể cung cấp cho các bạn beginner một tutorial khởi đầu dễ hiểu và đầy đủ nhất. Bắt đầu nhé.
Kiến thức cần có trước khi đọc bài: CNN, RNN.
- OCR là gì ? OCR (Optical Character Recognition) là bài toán nhận dạng kí tự quang học.
Yêu cầu đặt ra là phải chuyển những hình ảnh văn bản kỹ thuật số hoặc văn bản...
Xin chào các bạn, cũng lâu rồi mình mới quay trở lại ngồi viết mấy bài chia sẻ trên viblo. Chẹp, dạo này làm remote nên lười vận động, lười cả viết bài hẳn. Tuy nhiên thì sau bài này mình cũng sẽ cố ra thêm 2 bài nữa để hưởng ứng May Fest với mọi người cho xôm nào
Âu kây, quay trở lại với chủ đề của bài viết hôm nay, mình muốn chia sẻ về 1 thứ gì đó mới mẻ hơn 1 chút, dù sao thì lí thuyết,...
[IMG]
I. Giới thiệu Xin chào các bạn và lại là mình đây, trong thời gian gần đây mình có tìm hiểu về cách triển khai các mô hình deep learning trên các thiết bị Edge và trong bài viết lần trước mình có giới thiệu tới mọi người bài viết về Hướng dẫn convert Pytorch sang TF Lite các bạn nên đọc qua bài viết này của mình để có thể hiểu được các chuyển đổi mô hình từ Pytorch sang định dạng ONNX như thế ...
Giới thiệu Ở bài trước về paper FOTS, chắc hẳn bạn đã có cái nhìn tổng quan về các mô hình text spotting. Hầu hết đều sử dụng chung một mạng CNN, sau đó đưa qua một mạng phát hiện vật thể (ở đây có thể cho mô hình học theo tọa độ box, hay phân đoạn kí tự để phát hiện box chứa text , ... ). Tiếp đến sử dụng một phương pháp để trích xuất ra các vùng thích nghi (có rất nhiều phương pháp và là mấu...
I. Word representation là gì ?
Word representation (biểu diễn từ) là nhiệm vụ tối quan trọng trong NLP (Natural Language Processing). Nó là một trong những basic buildings blocks trong NLP, đặc biệt với neural networks. Nó có ảnh hưởng đáng kể đến những mô hình Deep learning hiện nay. Trong bài viết này, mình sẽ giới thiệu đến mọi người một số cách tiếp cận để biểu diễn từ và đi sâu vào dist...
I. Giới thiệu
Để mô tả các vấn đề trong toán học, vật lý, biểu thức toán học là vô cùng cần thiết. Cùng với sự trừu tượng của kiến thức, các biểu thức toán học cũng vô cùng trừu tượng đối với học máy với những khó khăn như: cấu trúc 2 chiều của biểu thức, sự khó khăn tự nhiên khi nhận dạng chữ viết tay và các biến thể của kí tự toán học.
Nhận dạng chữ viết tay bao gồm 2 vấn đề chính:
- Nhận d...
I. Giới thiệu Khi làm việc với các bài toán về computer vision, chúng ta đã quá quen với các mô hình như ResNet, InceptionNet, EfficientNet, .... Các mô hình này thường đóng vai trò như một bộ trích xuất đặc trưng từ đầu vào. Có thể ví von rằng, làm một bài toán computer vision như tham gia vào một cuộc đọ súng. Trong đó hàm loss chính là quân địch, diệt càng nhiều càng tốt. Quân ta bao gồm lự...
Giới thiệu Tiền xử lý dữ liệu tín hiệu nói chung và dữ liệu âm thanh nói riêng đóng vai trò cực kỳ quan trọng trong bất cứ một phương pháp học máy nào. Các mô hình học sâu cho tín hiệu âm thanh rất nhạy cảm với dữ liệu đầu vào, vì vậy bước làm sạch dữ liệu đầu vào sẽ quyết định hiệu suất mô hình tốt hay kém. Trong bài này mình sẽ giới thiệu một vài phương pháp tiền xử lý cho tín hiệu âm thanh. ...
Nếu như Spectral (spectrum, phổ tín hiệu) có được bằng cách thực hiện biến đổi Fourier rời rạc (DFT) thì đặc trưng Cepstral có được bằng cách biến đổi DFT (hoặc DCT) spectrum của tín hiệu đó. Các đặc trưng cepstral như Mel-frequency cepstral coefficients (MFCC) được sử dụng rộng rãi trong các bài toán xử lý tiếng nói vì tính trực quan của nó. Trong bài này mình sẽ giới thiệu hai đặc trưng cepst...
Phổ Fourier (Fourier Spectrum) của một tín hiệu cho thấy nội dung tín hiệu đó trong miền tần số. Điều này làm cho phổ (Spectrum) trở thành một miền dễ chịu để làm việc bởi vì ta có thể kiểm tra các tín hiệu một cách trực quan. Trong thực tế, ta làm việc với các tín hiệu thời gian rời rạc, sao cho biến đổi miền thời gian-tần số tương ứng là biến đổi Fourier rời rạc. Phép biến đổi này ánh xạ tín...
Xin chào mọi người hôm nay mình sẽ viết bài viết với chủ đề khá quen thuộc mà mình hay viết đó là: Data Visualization, ở những bài viết trước mình đã viết về Plotly, Cutecharts,... ở bài viết này mình sẽ thử với Lib để trực quan hóa dữ liệu mới: Altair. Altair là một thư viện trực quan hóa khai báo thống kê sử dụng với ngôn ngữ lập trình Python, dựa trên Vega và Vega-Lite. Thư viện này cung cấp...
- Mô hình ngôn ngữ Dữ liệu chuỗi là dạng dữ liệu mang có ý nghĩa và mang tính chất tuần tự, như: Âm nhạc, giọng nói, văn bản, phim ảnh, bước đi, ... Nếu chúng ta hoán vị chúng, chúng sẽ không còn mang nhiều ý nghĩa, ví dụ như tiêu đề 'Vợ chồng tỷ phú Bill Gates vừa ly hôn sau gần 30 năm bên nhau' thì mang nhiều ý nghĩa hơn tiêu đề 'Ly hôn tỷ phú vợ chồng Bill Gates sau gần 30 năm bên nhau'.
D...
I. Giới thiệu VGG - mô hình học sâu được đề xuất bởi K. Simonyan and A. Zisserman trong bài báo Very Deep Convolutional Networks for Large-Scale Image Recognition”. Khi xuất hiện mô hình này đã nhanh chóng chứng tỏ sức mạnh của mình vượt qua mô hình sota trước đó là AlexNet trên tập ImageNet. Tuy nhiên về sau khi các mô hình ngày càng phát triển sâu hơn phức tạp hơn, VGG đã lộ ra rất nhiều điểm...
[IMG]
I. Giới thiệu Xin chào các bạn lâu lắm rồi mình mới ngóc lại sau một thời gian khá dài không chia sẻ bất cứ bài viết nào trên Viblo cả, kể cũng hơi buồn và nhớ viết lách. Một phần lý do là do mình lười và cũng không biết chọn chủ đề gì để chia sẻ tới mọi người, phần vì gần đây mình tham gia mấy cuộc thi nên cũng hơi bận thành ra lười hơn
Như các bạn cũng biết rồi đó hiện nay các ứng dụng A...
Introduction Bài toán face recognition trong vài năm trở lại đây đã đạt dược nhiều bước tiến lớn nhờ vào sự phát triển của học sâu (Deep learning), mà cụ thể hơn là mạng neural tích chập (Convolutional neural network - CNN). Các phương pháp deep learning based hầu hết dựa vào mạng CNN để trích xuất ra một vector đặc trưng đại diện cho một khuôn mặt gọi là vector face embedding. Các vector này...
Có thể nói rằng Convolutional Neural Network hay CNN đã và đang được cho là mô hình vô cùng phù hợp cho thị giác máy tính. Bên cạnh đó các mạng dựa trên cơ chế attention, chẳng hạn như Vision Transformer, cũng dần được quan tâm và sử dụng nhiều hơn. Tuy vậy trong paper mới được publish của mình với tên gọi MLP-Mixer: An all-MLP Architecture for Vision, nhóm Google Brain ở Zurich và Berlin đã t...
[IMG]
- Steganography là gì ?
Nếu là một fan trinh thám hay các văn hóa phẩm về điệp viên, chắc hẳn bạn không còn lạ gì với việc truyền tin bằng những đoạn tin quảng cáo tưởng như rất bình thường trên báo, với mật mã "hình nhân nhảy múa" trong Sherlock Holmes, hay gần gũi nhất là hồi nhỏ chúng ta thử nghiệm mực vô hình: dùng nước chanh viết lên giấy, đợi khô rồi hơ nóng, thông điệp viết bằng nước ...