Image Cover
Avatar

Sun* AI Research Team

level partner

Nhà sáng tạo nội dung hạng Bạc

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Bài viết được ghim

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
13.3K
56
24 8

Tất cả bài viết

Thumbnail Image
2.2K
4
3 0
Avatar Nguyen Viet Anh thg 5 8, 2021 5:19 CH
8 phút đọc

Một vài phương pháp tiền xử lý tín hiệu âm thanh

Giới thiệu Tiền xử lý dữ liệu tín hiệu nói chung và dữ liệu âm thanh nói riêng đóng vai trò cực kỳ quan trọng trong bất cứ một phương pháp học máy nào. Các mô hình học sâu cho tín hiệu âm thanh rất nhạy cảm với dữ liệu đầu vào, vì vậy bước làm sạch dữ liệu đầu vào sẽ quyết định hiệu suất mô hình tốt hay kém. Trong bài này mình sẽ giới thiệu một vài phương pháp tiền xử lý cho tín hiệu âm thanh. ...

Thumbnail Image
1.0K
4
2 1
Avatar Nguyen Viet Anh thg 5 8, 2021 5:18 CH
7 phút đọc

Audio Features: Đặc trưng Cepstral

Nếu như Spectral (spectrum, phổ tín hiệu) có được bằng cách thực hiện biến đổi Fourier rời rạc (DFT) thì đặc trưng Cepstral có được bằng cách biến đổi DFT (hoặc DCT) spectrum của tín hiệu đó. Các đặc trưng cepstral như Mel-frequency cepstral coefficients (MFCC) được sử dụng rộng rãi trong các bài toán xử lý tiếng nói vì tính trực quan của nó. Trong bài này mình sẽ giới thiệu hai đặc trưng cepst...

Thumbnail Image
1.0K
5
2 0
Avatar Nguyen Viet Anh thg 5 8, 2021 5:18 CH
7 phút đọc

Audio Features: Đặc trưng Spectral

Phổ Fourier (Fourier Spectrum) của một tín hiệu cho thấy nội dung tín hiệu đó trong miền tần số. Điều này làm cho phổ (Spectrum) trở thành một miền dễ chịu để làm việc bởi vì ta có thể kiểm tra các tín hiệu một cách trực quan. Trong thực tế, ta làm việc với các tín hiệu thời gian rời rạc, sao cho biến đổi miền thời gian-tần số tương ứng là biến đổi Fourier rời rạc. Phép biến đổi này ánh xạ tín...

Thumbnail Image
687
8
2 0
Avatar Pham Thi Hong Anh thg 5 8, 2021 3:37 CH
5 phút đọc

Visualize data với Altair trong Python

Xin chào mọi người hôm nay mình sẽ viết bài viết với chủ đề khá quen thuộc mà mình hay viết đó là: Data Visualization, ở những bài viết trước mình đã viết về Plotly, Cutecharts,... ở bài viết này mình sẽ thử với Lib để trực quan hóa dữ liệu mới: Altair. Altair là một thư viện trực quan hóa khai báo thống kê sử dụng với ngôn ngữ lập trình Python, dựa trên Vega và Vega-Lite. Thư viện này cung cấp...

Thumbnail Image
4.4K
18
8 0
Avatar Chung Pham Van thg 5 8, 2021 2:08 CH
11 phút đọc

GRU - Mạng Neural hồi tiếp với nút có cổng

  1. Mô hình ngôn ngữ Dữ liệu chuỗi là dạng dữ liệu mang có ý nghĩa và mang tính chất tuần tự, như: Âm nhạc, giọng nói, văn bản, phim ảnh, bước đi, ... Nếu chúng ta hoán vị chúng, chúng sẽ không còn mang nhiều ý nghĩa, ví dụ như tiêu đề 'Vợ chồng tỷ phú Bill Gates vừa ly hôn sau gần 30 năm bên nhau' thì mang nhiều ý nghĩa hơn tiêu đề 'Ly hôn tỷ phú vợ chồng Bill Gates sau gần 30 năm bên nhau'.

D...

Thumbnail Image
3.7K
49
20 3
Avatar Bui Quang Manh thg 5 8, 2021 11:24 SA
15 phút đọc

RepVGG - Sự trở lại của một tượng đài

I. Giới thiệu VGG - mô hình học sâu được đề xuất bởi K. Simonyan and A. Zisserman trong bài báo Very Deep Convolutional Networks for Large-Scale Image Recognition”. Khi xuất hiện mô hình này đã nhanh chóng chứng tỏ sức mạnh của mình vượt qua mô hình sota trước đó là AlexNet trên tập ImageNet. Tuy nhiên về sau khi các mô hình ngày càng phát triển sâu hơn phức tạp hơn, VGG đã lộ ra rất nhiều điểm...

Thumbnail Image
2.8K
10
2 2
Avatar Việt Hoàng thg 5 7, 2021 12:04 CH
6 phút đọc

Hướng dẫn convert Pytorch sang TF Lite

[IMG]

I. Giới thiệu Xin chào các bạn lâu lắm rồi mình mới ngóc lại sau một thời gian khá dài không chia sẻ bất cứ bài viết nào trên Viblo cả, kể cũng hơi buồn và nhớ viết lách. Một phần lý do là do mình lười và cũng không biết chọn chủ đề gì để chia sẻ tới mọi người, phần vì gần đây mình tham gia mấy cuộc thi nên cũng hơi bận thành ra lười hơn 😃

Như các bạn cũng biết rồi đó hiện nay các ứng dụng A...

Thumbnail Image
2.1K
12
5 0
Avatar Hieu Bui thg 5 7, 2021 8:08 SA
6 phút đọc

Một số cải tiến của cross-entropy loss cho Face Recognition

Introduction Bài toán face recognition trong vài năm trở lại đây đã đạt dược nhiều bước tiến lớn nhờ vào sự phát triển của học sâu (Deep learning), mà cụ thể hơn là mạng neural tích chập (Convolutional neural network - CNN). Các phương pháp deep learning based hầu hết dựa vào mạng CNN để trích xuất ra một vector đặc trưng đại diện cho một khuôn mặt gọi là vector face embedding. Các vector này...

Thumbnail Image
2.5K
28
4 1
Avatar Trần Đức Trung thg 5 7, 2021 7:02 SA
15 phút đọc

MLP-Mixer - Hướng giải quyết các bài toán Computer Vision mới bên cạnh CNN và Transformer

Có thể nói rằng Convolutional Neural Network hay CNN đã và đang được cho là mô hình vô cùng phù hợp cho thị giác máy tính. Bên cạnh đó các mạng dựa trên cơ chế attention, chẳng hạn như Vision Transformer, cũng dần được quan tâm và sử dụng nhiều hơn. Tuy vậy trong paper mới được publish của mình với tên gọi MLP-Mixer: An all-MLP Architecture for Vision, nhóm Google Brain ở Zurich và Berlin đã t...

Thumbnail Image
1.8K
18
6 1
Avatar Thao Hoang Thu thg 4 20, 2021 2:35 SA
19 phút đọc

Tìm hiểu về Text Steganography

[IMG]

  1. Steganography là gì ?

Nếu là một fan trinh thám hay các văn hóa phẩm về điệp viên, chắc hẳn bạn không còn lạ gì với việc truyền tin bằng những đoạn tin quảng cáo tưởng như rất bình thường trên báo, với mật mã "hình nhân nhảy múa" trong Sherlock Holmes, hay gần gũi nhất là hồi nhỏ chúng ta thử nghiệm mực vô hình: dùng nước chanh viết lên giấy, đợi khô rồi hơ nóng, thông điệp viết bằng nước ...

Thumbnail Image
483
8
4 3
Avatar Nguyen Viet Hoai thg 4 16, 2021 10:15 SA
9 phút đọc

[Text Spotting] FOTS: Fast Oriented Text Spotting with a Unified Network

Giới thiệu Như trong mô tả series này mình cũng đã đề cập đến việc nhận dạng văn bản từ một ảnh bất kì trước đây đều chia thành 2 phần đó là phát hiện được bao đóng (bounding box) chứa text sau đó sẽ đưa ảnh đã được cắt dựa trên tọa độ bao đóng đó để đưa nó vào mô hình nhận dạng văn bản. Việc phải sử dụng 2 mô hình tách biệt làm cho việc thời gian gán nhãn, huấn luyện và dự đoán trở nên lâu, rấ...

Thumbnail Image
2.2K
18
5 0
Avatar Pham Thi Hong Anh thg 4 5, 2021 6:19 SA
5 phút đọc

Những vấn đề liên quan đến dữ liệu ảnh trong Computer Vision

Như mọi người cũng biết data cực kỳ quan trọng đối với Machine learning vì vậy hôm nay mình sẽ chia sẻ xung quanh vấn đề ảnh. Bài viết bao gồm các phần:

  • Lưu trữ Image
  • Các tool annotate data Lưu trữ image Khi chúng ta nói về deep learning, thường thì điều đầu tiên xuất hiện là một lượng dữ liệu khổng lồ hoặc một số lượng lớn hình ảnhViệc lưu trữ cực kì đơn giản trong khi tập data của chúng t...
Thumbnail Image
2.8K
22
12 0
Avatar Phạm Văn Toàn thg 3 31, 2021 8:21 SA
15 phút đọc

[Pytorch Tutorial] - Deploy mô hình PyTorch lên web browser sử dụng ONNX.js

Mở đầu Các ứng dụng AI đang càng ngày càng gần hơn với những người dùng. Từ đó phát sinh rất nhiều nhu cầu về việc đưa mô hình AI chạy trên các loại môi trường khác nhau như Edge Device, Web Browser, Mobile App, Arduino... Vì lý do đó thì việc export model AI sang các định dạng có thể chạy trên các nền tảng đó là một việc làm rất cần thiết. Trong bài viết này chúng ta sẽ cùng nhau tìm hiểu về ...

Thumbnail Image
2.1K
12
7 0
Avatar Phạm Văn Toàn thg 3 31, 2021 5:48 SA
7 phút đọc

[B5'] - Tìm hiểu về BlazePose: On-device Real-time Body Pose tracking

Giới thiệu về bài toán Pose Estimation Bài toán Pose Estimation là một trong những bài toán phổ biến trong xử lý ảnh. Chúng ta đã từng có những nghiên cứu rất thành công trước đây trong lĩnh vực này như OpenPose, PoseNet. Một điểm quan trọng cần cải thiện của các mô hình này đó chính là cải thiện tốc độ xử lý. Trong paper này các tác giả của Google AI Research đã đề xuất một kiến trúc có thể ch...

Thumbnail Image
5.5K
23
5 0
Avatar Bui Quang Manh thg 3 29, 2021 3:48 SA
6 phút đọc

Xử lý ngon lành Microsoft Office Word với Python-Docx

Microsoft Word (MS)- một trong các tiện ích từ bộ Microsoft Office là một trong những phần mềm phổ biến trong việc tạo ra file document, hỗ trợ đọc và ghi nội dung từ đơn giản đến phức tạp. Mặc dù con người có thể trực tiếp tạo và viết nội dung lên file MS, tuy nhiên trong rất nhiều tác vụ cần máy tính xử lý và tự động tạo nội dung trên các file MS. Ví dụ bạn đọc nội dung từ file pdf và muốn ch...

Thumbnail Image
9.9K
46
12 3
Avatar Bui Quang Manh thg 3 29, 2021 3:25 SA
16 phút đọc

Tản mạn về Self Attention

Self attention hay intra-attention - cụm từ chắc hẳn đã được đồng đạo trong giới Machine Learning biết đến nhiều qua một bài báo rất nổi tiếng Attention is All You Need đề cập đến mô hình Transfomer đã và đang làm mưa làm gió trong nhiều lĩnh vực từ xử lý ngôn ngữ tự nhiên đến xử lý ảnh ... Self Attention chính là một trong những phần cốt yếu đóng góp nên sự thành công trong mô hình này. Tuy ...

Thumbnail Image
919
13
6 2
Avatar Nguyen Viet Anh thg 3 19, 2021 3:24 CH
8 phút đọc

SemEval 2021 Task 5: Toxic Span Detection

Giới thiệu bài toán Toxic Span Detection là bài toán phát hiện các từ/cụm từ độc hại trong văn bản, cụ thể là các bình luận, bài đăng trên mạng xã hội. Mặc dù một số bộ dữ liệu và mô hình phát hiện toxic đã được nghiên cứu nhưng hầu hết chúng đều phân loại toàn bộ văn bản và không xác định được các dấu hiệu khiến một văn bản trở nên độc hại. Trong khi đó, việc phát hiện ra những span mang lại h...

Thumbnail Image
1.5K
8
2 0
Avatar Phạm Văn Toàn thg 3 19, 2021 1:48 CH
14 phút đọc

[Paper Explain] [Deep Neural Network] -ImageNet Classification with Deep Convolutional Neural Networks

Source paper

  • Link paper ImageNet Classification with Deep Convolutional Neural Networks Giới thiệu

Đây được chọn là paper đầu tiên để giới thiệu trong chuỗi các bài review paper trong Deep Learning. Paper này giới thiệu một Deep CNN - một trong những kiến trúc nền tảng cho Deep Learning hiện đại. Tại thời điểm công bố paper này vào 2012, phương pháp được áp dụng đã giành chiến thắng tại top ...

Thumbnail Image
2.3K
8
1 0
Avatar Phạm Văn Toàn thg 3 19, 2021 1:47 CH
9 phút đọc

[AI From Scratch][Basic ML] #3 - Logistic Regression

Xin chào mọi người chúng ta lại quay trở lại với series về ML From Scratch và trong bài này chúng ta sẽ lại nói về một thuật toán đơn giản nhất của học máy áp dụng cho bài toán phân lớp nhị phân đó chính là Logistic Regression. Trong bài này chúng ta sẽ tiến hành giải thích sơ qua về lý thuyết và cách mà Logistic Regression hoạt động. Đồng thời, vẫn giống như các bài trước đó, chúng ta sẽ imple...

Thumbnail Image
662
5
0 1
Avatar Phạm Văn Toàn thg 3 19, 2021 1:47 CH
8 phút đọc

[AI From Scratch] [Basic ML] #2 - Linear Regression

Xin chào mọi người chúng ta lại quay trở lại với series về ML From Scratch và trong bài này chúng ta sẽ lại nói về một thuật toán vô cùng đơn giản nhưng rất hiệu quả trong nhiều bài toán của Học máy đó chính là Linear Regresion. Chúng ta sẽ bắt đầu bằng cách giải thích một cách dễ hiểu nhất về Linear Regresion và các ứng dụng của nó nhé.

Ví dụ về định giá nhà đất Đây có thể coi là một ví dụ ki...

Thành viên nổi bật
Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí