Image Cover
Avatar

Sun* AI Research Team

level partner

Nhà sáng tạo nội dung hạng Bạc

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Bài viết được ghim

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
14.1K
57
28 8

Tất cả bài viết

Thumbnail Image
492
8
4 3
Avatar Nguyen Viet Hoai thg 4 16, 2021 10:15 SA
9 phút đọc

[Text Spotting] FOTS: Fast Oriented Text Spotting with a Unified Network

Giới thiệu Như trong mô tả series này mình cũng đã đề cập đến việc nhận dạng văn bản từ một ảnh bất kì trước đây đều chia thành 2 phần đó là phát hiện được bao đóng (bounding box) chứa text sau đó sẽ đưa ảnh đã được cắt dựa trên tọa độ bao đóng đó để đưa nó vào mô hình nhận dạng văn bản. Việc phải sử dụng 2 mô hình tách biệt làm cho việc thời gian gán nhãn, huấn luyện và dự đoán trở nên lâu, rấ...

Thumbnail Image
2.3K
18
5 0
Avatar Pham Thi Hong Anh thg 4 5, 2021 6:19 SA
5 phút đọc

Những vấn đề liên quan đến dữ liệu ảnh trong Computer Vision

Như mọi người cũng biết data cực kỳ quan trọng đối với Machine learning vì vậy hôm nay mình sẽ chia sẻ xung quanh vấn đề ảnh. Bài viết bao gồm các phần:

  • Lưu trữ Image
  • Các tool annotate data Lưu trữ image Khi chúng ta nói về deep learning, thường thì điều đầu tiên xuất hiện là một lượng dữ liệu khổng lồ hoặc một số lượng lớn hình ảnhViệc lưu trữ cực kì đơn giản trong khi tập data của chúng t...
Thumbnail Image
2.8K
22
12 0
Avatar Phạm Văn Toàn thg 3 31, 2021 8:21 SA
15 phút đọc

[Pytorch Tutorial] - Deploy mô hình PyTorch lên web browser sử dụng ONNX.js

Mở đầu Các ứng dụng AI đang càng ngày càng gần hơn với những người dùng. Từ đó phát sinh rất nhiều nhu cầu về việc đưa mô hình AI chạy trên các loại môi trường khác nhau như Edge Device, Web Browser, Mobile App, Arduino... Vì lý do đó thì việc export model AI sang các định dạng có thể chạy trên các nền tảng đó là một việc làm rất cần thiết. Trong bài viết này chúng ta sẽ cùng nhau tìm hiểu về ...

Thumbnail Image
2.1K
12
7 0
Avatar Phạm Văn Toàn thg 3 31, 2021 5:48 SA
7 phút đọc

[B5'] - Tìm hiểu về BlazePose: On-device Real-time Body Pose tracking

Giới thiệu về bài toán Pose Estimation Bài toán Pose Estimation là một trong những bài toán phổ biến trong xử lý ảnh. Chúng ta đã từng có những nghiên cứu rất thành công trước đây trong lĩnh vực này như OpenPose, PoseNet. Một điểm quan trọng cần cải thiện của các mô hình này đó chính là cải thiện tốc độ xử lý. Trong paper này các tác giả của Google AI Research đã đề xuất một kiến trúc có thể ch...

Thumbnail Image
5.8K
23
5 0
Avatar Bui Quang Manh thg 3 29, 2021 3:48 SA
6 phút đọc

Xử lý ngon lành Microsoft Office Word với Python-Docx

Microsoft Word (MS)- một trong các tiện ích từ bộ Microsoft Office là một trong những phần mềm phổ biến trong việc tạo ra file document, hỗ trợ đọc và ghi nội dung từ đơn giản đến phức tạp. Mặc dù con người có thể trực tiếp tạo và viết nội dung lên file MS, tuy nhiên trong rất nhiều tác vụ cần máy tính xử lý và tự động tạo nội dung trên các file MS. Ví dụ bạn đọc nội dung từ file pdf và muốn ch...

Thumbnail Image
10.5K
46
12 3
Avatar Bui Quang Manh thg 3 29, 2021 3:25 SA
16 phút đọc

Tản mạn về Self Attention

Self attention hay intra-attention - cụm từ chắc hẳn đã được đồng đạo trong giới Machine Learning biết đến nhiều qua một bài báo rất nổi tiếng Attention is All You Need đề cập đến mô hình Transfomer đã và đang làm mưa làm gió trong nhiều lĩnh vực từ xử lý ngôn ngữ tự nhiên đến xử lý ảnh ... Self Attention chính là một trong những phần cốt yếu đóng góp nên sự thành công trong mô hình này. Tuy ...

Thumbnail Image
937
14
6 2
Avatar Nguyen Viet Anh thg 3 19, 2021 3:24 CH
8 phút đọc

SemEval 2021 Task 5: Toxic Span Detection

Giới thiệu bài toán Toxic Span Detection là bài toán phát hiện các từ/cụm từ độc hại trong văn bản, cụ thể là các bình luận, bài đăng trên mạng xã hội. Mặc dù một số bộ dữ liệu và mô hình phát hiện toxic đã được nghiên cứu nhưng hầu hết chúng đều phân loại toàn bộ văn bản và không xác định được các dấu hiệu khiến một văn bản trở nên độc hại. Trong khi đó, việc phát hiện ra những span mang lại h...

Thumbnail Image
1.6K
8
2 0
Avatar Phạm Văn Toàn thg 3 19, 2021 1:48 CH
14 phút đọc

[Paper Explain] [Deep Neural Network] -ImageNet Classification with Deep Convolutional Neural Networks

Source paper

  • Link paper ImageNet Classification with Deep Convolutional Neural Networks Giới thiệu

Đây được chọn là paper đầu tiên để giới thiệu trong chuỗi các bài review paper trong Deep Learning. Paper này giới thiệu một Deep CNN - một trong những kiến trúc nền tảng cho Deep Learning hiện đại. Tại thời điểm công bố paper này vào 2012, phương pháp được áp dụng đã giành chiến thắng tại top ...

Thumbnail Image
2.4K
8
2 0
Avatar Phạm Văn Toàn thg 3 19, 2021 1:47 CH
9 phút đọc

[AI From Scratch][Basic ML] #3 - Logistic Regression

Xin chào mọi người chúng ta lại quay trở lại với series về ML From Scratch và trong bài này chúng ta sẽ lại nói về một thuật toán đơn giản nhất của học máy áp dụng cho bài toán phân lớp nhị phân đó chính là Logistic Regression. Trong bài này chúng ta sẽ tiến hành giải thích sơ qua về lý thuyết và cách mà Logistic Regression hoạt động. Đồng thời, vẫn giống như các bài trước đó, chúng ta sẽ imple...

Thumbnail Image
675
5
0 1
Avatar Phạm Văn Toàn thg 3 19, 2021 1:47 CH
8 phút đọc

[AI From Scratch] [Basic ML] #2 - Linear Regression

Xin chào mọi người chúng ta lại quay trở lại với series về ML From Scratch và trong bài này chúng ta sẽ lại nói về một thuật toán vô cùng đơn giản nhưng rất hiệu quả trong nhiều bài toán của Học máy đó chính là Linear Regresion. Chúng ta sẽ bắt đầu bằng cách giải thích một cách dễ hiểu nhất về Linear Regresion và các ứng dụng của nó nhé.

Ví dụ về định giá nhà đất Đây có thể coi là một ví dụ ki...

Thumbnail Image
1.1K
6
0 0
Avatar Phạm Văn Toàn thg 3 19, 2021 1:45 CH
6 phút đọc

[AI From Scratch] [Basic ML] #1- K Nearest Neighbor

Xin chào các bạn, chắc hẳn cái tên của series này đã nói lên tất cả. Đây là một series implement lại các thuật toán phổ biến trong Machine Learning và Deep Learning FROM SCRATCH. Có nhiều bạn sẽ đặt câu hỏi rằng tại sao phải implement từ đầu làm gì trong khi các thư viện đã thực hiện hết cho chúng ta rồi. Đúng vậy, với sự phổ biến của các thư viên AI ngày nay thì việc build một mô hình AI không...

Thumbnail Image
667
17
5 6
Avatar Pham Thi Hong Anh thg 3 19, 2021 2:32 SA
10 phút đọc

EDA dữ liệu cuộc thi Bookingchallenge và Baseline model

Xin chào mọi người, cách đây khoảng 2 tháng mình có tham gia một cuộc thi về recommendation system do Booking.com tổ chức, hôm nay mình sẽ chia sẻ bài viết về cách mình đã phân tích dữ liệu như thế nào, bên cạnh đó cũng đưa ra mô hình baseline của mình.

Booking challenge Cuộc thi này được booking.com tổ chức dựa trên dữ liệu về lịch sử book phòng của khách hàng khi đi du lịch đến một thành phố...

Thumbnail Image
7.9K
26
14 1
Avatar Bui Tien Tung thg 3 17, 2021 11:40 SA
13 phút đọc

Xây dựng web app cực xịn xò cho project của bạn chỉ với 10 dòng code

Xin chào các bạn, đều đặn hàng tháng, để tạm thời xả tress sau những ngày làm việc, học tập vất vả, mình vẫn luôn dành 1 khoảng thời gian nhỏ để để đến với một nỗi tress mới : Vắt óc ra, kiếm 1 chủ đề để chia sẻ trên kênh blog này của mình. Và đến hẹn lại lên, cuối cùng mình cũng nghĩ ra chủ đề để chia sẻ vào tháng này 😄.

Đùa vậy thôi, chứ viết blog có ích nhiều lắm =)) Để chia sẻ kiến thức ...

Thumbnail Image
1.3K
9
4 2
Avatar Hieu Bui thg 3 16, 2021 1:24 CH
6 phút đọc

CycleGAN cho bài toán image-to-image translation

Introduction Image-to-image translation là một lớp bài toán computer vision mà mục tiêu là học một ánh xạ giữa ảnh input và ảnh output. Bài toán này có thể áp dụng vào một số lĩnh vực như style transfer, tô màu ảnh, làm nét ảnh, sinh dữ liệu cho segmentation, face filter,...

Thông thường để huấn luyện một mô hình Image-to-image translation, ta sẽ cần một lượng lớn các cặp ảnh input và label. V...

Thumbnail Image
9.3K
26
12 18
Avatar Nguyen Viet Hoai thg 3 16, 2021 9:01 SA
14 phút đọc

Bài toán trích xuất thông tin từ hóa đơn

Mở đầu Đợt vừa rồi thì mình có tham gia một cuộc thi về trích xuất thông tin từ hóa đơn có tên gọi là The Mobile capture receipts Optical Character Recognition (MC-OCR) . Mình biết đến cuộc thi này từ lúc a Sơn bên tổ chức đăng bài thu thập dữ liệu về hóa đơn và mình đã hóng từ lúc đó đến tận tháng 12 năm 2020 thì cuộc thi được tổ chức. Cuộc thi bao gồm 2 bài toán đó là: Đánh giá chất lượng ảnh...

Thumbnail Image
283
4
0 0
Avatar Ngoc N Tran thg 3 9, 2021 12:16 CH
5 phút đọc

[B5'] EAD: Elastic-Net Attacks to Deep Neural Networks via Adversarial Examples

Đây là một bài trong series Báo khoa học trong vòng 5 phút.

Nguồn Được viết bởi Chen et. al, IBM. Được đăng ở AAAI '18.
https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/viewFile/16893/15665

Ý tưởng chính Thay vì sử dụng như Carlini-Wagner (CW), hay như PGD, thì tác giả sử dụng kết hợp giữa và tương tự với Elastic-Net Regularization. Cụ thể, mục đích tối thượng là tối ưu hàm loss s...

Thumbnail Image
254
5
0 0
Avatar Ngoc N Tran thg 3 8, 2021 9:14 SA
7 phút đọc

[B5'] Data-Free Learning of Student Networks

Đây là một bài trong series Báo khoa học trong vòng 5 phút.

Nguồn Được viết bởi Chen et. al, đại học Bắc Kinh. Được đăng ở ICCV '19.
https://openaccess.thecvf.com/contentICCV2019/papers/ChenData-FreeLearningofStudentNetworksICCV2019paper.pdf

Ý tưởng chính

Như với Knowledge Distillation truyền thống thì chúng ta sẽ train với data trong domain với label từ mô hình dạy (teacher model), tuy ...

Thumbnail Image
335
4
0 0
Avatar Ngoc N Tran thg 3 4, 2021 12:34 CH
4 phút đọc

[B5'] Smooth Adversarial Training

Đây là một bài trong series Báo khoa học trong vòng 5 phút.

Nguồn Được viết bởi Xie et. al, John Hopkins University, trong khi đang intern tại Google. Hiện vẫn là preprint do bị reject tại ICLR 2021.

https://arxiv.org/abs/2006.14536

Là top 1 method trong 1 task Adversarial Defense trên Papers With Code.

Các bạn có thể đọc qua trước bài này của mình về tấn công và phòng thủ trong học máy để ...

Thumbnail Image
7.4K
51
21 21
Avatar Bui Tien Tung thg 2 22, 2021 7:45 CH
20 phút đọc

Trích xuất thông tin bảng biểu cực đơn giản với OpenCV

Trong thời điểm nhà nước đang thúc đẩy mạnh mẽ quá trình chuyển đổi số như hiện nay, Document Understanding nói chung cũng như Table Extraction nói riêng đang trở thành một trong những lĩnh vực được quan tâm phát triển và chú trọng hàng đầu. Vậy Table Extraction là gì? Document Understanding là cái chi? Hãy đọc tiếp các phần bên dưới để biết thêm thông tin chi tiết!

Nói cao siêu vậy thôi, tron...

Thumbnail Image
2.8K
22
1 3
Avatar Ngoc N Tran thg 2 22, 2021 12:01 CH
18 phút đọc

Tấn công và phòng thủ bậc nhất cực mạnh cho các mô hình học máy

tấn công bậc nhất cực mạnh = universal first-order adversary

Update 2: Slides cho bài này đã được tạo để mình đi present tại ĐHBKHN, sau khi được approve sẽ update link sau.

Update 1: Bleeding edge của CleverHans đã lên từ 3.1.0 đến 4.0.0, và các tấn công cho PyTorch/JAX đã không còn là thử nghiệm. Code trong bài đã được update cho phiên bản mới nhất.

Giới thiệu

Lời mở đầu Xin ch...

Thành viên nổi bật
Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí