Image Cover
Avatar

Sun* AI Research Team

level partner

Nhà sáng tạo nội dung hạng Bạc

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Bài viết được ghim

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
13.3K
56
24 8

Tất cả bài viết

Thumbnail Image
1.1K
6
0 0
Avatar Phạm Văn Toàn thg 3 19, 2021 1:45 CH
6 phút đọc

[AI From Scratch] [Basic ML] #1- K Nearest Neighbor

Xin chào các bạn, chắc hẳn cái tên của series này đã nói lên tất cả. Đây là một series implement lại các thuật toán phổ biến trong Machine Learning và Deep Learning FROM SCRATCH. Có nhiều bạn sẽ đặt câu hỏi rằng tại sao phải implement từ đầu làm gì trong khi các thư viện đã thực hiện hết cho chúng ta rồi. Đúng vậy, với sự phổ biến của các thư viên AI ngày nay thì việc build một mô hình AI không...

Thumbnail Image
640
17
5 6
Avatar Pham Thi Hong Anh thg 3 19, 2021 2:32 SA
10 phút đọc

EDA dữ liệu cuộc thi Bookingchallenge và Baseline model

Xin chào mọi người, cách đây khoảng 2 tháng mình có tham gia một cuộc thi về recommendation system do Booking.com tổ chức, hôm nay mình sẽ chia sẻ bài viết về cách mình đã phân tích dữ liệu như thế nào, bên cạnh đó cũng đưa ra mô hình baseline của mình.

Booking challenge Cuộc thi này được booking.com tổ chức dựa trên dữ liệu về lịch sử book phòng của khách hàng khi đi du lịch đến một thành phố...

Thumbnail Image
7.3K
26
14 1
Avatar Bui Tien Tung thg 3 17, 2021 11:40 SA
13 phút đọc

Xây dựng web app cực xịn xò cho project của bạn chỉ với 10 dòng code

Xin chào các bạn, đều đặn hàng tháng, để tạm thời xả tress sau những ngày làm việc, học tập vất vả, mình vẫn luôn dành 1 khoảng thời gian nhỏ để để đến với một nỗi tress mới : Vắt óc ra, kiếm 1 chủ đề để chia sẻ trên kênh blog này của mình. Và đến hẹn lại lên, cuối cùng mình cũng nghĩ ra chủ đề để chia sẻ vào tháng này 😄.

Đùa vậy thôi, chứ viết blog có ích nhiều lắm =)) Để chia sẻ kiến thức ...

Thumbnail Image
1.3K
9
4 2
Avatar Hieu Bui thg 3 16, 2021 1:24 CH
6 phút đọc

CycleGAN cho bài toán image-to-image translation

Introduction Image-to-image translation là một lớp bài toán computer vision mà mục tiêu là học một ánh xạ giữa ảnh input và ảnh output. Bài toán này có thể áp dụng vào một số lĩnh vực như style transfer, tô màu ảnh, làm nét ảnh, sinh dữ liệu cho segmentation, face filter,...

Thông thường để huấn luyện một mô hình Image-to-image translation, ta sẽ cần một lượng lớn các cặp ảnh input và label. V...

Thumbnail Image
9.2K
26
12 18
Avatar Nguyen Viet Hoai thg 3 16, 2021 9:01 SA
14 phút đọc

Bài toán trích xuất thông tin từ hóa đơn

Mở đầu Đợt vừa rồi thì mình có tham gia một cuộc thi về trích xuất thông tin từ hóa đơn có tên gọi là The Mobile capture receipts Optical Character Recognition (MC-OCR) . Mình biết đến cuộc thi này từ lúc a Sơn bên tổ chức đăng bài thu thập dữ liệu về hóa đơn và mình đã hóng từ lúc đó đến tận tháng 12 năm 2020 thì cuộc thi được tổ chức. Cuộc thi bao gồm 2 bài toán đó là: Đánh giá chất lượng ảnh...

Thumbnail Image
279
4
0 0
Avatar Ngoc N Tran thg 3 9, 2021 12:16 CH
5 phút đọc

[B5'] EAD: Elastic-Net Attacks to Deep Neural Networks via Adversarial Examples

Đây là một bài trong series Báo khoa học trong vòng 5 phút.

Nguồn Được viết bởi Chen et. al, IBM. Được đăng ở AAAI '18.
https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/viewFile/16893/15665

Ý tưởng chính Thay vì sử dụng như Carlini-Wagner (CW), hay như PGD, thì tác giả sử dụng kết hợp giữa và tương tự với Elastic-Net Regularization. Cụ thể, mục đích tối thượng là tối ưu hàm loss s...

Thumbnail Image
244
5
0 0
Avatar Ngoc N Tran thg 3 8, 2021 9:14 SA
7 phút đọc

[B5'] Data-Free Learning of Student Networks

Đây là một bài trong series Báo khoa học trong vòng 5 phút.

Nguồn Được viết bởi Chen et. al, đại học Bắc Kinh. Được đăng ở ICCV '19.
https://openaccess.thecvf.com/contentICCV2019/papers/ChenData-FreeLearningofStudentNetworksICCV2019paper.pdf

Ý tưởng chính

Như với Knowledge Distillation truyền thống thì chúng ta sẽ train với data trong domain với label từ mô hình dạy (teacher model), tuy ...

Thumbnail Image
331
4
0 0
Avatar Ngoc N Tran thg 3 4, 2021 12:34 CH
4 phút đọc

[B5'] Smooth Adversarial Training

Đây là một bài trong series Báo khoa học trong vòng 5 phút.

Nguồn Được viết bởi Xie et. al, John Hopkins University, trong khi đang intern tại Google. Hiện vẫn là preprint do bị reject tại ICLR 2021.

https://arxiv.org/abs/2006.14536

Là top 1 method trong 1 task Adversarial Defense trên Papers With Code.

Các bạn có thể đọc qua trước bài này của mình về tấn công và phòng thủ trong học máy để ...

Thumbnail Image
7.1K
51
21 21
Avatar Bui Tien Tung thg 2 22, 2021 7:45 CH
20 phút đọc

Trích xuất thông tin bảng biểu cực đơn giản với OpenCV

Trong thời điểm nhà nước đang thúc đẩy mạnh mẽ quá trình chuyển đổi số như hiện nay, Document Understanding nói chung cũng như Table Extraction nói riêng đang trở thành một trong những lĩnh vực được quan tâm phát triển và chú trọng hàng đầu. Vậy Table Extraction là gì? Document Understanding là cái chi? Hãy đọc tiếp các phần bên dưới để biết thêm thông tin chi tiết!

Nói cao siêu vậy thôi, tron...

Thumbnail Image
2.7K
22
1 3
Avatar Ngoc N Tran thg 2 22, 2021 12:01 CH
18 phút đọc

Tấn công và phòng thủ bậc nhất cực mạnh cho các mô hình học máy

tấn công bậc nhất cực mạnh = universal first-order adversary

Update 2: Slides cho bài này đã được tạo để mình đi present tại ĐHBKHN, sau khi được approve sẽ update link sau.

Update 1: Bleeding edge của CleverHans đã lên từ 3.1.0 đến 4.0.0, và các tấn công cho PyTorch/JAX đã không còn là thử nghiệm. Code trong bài đã được update cho phiên bản mới nhất.

Giới thiệu

Lời mở đầu Xin ch...

Thumbnail Image
3.7K
8
4 0
Avatar Thao Hoang Thu thg 2 21, 2021 7:00 CH
12 phút đọc

Encoding categorical features in Machine learning

Khi tiếp cận với một bài toán machine learning, khả năng cao là chúng ta sẽ phải đối mặt với dữ liệu dạng phân loại (categorical data). Khác với các dữ liệu dạng số, máy tính sẽ không thể hiểu và làm việc trực tiếp với categorical variable. Do vậy nhiệm vụ của chúng ta là phải tìm cách "encode" dữ liệu dạng category, đưa nó về dạng khác để co...

Thumbnail Image
10.6K
126
41 12
Avatar Trung Thành Nguyễn thg 2 19, 2021 2:23 SA
18 phút đọc

Con đường AI của tôi

Gần đây, khá nhiều bạn nhắn tin hỏi mình những câu hỏi đại loại như: có nên học AI, bắt đầu học AI như nào, làm sao tự học cho đúng, cho nhanh, học không bị nản, lộ trình học AI như nào... Sau nhiều lần trả lời, mình nghĩ rằng nên viết hẳn một bài để trả lời chi tiết hơn, cũng như để các bạn sau này có hỏi, mình chỉ việc gửi link cho các bạn đọc cho nhanh 😄. Bài viết nói về những ngày đầu mình...

Thumbnail Image
2.0K
7
4 3
Avatar Hieu Bui thg 2 15, 2021 4:12 CH
7 phút đọc

Toonify: Biến chân dung thành nhân vật hoạt hình với StyleGAN

Hello mọi người và chúc mừng năm mới!!!

Vài hôm trước, mình lướt FB thì thấy sếp share một bài viết khá thú vị trên reddit về StyleGAN: Link bài viết

Dưới phần comment, tác giả có giải thích là đã sử dụng kỹ thuật gọi là model blending để trộn lẫn 2 mô hình StyleGAN2: một mô hình được train trên tập FFHQ để sinh mặt người trông như thật, mô hình thứ 2 thì được finetune từ mô hình trên với ...

Thumbnail Image
4.6K
16
3 6
Avatar Lê Minh Chiến thg 2 15, 2021 12:35 CH
14 phút đọc

Tìm hiểu kiến trúc mạng WPOD cho bài toán phát hiện biển số xe

  1. Lời mở đầu

Bài toán nhận diện biển số xe là một bài toán không còn mới. Ứng dụng nhận diện biển số xe được sử dụng rộng rãi trong các bãi giữ xe cấp phát vé tự động, các trạm thu phí trên đường cao tốc hoặc là các hệ thống theo dõi phương tiện tham gia giao thông và phát hiện các phương tiện vi phạm. Hiện nay có rất nhiều các phương pháp khác nhau được đưa ra để giải quyết bài toán này, cá...

Thumbnail Image
3.6K
10
6 5
Avatar Dark Knight thg 2 11, 2021 10:55 SA
5 phút đọc

Xây dựng hệ thống Real-time Multi-person Tracking với YOLOv3 và DeepSORT

Trong bài này chúng ta sẽ xây dựng một hệ thống sử dụng YOLOv3 kết hợp với DeepSORT để tracking được các đối tượng trên camera, YOLO là một thuật toán deep learning ra đời vào tháng 5 năm 2016 và nó nhanh chóng trở nên phổ biến vì nó quá nhanh so với thuật toán deep learning trước đó, sử dụng YOLO trên GPU ta có thể đạt tới 45 fps. Dựa vào YOLO chúng ta sẽ detect được object rồi sau đó ta dùng...

Thumbnail Image
2.1K
19
7 7
Avatar Bui Quang Manh thg 2 7, 2021 1:24 SA
7 phút đọc

Break Capcha bằng Deep learning

  1. Giới thiệu bài toán Vào một hôm trăng thanh gió mát cuối năm, lòng người rạo rực lương thưởng sắp về, anh Sếp mình có giao cho mình thử sức với một con capcha vô cùng mới mẻ. Mình quyết định sắn tay thử sức để có vài cái hay ho hôm nay đem chia sẻ với mọi người. Link trang ấy mình không tiện chia sẻ, các bạn tự tìm hiểu nhé 😉.

'

Nói sơ qua một chút, CAPTCHA là hình ảnh chứ một đoạn m...

Thumbnail Image
8.6K
32
7 2
Avatar Trung Thành Nguyễn thg 1 25, 2021 2:49 SA
13 phút đọc

Entropy, Cross Entropy và KL Divergence

  1. Entropy 1.1 Lý thuyết thông tin, entropy

Information Theory - lý thuyết thông tin là một nhánh của toán học liên quan tới đo đạc, định lượng và mã hóa thông tin. Cha đẻ của Information Theory là Claude Shannon. Ông nghiên cứu về cách mã hóa thông tin khi truyền tin, sao cho quá trình truyền tin đạt hiệu quả cao nhất mà không làm mất mát thông tin.

H1: Claude Shannon

Năm 1948, trong một bà...

Thumbnail Image
13.5K
51
22 34
Avatar Phan Huy Hoang thg 1 22, 2021 3:00 SA
32 phút đọc

[Deep Learning] Key Information Extraction from document using Graph Convolution Network - Bài toán trích rút thông tin từ hóa đơn với Graph Convolution Network

Các nội dung sẽ được đề cập trong bài blog lần này

  • Tổng quan về GNN, GCN

  • Bài toán Key Information Extraction, trích rút thông tin trong văn bản từ ảnh

  • Mô hình GNN

  • Tập dữ liệu hóa đơn - SROIE / ICDAR 2019

  • Invoice-GCN

  • Huấn luyện mô hình với GCN

  • 1 số cách tiếp cận và hướng phát triển khác cho bài toán KIE

  • Kết luận

  • Tài liệu tham khảo

  • UPDATED (31-10-2021): link project về trích ...

Thumbnail Image
15.1K
55
16 6
Avatar Bui Tien Tung thg 1 19, 2021 3:45 SA
18 phút đọc

SORT - Deep SORT : Một góc nhìn về Object Tracking (phần 2)

Note: Đây là chuỗi bài viết về Object Tracking nằm ở mức cao hơn beginner một chút. Nếu các bạn chưa từng nghe đến Object Tracking hoặc không hiểu Object Tracking là gì, hi vọng các bạn có thể dành chút thời gian tìm hiểu qua một chút trước khi đọc các bài viết trong series này. Bù lại, với những bạn có hứng thú về chủ đề Object Tracking, mình đảm bảo các bạn với các phần được trình bày sau đây...

Thumbnail Image
702
17
2 2
Avatar Thao Hoang Thu thg 12 27, 2020 6:19 CH
12 phút đọc

Đoán trọng âm tiếng Anh với machine learning - Tại sao không?

Chào các bạn, không biết hồi trước khi học tiếng Anh các bạn có từng "phát điên lên" với bài trọng âm không? Mình thì có, tuy ở trường có được học một số quy tắc đánh trọng âm, nhưng đau lòng thay, tiếng Anh, như mọi loại ngôn ngữ khác, luôn luôn có ngoại lệ. Tính mình thì không thích những thứ không suy ra được bằng logic nên tuy yêu thương môn tiê...

Thành viên nổi bật
Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí