Image Cover
Avatar

Sun* AI Research Team

level partner

Nhà sáng tạo nội dung hạng Bạc

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Bài viết được ghim

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
11.4K
53
21 7

Tất cả bài viết

Thumbnail Image
953
10
0 2
Avatar Trung Đức thg 3 14, 2023 3:21 SA
11 phút đọc

Data Analytics cho người mới bắt đầu như mình (Part 1)

Lời mở đầu Thời gian này, do một vài lý do nên mình đang học về Data Science, vì vậy những bài viết trong thời gian này sẽ xoay quanh chủ để này. Trong các khóa học online, thì mình đang học dở về khóa "Learn data analytics for beginners" của SkillUp. Khóa này theo mình đánh giá tương đối hay, cho cái nhìn overview về Data analytics. Trong bài viết này, mình sẽ note lại để trao đổi cùng các bạn...

Thumbnail Image
1.8K
11
4 6
Avatar Trung Đức thg 3 10, 2023 1:49 SA
9 phút đọc

Chưa phân biệt được Database, Data warehouse và Data lake?

Tiếp nối series Data Science với các bài học đầu tiên về các khái niệm, kiến thức cơ bản, trong bài viết hôm nay, chúng ta sẽ cùng nhau phân biệt giữa Database, Data warehouse và Data lake.

Database Đây chắc hẳn là một khái niệm khá quen thuộc đối với các bạn IT.

  • Database (cơ sở dữ liệu) là một bộ sưu tập dữ liệu được tổ chức bày bản và thường được truy cập từ hệ thống máy tính hoặc tồn tại ...
Thumbnail Image
841
15
1 0
Avatar Trung Đức thg 3 8, 2023 7:22 SA
12 phút đọc

Chập chững tìm hiểu về Data Science

Data Science là cái tên có lẽ không còn quá xa lạ với mọi người. Một lĩnh vực lớn làm việc với Data mà chắc hẳn rất nhiều người tò mò. Đang đứng ở công việc với AI, thì cứ nghĩ là mình đang tìm hiểu một lĩnh vực mới, nhưng xem xét lại mới thấy mình cũng là 1 phần của Data Science. Với mong muốn cùng tìm hiểu, chia sẻ, trao đổi và trau dồi kiến thức trên nền tảng Viblo, mình xin phép chia sẻ bài...

Thumbnail Image
1.4K
14
4 8
Avatar Nguyen Mai thg 3 7, 2023 2:06 SA
16 phút đọc

Tính chất của Self-Attention và Transformer trong Computer Vision

Mở đầu Qua 2 bài viết: cơ chế Attention trong Computer Vision và MetaFormer với cái tiêu đề đầy chế giễu, thì giống như mình là một hater của Self-Attention. Thì đúng là mình có một chút gì đó không thích Self-Attention thật (vì nó nặng, và mình thì thích những thứ gì nhanh và nhẹ) nhưng dù sao thì mình vẫn phải tìm hiểu nó thôi :v

Nên là hôm này mình sẽ trình bày một chút kiến thức của mình v...

Thumbnail Image
993
9
3 0
Avatar Tung thg 3 3, 2023 7:13 SA
9 phút đọc

"Dạy AI làm bác sĩ" - Thực hành bài toán phân vùng ảnh y tế với mô hình Transformer

  1. Giới thiệu bài toán Ngày nay, Trí tuệ nhân tạo AI đang có rất nhiều ứng dụng trong các bài toán, trong đó có ứng dụng của AI trong xử lý ảnh y tế. Trên Kaggle có 1 challenge rất hay, mang tính ứng dụng cao đó là bài toán phân vùng khối u từ ảnh y tế (đường link: https://www.kaggle.com/c/bkai-igh-neopolyp/), tập dữ liệu của bài toán là BKAI-IGH NeoPolyp-Small do Trung tâm BKAI, Hanoi Universi...
Thumbnail Image
1.6K
23
7 6
Avatar Trần Đức Trung thg 2 28, 2023 9:55 SA
12 phút đọc

Triển khai ý tưởng nhanh hơn bao giờ hết với Notion AI

Trong thời gian gần đây, các mô hình Generative AI chẳng hạn như ChatGPT có tần xuất vô cùng dày đặc trên tất các các phương tiện truyền thông. Mặc dù khá dễ dàng để có thể liệt kê các nhược điểm cố hữu chẳng hạn như có tính tin cậy không được đảm bảo được đề cập đến trong ChatGPT hay là "Chết GPT"?, ta khó có thể phủ nhận rằng các mô hình này có thể giảm thiểu rất nhiều thời gian và công sức n...

Thumbnail Image
227
8
0 0
Avatar Trần Quang Vinh thg 2 27, 2023 10:14 SA
11 phút đọc

[Paper Explained] Triple-Sigmoid Activation Function for Deep Open-Set Recognition

  1. Bài toán Open-Set Recognition

Thông thường, với các bài toán classification, ta thường hay train một mô hình học máy học có giám sát trên một bộ training set với số lượng class nhất định và test mô hình đó trên một bộ test set có cùng các class với bộ đã được dùng để train. Khi đó, model sẽ chỉ thực hiện được task Closed-Set Recognition, nghĩa là classify một input vào một trong những class...

Thumbnail Image
1.3K
15
3 2
Avatar Thao Hoang Thu thg 2 27, 2023 10:00 SA
10 phút đọc

"Đu trend" ChatGPT - Sinh augmentation data cho bài toán NLP

Những ngày qua ChatGPT có thể nói đã dấy lên một làn sóng thảo luận mạnh mẽ trong xã hội, không chỉ dừng lại trong cộng đồng IT. Người ta nói về nguy cơ robot/ trí tuệ nhân tạo thay thế con người nhiều hơn bao giờ hết. Tuy nhiên mình nghĩ chúng ta nên quan tâm nhiều hơn đến việc làm thế nào để sử dụng ChatGPT (cũng như các mô hình GPT) như một công cụ hỗ trợ để tối ưu hóa năng suất làm việc, cũ...

Thumbnail Image
913
8
2 0
Avatar Tung thg 2 23, 2023 3:44 SA
7 phút đọc

[Paper Explain] PSPNet - Mô hình Deep Learning kinh điển cho bài toán Semantic Segmentation

  1. Giới thiệu Bài toán Semantic segmentation (Phân vùng ngữ nghĩa ảnh) là một trong những bài toán cơ bản trong lĩnh vực Thị giác máy tính, nhiệm vụ của bài toán là phân loại chính xác tới từng pixel trong ảnh. Hình ảnh dưới đây mô tả kết quả phân vùng với tập dữ liệu PASCAL VOC (theo thứ tự từ trái qua phải, lần lượt là ảnh đầu vào, ảnh kết quả và ảnh dự đoán).

Dễ thấy, kết quả của bài toán l...

Thumbnail Image
5.3K
103
11 35
Avatar Phạm Văn Toàn thg 2 21, 2023 3:50 SA
24 phút đọc

ChatGPT hay là "Chết GPT"?

Cảnh báo

Bài viết này chỉ là quan điểm cá nhân của mình về ChatGPT - một ứng dụng AI sốt sình sịch trong thời gian gần đây. Tuy nhiên, bài viết này sẽ có cả những luận điểm không vừa tai về nó. Chống chỉ định với các Fan cuồng ChatGPT hay hội các nhà tư tưởng đang mơ mộng về một tương lai AI có thể thay thế con người.

Cha đẻ của ChatGPT là ai?

Có lẽ trong những ngày gần đây ChatGPT là một cụ...

Thumbnail Image
602
14
2 6
Avatar Nguyễn Văn Quân thg 2 19, 2023 4:56 SA
13 phút đọc

[paper explain] Meta Pseudo Labels: khi ngai vàng thuộc về Semi-Supervised

  1. Mở đầu Như chúng ta đã biết thì các phương pháp semi-supervised learning đã góp công không nhỏ trong việc cải thiện hơn nữa các model state-of-the-art trong rất nhiều computer vision tasks như image classification, object detection, và semantic segmentation. Các phương pháp như Pseudo Labels hay self-training chắc cũng khá quen thuộc với những người từng làm về semi-supervised learning. Hôm...
Thumbnail Image
1.0K
20
3 6
Avatar Nguyen Mai thg 1 31, 2023 7:01 SA
12 phút đọc

[Paper Explain] MetaFormer: Khi Attention is NOT all you need cho bài toán phân loại ảnh

Yêu cầu nhỏ Hiểu về các lớp Norm khác nhau hoạt động như nào: BatchNorm (BN), GroupNorm (GN), LayerNorm (LN) và biết cách sử dụng Pytorch

Hình 0. Cách hoạt động của các lớp Norm khác nhau

Mở đầu Từ khi Transformer được áp dụng cho bài toán phân loại ảnh qua ViT, đã có rất nhiều models mới tập trung vào cải thiện phép Self-Attention. Một khối encoder của Transformer có kiến trúc chung như ở hì...

Thumbnail Image
355
12
1 0
Avatar Nguyen Tung Thanh thg 1 31, 2023 3:40 SA
14 phút đọc

Những sự thật thú vị về PT4AL: một SOTA Active Learning

Lời mở đầu Nhân dịp đầu xuân năm mới, chúc mọi người sức khỏe dồi dào và có những bước tiến lớn trong sự nghiệp.

Khoảng thời gian này cũng là dịp mình thường nhìn lại năm cũ và lên kế hoạch cho năm mới. Để hưởng ứng hoạt động khai bút đầu xuân, mình đã chọn viết về một trải nghiệm nhỏ cuối năm 2022. Hy vọng trong năm mới dựa trên những trải nghiệm này, chúng ta có thể rút kinh nghiệm để đạt đư...

Thumbnail Image
1.3K
17
1 0
Avatar Trung Đức thg 1 29, 2023 1:39 CH
16 phút đọc

ChatGPT và 10 điều tồi tệ nhất có thể xảy ra

Nhân dịp đầu năm mới, chúc mọi người cùng gia đình luôn tràn đầy sức khỏe, an khang thịnh vượng!

Chào mọi người, sau một thời gian vắng bóng trên mặt trận chia sẻ kiến thức trên Viblo thì nay mình đã trở lại rồi đây. Trong không khí nghỉ lễ, trên khắp các mặt trận, đặc biệt là TikTok, mình thấy các reviewer liên tục đề cập tới một hiện tượng tương đối hot - ChatGPT. ChatGPT là gì? Tại sao nó l...

Thumbnail Image
601
7
3 1
Avatar Trần Đức Trung thg 12 22, 2022 10:21 SA
16 phút đọc

Xử lý dữ liệu hơi lớn một xíu với Dask

Khi nhắc đến xử lý dữ liệu bảng thì đa số chúng ta sẽ lựa chọn Pandas để đọc và thao tác với dữ liệu, và mình cũng không ngoại lệ. Tuy vậy khi nhu cầu xử lý tăng dần theo số lượng, ta sẽ cần tìm kiếm các thư viện cũng như cách thức triển khai khác để tối ưu được lượng tài nguyên cần đầu tư. Bài viết này giới thiệu về Dask và nói chi tiết hơn về cách thư viện này xử lý phân tán trên lượng dữ liệ...

Thumbnail Image
604
8
0 0
Avatar Trinh Quang Huy thg 12 19, 2022 4:35 CH
11 phút đọc

[Paper Explain] EfficientFormer: Vision Transformers at MobileNet Speed

I. Mở Đầu: Mô hình transformer là một mô hình cực kỳ nổi tiếng trong lĩnh vực NLP, và một năm trở lại đây nó đã được đưa qua lĩnh vực computer vision và được nghiên cứu cực kỳ phổ biến nhưng một điểm yếu của nó là cực kỳ nặng và có độ chễ cao. Với điểm yếu này thì cực kỳ khó để có thể triển khai trên các thiết bị có cấu hình phần cứng yếu như mobile phone. Paper hôm nay sẽ giúp giải quyết vấn đ...

Thumbnail Image
574
20
3 7
Avatar Nguyễn Văn Quân thg 12 15, 2022 8:39 SA
15 phút đọc

[paper explain] Scaling Up Your Kernels to 31x31: Sự trở lại mạnh mẽ của CNN trên đường đua ImageNet

Lời mở đầu Kể từ khi transformer được áp dụng vào bài toán vision, chúng ta đã được chứng kiến sự nhảy vọt ngoạn mục của họ mô hình này khi liên tục những SoTA trên tập ImageNet được xô đổ bởi , ,... Trong khi đó, người anh em CNN lại có vẻ khá im ắng khi chưa có mô hình nào đạt được nghiên cứu mang tính nhảy vọt để có thể sánh vai với transformer. Thế nhưng năm 2022 này lại mở ra một bức tranh...

Thumbnail Image
1.7K
15
5 2
Avatar Pham Thi Hong Anh thg 12 14, 2022 3:04 SA
4 phút đọc

Polars - thư viện xử lý dữ liệu DataFrame nhanh hơn cả Pandas!!!!

Hello mọi người, hẳn là mọi người vẫn hay dùng Pandas để xử lý dữ liệu dạng DataFrame đúng không nhỉ? Hôm nay mình sẽ giới thiệu một thư viện mới Polars - một thư viện xử lý dữ liệu dạng bảng biểu được base trên Rust, tốc độ xử lý của thư viện này nhanh hơn cả Pandas mà mọi người vẫn hay dùng. Bên cạnh đó thư viện này cũng dễ dùng và hữu ích không thua kém gì Pandas. Chúng ta cùng nhau tìm hiểu...

Thumbnail Image
1.0K
16
2 0
Avatar Nguyen Mai thg 12 13, 2022 4:03 SA
15 phút đọc

[Paper Explain] TOOD: Thống nhất Classification và Localization cho Object Detection

Tại sao lại là TOOD?

  • Vì trong paper này có một phần mà các paper về Object Detection hiện nay áp dụng khá nhiều, tiêu biểu là YOLOv6 hay DAMO-YOLO mới ra gần đây.
  • Cách giải quyết vấn đề dễ hiểu, trực quan, kèm theo chứng minh về mặt hình ảnh rõ ràng
  • Author thân thiện :v

Task conflict, Task misalignment Trong Object Detection (OD), ta phải làm 2 nhiệm vụ: Xác định vật thể nằm ở đâu trong ...

Thumbnail Image
151
5
0 0
Avatar Trần Đức Trung thg 12 6, 2022 9:10 SA
11 phút đọc

[Progressive Rollouts với Iter8]: A/B Testing là gì?

Đôi khi đưa ra một quyết định có thể quyết định việc thành bại của một giải pháp và chẳng ai muốn mình phải chịu trách nhiệm về một quyết định mang đến kết quả xấu, được đưa ra theo bản năng cả. Tất nhiên đó là một điều tốt và may mắn thay, có rất nhiều cách để lấy thông tin mà không cần phải dựa trên bản năng của một người. Một trong những phương pháp phổ biến nhất, và cũng thường được sử dụng...

Thành viên nổi bật
Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí