Image Cover
Avatar

Sun* AI Research Team

level partner

Silver Content Creator

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Pinned Posts

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
13.3K
56
24 8

All posts

Thumbnail Image
1.0K
10
0 2
Avatar Trung Đức Mar 14th, 2023 3:21 a.m.
11 min read

Data Analytics cho người mới bắt đầu như mình (Part 1)

Lời mở đầu Thời gian này, do một vài lý do nên mình đang học về Data Science, vì vậy những bài viết trong thời gian này sẽ xoay quanh chủ để này. Trong các khóa học online, thì mình đang học dở về khóa "Learn data analytics for beginners" của SkillUp. Khóa này theo mình đánh giá tương đối hay, cho cái nhìn overview về Data analytics. Trong bài viết này, mình sẽ note lại để trao đổi cùng các bạn...

Thumbnail Image
2.1K
11
4 6
Avatar Trung Đức Mar 10th, 2023 1:49 a.m.
9 min read

Chưa phân biệt được Database, Data warehouse và Data lake?

Tiếp nối series Data Science với các bài học đầu tiên về các khái niệm, kiến thức cơ bản, trong bài viết hôm nay, chúng ta sẽ cùng nhau phân biệt giữa Database, Data warehouse và Data lake.

Database Đây chắc hẳn là một khái niệm khá quen thuộc đối với các bạn IT.

  • Database (cơ sở dữ liệu) là một bộ sưu tập dữ liệu được tổ chức bày bản và thường được truy cập từ hệ thống máy tính hoặc tồn tại ...
Thumbnail Image
932
15
1 0
Avatar Trung Đức Mar 8th, 2023 7:22 a.m.
12 min read

Chập chững tìm hiểu về Data Science

Data Science là cái tên có lẽ không còn quá xa lạ với mọi người. Một lĩnh vực lớn làm việc với Data mà chắc hẳn rất nhiều người tò mò. Đang đứng ở công việc với AI, thì cứ nghĩ là mình đang tìm hiểu một lĩnh vực mới, nhưng xem xét lại mới thấy mình cũng là 1 phần của Data Science. Với mong muốn cùng tìm hiểu, chia sẻ, trao đổi và trau dồi kiến thức trên nền tảng Viblo, mình xin phép chia sẻ bài...

Thumbnail Image
1.6K
15
5 8
Avatar Nguyen Mai Mar 7th, 2023 2:06 a.m.
16 min read

Tính chất của Self-Attention và Transformer trong Computer Vision

Mở đầu Qua 2 bài viết: cơ chế Attention trong Computer Vision và MetaFormer với cái tiêu đề đầy chế giễu, thì giống như mình là một hater của Self-Attention. Thì đúng là mình có một chút gì đó không thích Self-Attention thật (vì nó nặng, và mình thì thích những thứ gì nhanh và nhẹ) nhưng dù sao thì mình vẫn phải tìm hiểu nó thôi :v

Nên là hôm này mình sẽ trình bày một chút kiến thức của mình v...

Thumbnail Image
1.7K
23
7 6
Avatar Trần Đức Trung Feb 28th, 2023 9:55 a.m.
12 min read

Triển khai ý tưởng nhanh hơn bao giờ hết với Notion AI

Trong thời gian gần đây, các mô hình Generative AI chẳng hạn như ChatGPT có tần xuất vô cùng dày đặc trên tất các các phương tiện truyền thông. Mặc dù khá dễ dàng để có thể liệt kê các nhược điểm cố hữu chẳng hạn như có tính tin cậy không được đảm bảo được đề cập đến trong ChatGPT hay là "Chết GPT"?, ta khó có thể phủ nhận rằng các mô hình này có thể giảm thiểu rất nhiều thời gian và công sức n...

Thumbnail Image
232
8
0 0
Avatar Trần Quang Vinh Feb 27th, 2023 10:14 a.m.
11 min read

[Paper Explained] Triple-Sigmoid Activation Function for Deep Open-Set Recognition

  1. Bài toán Open-Set Recognition

Thông thường, với các bài toán classification, ta thường hay train một mô hình học máy học có giám sát trên một bộ training set với số lượng class nhất định và test mô hình đó trên một bộ test set có cùng các class với bộ đã được dùng để train. Khi đó, model sẽ chỉ thực hiện được task Closed-Set Recognition, nghĩa là classify một input vào một trong những class...

Thumbnail Image
1.5K
16
4 2
Avatar Thao Hoang Thu Feb 27th, 2023 10:00 a.m.
10 min read

"Đu trend" ChatGPT - Sinh augmentation data cho bài toán NLP

Những ngày qua ChatGPT có thể nói đã dấy lên một làn sóng thảo luận mạnh mẽ trong xã hội, không chỉ dừng lại trong cộng đồng IT. Người ta nói về nguy cơ robot/ trí tuệ nhân tạo thay thế con người nhiều hơn bao giờ hết. Tuy nhiên mình nghĩ chúng ta nên quan tâm nhiều hơn đến việc làm thế nào để sử dụng ChatGPT (cũng như các mô hình GPT) như một công cụ hỗ trợ để tối ưu hóa năng suất làm việc, cũ...

Thumbnail Image
5.5K
109
11 35
Avatar Phạm Văn Toàn Feb 21st, 2023 3:50 a.m.
24 min read

ChatGPT hay là "Chết GPT"?

Cảnh báo

Bài viết này chỉ là quan điểm cá nhân của mình về ChatGPT - một ứng dụng AI sốt sình sịch trong thời gian gần đây. Tuy nhiên, bài viết này sẽ có cả những luận điểm không vừa tai về nó. Chống chỉ định với các Fan cuồng ChatGPT hay hội các nhà tư tưởng đang mơ mộng về một tương lai AI có thể thay thế con người.

Cha đẻ của ChatGPT là ai?

Có lẽ trong những ngày gần đây ChatGPT là một cụ...

Thumbnail Image
672
15
2 6
Avatar Nguyễn Văn Quân Feb 19th, 2023 4:56 a.m.
13 min read

[paper explain] Meta Pseudo Labels: khi ngai vàng thuộc về Semi-Supervised

  1. Mở đầu Như chúng ta đã biết thì các phương pháp semi-supervised learning đã góp công không nhỏ trong việc cải thiện hơn nữa các model state-of-the-art trong rất nhiều computer vision tasks như image classification, object detection, và semantic segmentation. Các phương pháp như Pseudo Labels hay self-training chắc cũng khá quen thuộc với những người từng làm về semi-supervised learning. Hôm...
Thumbnail Image
1.1K
21
4 6
Avatar Nguyen Mai Jan 31st, 2023 7:01 a.m.
12 min read

[Paper Explain] MetaFormer: Khi Attention is NOT all you need cho bài toán phân loại ảnh

Yêu cầu nhỏ Hiểu về các lớp Norm khác nhau hoạt động như nào: BatchNorm (BN), GroupNorm (GN), LayerNorm (LN) và biết cách sử dụng Pytorch

Hình 0. Cách hoạt động của các lớp Norm khác nhau

Mở đầu Từ khi Transformer được áp dụng cho bài toán phân loại ảnh qua ViT, đã có rất nhiều models mới tập trung vào cải thiện phép Self-Attention. Một khối encoder của Transformer có kiến trúc chung như ở hì...

Thumbnail Image
360
12
1 0
Avatar Nguyen Tung Thanh Jan 31st, 2023 3:40 a.m.
14 min read

Những sự thật thú vị về PT4AL: một SOTA Active Learning

Lời mở đầu Nhân dịp đầu xuân năm mới, chúc mọi người sức khỏe dồi dào và có những bước tiến lớn trong sự nghiệp.

Khoảng thời gian này cũng là dịp mình thường nhìn lại năm cũ và lên kế hoạch cho năm mới. Để hưởng ứng hoạt động khai bút đầu xuân, mình đã chọn viết về một trải nghiệm nhỏ cuối năm 2022. Hy vọng trong năm mới dựa trên những trải nghiệm này, chúng ta có thể rút kinh nghiệm để đạt đư...

Thumbnail Image
1.3K
17
1 0
Avatar Trung Đức Jan 29th, 2023 1:39 p.m.
16 min read

ChatGPT và 10 điều tồi tệ nhất có thể xảy ra

Nhân dịp đầu năm mới, chúc mọi người cùng gia đình luôn tràn đầy sức khỏe, an khang thịnh vượng!

Chào mọi người, sau một thời gian vắng bóng trên mặt trận chia sẻ kiến thức trên Viblo thì nay mình đã trở lại rồi đây. Trong không khí nghỉ lễ, trên khắp các mặt trận, đặc biệt là TikTok, mình thấy các reviewer liên tục đề cập tới một hiện tượng tương đối hot - ChatGPT. ChatGPT là gì? Tại sao nó l...

Thumbnail Image
692
7
4 1
Avatar Trần Đức Trung Dec 22nd, 2022 10:21 a.m.
16 min read

Xử lý dữ liệu hơi lớn một xíu với Dask

Khi nhắc đến xử lý dữ liệu bảng thì đa số chúng ta sẽ lựa chọn Pandas để đọc và thao tác với dữ liệu, và mình cũng không ngoại lệ. Tuy vậy khi nhu cầu xử lý tăng dần theo số lượng, ta sẽ cần tìm kiếm các thư viện cũng như cách thức triển khai khác để tối ưu được lượng tài nguyên cần đầu tư. Bài viết này giới thiệu về Dask và nói chi tiết hơn về cách thư viện này xử lý phân tán trên lượng dữ liệ...

Thumbnail Image
693
8
0 0
Avatar Trinh Quang Huy Dec 19th, 2022 4:35 p.m.
11 min read

[Paper Explain] EfficientFormer: Vision Transformers at MobileNet Speed

I. Mở Đầu: Mô hình transformer là một mô hình cực kỳ nổi tiếng trong lĩnh vực NLP, và một năm trở lại đây nó đã được đưa qua lĩnh vực computer vision và được nghiên cứu cực kỳ phổ biến nhưng một điểm yếu của nó là cực kỳ nặng và có độ chễ cao. Với điểm yếu này thì cực kỳ khó để có thể triển khai trên các thiết bị có cấu hình phần cứng yếu như mobile phone. Paper hôm nay sẽ giúp giải quyết vấn đ...

Thumbnail Image
605
20
3 7
Avatar Nguyễn Văn Quân Dec 15th, 2022 8:39 a.m.
15 min read

[paper explain] Scaling Up Your Kernels to 31x31: Sự trở lại mạnh mẽ của CNN trên đường đua ImageNet

Lời mở đầu Kể từ khi transformer được áp dụng vào bài toán vision, chúng ta đã được chứng kiến sự nhảy vọt ngoạn mục của họ mô hình này khi liên tục những SoTA trên tập ImageNet được xô đổ bởi , ,... Trong khi đó, người anh em CNN lại có vẻ khá im ắng khi chưa có mô hình nào đạt được nghiên cứu mang tính nhảy vọt để có thể sánh vai với transformer. Thế nhưng năm 2022 này lại mở ra một bức tranh...

Thumbnail Image
1.8K
15
5 2
Avatar Pham Thi Hong Anh Dec 14th, 2022 3:04 a.m.
4 min read

Polars - thư viện xử lý dữ liệu DataFrame nhanh hơn cả Pandas!!!!

Hello mọi người, hẳn là mọi người vẫn hay dùng Pandas để xử lý dữ liệu dạng DataFrame đúng không nhỉ? Hôm nay mình sẽ giới thiệu một thư viện mới Polars - một thư viện xử lý dữ liệu dạng bảng biểu được base trên Rust, tốc độ xử lý của thư viện này nhanh hơn cả Pandas mà mọi người vẫn hay dùng. Bên cạnh đó thư viện này cũng dễ dùng và hữu ích không thua kém gì Pandas. Chúng ta cùng nhau tìm hiểu...

Thumbnail Image
1.1K
17
3 0
Avatar Nguyen Mai Dec 13th, 2022 4:03 a.m.
15 min read

[Paper Explain] TOOD: Thống nhất Classification và Localization cho Object Detection

Tại sao lại là TOOD?

  • Vì trong paper này có một phần mà các paper về Object Detection hiện nay áp dụng khá nhiều, tiêu biểu là YOLOv6 hay DAMO-YOLO mới ra gần đây.
  • Cách giải quyết vấn đề dễ hiểu, trực quan, kèm theo chứng minh về mặt hình ảnh rõ ràng
  • Author thân thiện :v

Task conflict, Task misalignment Trong Object Detection (OD), ta phải làm 2 nhiệm vụ: Xác định vật thể nằm ở đâu trong ...

Thumbnail Image
161
5
0 0
Avatar Trần Đức Trung Dec 6th, 2022 9:10 a.m.
11 min read

[Progressive Rollouts với Iter8]: A/B Testing là gì?

Đôi khi đưa ra một quyết định có thể quyết định việc thành bại của một giải pháp và chẳng ai muốn mình phải chịu trách nhiệm về một quyết định mang đến kết quả xấu, được đưa ra theo bản năng cả. Tất nhiên đó là một điều tốt và may mắn thay, có rất nhiều cách để lấy thông tin mà không cần phải dựa trên bản năng của một người. Một trong những phương pháp phổ biến nhất, và cũng thường được sử dụng...

Thumbnail Image
1.2K
9
2 0
Avatar Thao Hoang Thu Dec 2nd, 2022 9:56 a.m.
3 min read

Chạy cronjob trong Docker container với Python

Trong quá trình phát triển, sẽ không thiếu những lúc mà chúng ta cần chạy định kỳ một vài script hoặc chạy một tác vụ nào đó vào thời gian nhất định. Những lúc như vậy thì Cron là một công cụ vô cùng hữu hiệu.

Cron cũng rất dễ sử dụng. Tuy nhiên khi đóng gói cronjob vào Docker thì mình đã gặp một vài khó khăn và phải thử qua mấy solution mới làm nó chạy được. Do vậy mình viết bài này để ghi ch...

Thumbnail Image
560
13
5 10
Avatar Nguyen Mai Nov 23rd, 2022 7:57 a.m.
17 min read

[Paper Explain] Rep-Optimizer: Re-params Optimizer thay vì Re-params model của bạn

Một số khái niệm cần nắm được

  • Re-parameterize: Là kĩ thuật thay đổi parameters của một layers (kernel của một lớp Conv) theo dạng biểu diễn khác. Về chi tiết hơn một chút, các bạn có thể đọc ở đây
  • Convolution (Conv): Phép tích chập, là phép tính toán chủ đạo trong CNN. Với một input feature maps có chiều , nếu ta thực hiện conv với một filter với same padding thì sẽ tạo ra output feature m...
Featured member
Viblo
Let's register a Viblo Account to get more interesting posts.