Image Cover
Avatar

Sun* AI Research Team

level partner

Silver Content Creator

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Pinned Posts

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
11.9K
53
22 8

All posts

Thumbnail Image
518
11
2 0
Avatar Pham Thi Hong Anh thg 3 24, 2023 9:05 SA
5 min read

Học Data Analysis bắt đầu từ con số 0

Chào mọi người, dạo gần đây mình có thời gian nên tìm hiểu bài bản vể việc học DA từ đầu nên bắt đầu như thế nào, Vì vậy hôm nay mình cũng viết bài chia sẻ những gì mình đã tìm hiểu trong thời gian vừa qua.

Để trở thành một nhà phân tích dữ liệu thì chúng ta cần học và có những kỹ năng sau:

Kiến thức về Data, Database Muốn phân tích được data thì việc hiểu data là gì rất là quan trọng,Data (...

Thumbnail Image
505
9
1 0
Avatar Trung Đức thg 3 20, 2023 3:58 SA
12 min read

Data Analytics cho người mới bắt đầu như mình (Part cuối cho Beginners)

Kết thúc khóa học Data analytics cho người mới bắt đầu, bài viết này của mình sẽ bao gồm 2 nội dung chính: Phương pháp luận trong Data Science và Data Analytics trong các lĩnh vực khác nhau sẽ có hiệu quả thế nào. Cùng mình trao đổi nhé Data Science methodology Phương pháp luận trong Data Science là phương pháp khoa học dữ liệu để thúc đẩy những thông tin, hiểu biết có ý nghĩa hơn. Bản chất thì...

Thumbnail Image
4.6K
74
11 10
Avatar Phạm Văn Toàn thg 3 17, 2023 4:46 SA
20 min read

Trải lòng sau khi đọc GPT-4 Technical Report của OpenAI - các bác nên đổi tên công ty đi

Sự háo hức chờ đón GPT-4

Có lẽ chưa một năm nào mà chứng kiến sự vươn lên ngoạn mục của AI trong lòng công chúng như năm nay. Không thể phủ nhận rằng OpenAI đã làm quá tốt trong việc đưa AI đến với mọi người, mọi nhà. Đâu đâu cũng nghe về ChatGPT, về Midjourney, blah blah... Và cũng không để cho dân tình phải chờ đợi lâu thì ngày 14/3/2023, phiên bản nâng cấp thực sự của GPT-3 đã được công bố ...

Thumbnail Image
795
6
2 0
Avatar Trung Đức thg 3 16, 2023 6:31 SA
11 min read

Data Analytics cho người mới bắt đầu như mình (Part 2)

Tiếp nối trong phần đầu tiên về các khái niệm cơ bản của Data Analytics, trong phần này, mình sẽ tập trung về các kiểu dữ liệu, levels của dữ liệu và tổng quan trực quan hóa dữ liệu, mỗi kiểu trực quan sẽ phù hợp với từng kiểu dữ liệu và mục đích khác nhau. Mời các bạn đọc cùng trao đổi nhé Một số thuật ngữ, thông số trong thống kê và Data Analytics Trước hết mình sẽ điểm qua một vài từ khóa cơ...

Thumbnail Image
969
10
0 2
Avatar Trung Đức thg 3 14, 2023 3:21 SA
11 min read

Data Analytics cho người mới bắt đầu như mình (Part 1)

Lời mở đầu Thời gian này, do một vài lý do nên mình đang học về Data Science, vì vậy những bài viết trong thời gian này sẽ xoay quanh chủ để này. Trong các khóa học online, thì mình đang học dở về khóa "Learn data analytics for beginners" của SkillUp. Khóa này theo mình đánh giá tương đối hay, cho cái nhìn overview về Data analytics. Trong bài viết này, mình sẽ note lại để trao đổi cùng các bạn...

Thumbnail Image
1.9K
11
4 6
Avatar Trung Đức thg 3 10, 2023 1:49 SA
9 min read

Chưa phân biệt được Database, Data warehouse và Data lake?

Tiếp nối series Data Science với các bài học đầu tiên về các khái niệm, kiến thức cơ bản, trong bài viết hôm nay, chúng ta sẽ cùng nhau phân biệt giữa Database, Data warehouse và Data lake.

Database Đây chắc hẳn là một khái niệm khá quen thuộc đối với các bạn IT.

  • Database (cơ sở dữ liệu) là một bộ sưu tập dữ liệu được tổ chức bày bản và thường được truy cập từ hệ thống máy tính hoặc tồn tại ...
Thumbnail Image
866
15
1 0
Avatar Trung Đức thg 3 8, 2023 7:22 SA
12 min read

Chập chững tìm hiểu về Data Science

Data Science là cái tên có lẽ không còn quá xa lạ với mọi người. Một lĩnh vực lớn làm việc với Data mà chắc hẳn rất nhiều người tò mò. Đang đứng ở công việc với AI, thì cứ nghĩ là mình đang tìm hiểu một lĩnh vực mới, nhưng xem xét lại mới thấy mình cũng là 1 phần của Data Science. Với mong muốn cùng tìm hiểu, chia sẻ, trao đổi và trau dồi kiến thức trên nền tảng Viblo, mình xin phép chia sẻ bài...

Thumbnail Image
1.5K
14
4 8
Avatar Nguyen Mai thg 3 7, 2023 2:06 SA
16 min read

Tính chất của Self-Attention và Transformer trong Computer Vision

Mở đầu Qua 2 bài viết: cơ chế Attention trong Computer Vision và MetaFormer với cái tiêu đề đầy chế giễu, thì giống như mình là một hater của Self-Attention. Thì đúng là mình có một chút gì đó không thích Self-Attention thật (vì nó nặng, và mình thì thích những thứ gì nhanh và nhẹ) nhưng dù sao thì mình vẫn phải tìm hiểu nó thôi :v

Nên là hôm này mình sẽ trình bày một chút kiến thức của mình v...

Thumbnail Image
1.0K
9
3 0
Avatar Tung thg 3 3, 2023 7:13 SA
9 min read

"Dạy AI làm bác sĩ" - Thực hành bài toán phân vùng ảnh y tế với mô hình Transformer

  1. Giới thiệu bài toán Ngày nay, Trí tuệ nhân tạo AI đang có rất nhiều ứng dụng trong các bài toán, trong đó có ứng dụng của AI trong xử lý ảnh y tế. Trên Kaggle có 1 challenge rất hay, mang tính ứng dụng cao đó là bài toán phân vùng khối u từ ảnh y tế (đường link: https://www.kaggle.com/c/bkai-igh-neopolyp/), tập dữ liệu của bài toán là BKAI-IGH NeoPolyp-Small do Trung tâm BKAI, Hanoi Universi...
Thumbnail Image
1.6K
23
7 6
Avatar Trần Đức Trung thg 2 28, 2023 9:55 SA
12 min read

Triển khai ý tưởng nhanh hơn bao giờ hết với Notion AI

Trong thời gian gần đây, các mô hình Generative AI chẳng hạn như ChatGPT có tần xuất vô cùng dày đặc trên tất các các phương tiện truyền thông. Mặc dù khá dễ dàng để có thể liệt kê các nhược điểm cố hữu chẳng hạn như có tính tin cậy không được đảm bảo được đề cập đến trong ChatGPT hay là "Chết GPT"?, ta khó có thể phủ nhận rằng các mô hình này có thể giảm thiểu rất nhiều thời gian và công sức n...

Thumbnail Image
228
8
0 0
Avatar Trần Quang Vinh thg 2 27, 2023 10:14 SA
11 min read

[Paper Explained] Triple-Sigmoid Activation Function for Deep Open-Set Recognition

  1. Bài toán Open-Set Recognition

Thông thường, với các bài toán classification, ta thường hay train một mô hình học máy học có giám sát trên một bộ training set với số lượng class nhất định và test mô hình đó trên một bộ test set có cùng các class với bộ đã được dùng để train. Khi đó, model sẽ chỉ thực hiện được task Closed-Set Recognition, nghĩa là classify một input vào một trong những class...

Thumbnail Image
1.4K
15
3 2
Avatar Thao Hoang Thu thg 2 27, 2023 10:00 SA
10 min read

"Đu trend" ChatGPT - Sinh augmentation data cho bài toán NLP

Những ngày qua ChatGPT có thể nói đã dấy lên một làn sóng thảo luận mạnh mẽ trong xã hội, không chỉ dừng lại trong cộng đồng IT. Người ta nói về nguy cơ robot/ trí tuệ nhân tạo thay thế con người nhiều hơn bao giờ hết. Tuy nhiên mình nghĩ chúng ta nên quan tâm nhiều hơn đến việc làm thế nào để sử dụng ChatGPT (cũng như các mô hình GPT) như một công cụ hỗ trợ để tối ưu hóa năng suất làm việc, cũ...

Thumbnail Image
958
8
2 0
Avatar Tung thg 2 23, 2023 3:44 SA
7 min read

[Paper Explain] PSPNet - Mô hình Deep Learning kinh điển cho bài toán Semantic Segmentation

  1. Giới thiệu Bài toán Semantic segmentation (Phân vùng ngữ nghĩa ảnh) là một trong những bài toán cơ bản trong lĩnh vực Thị giác máy tính, nhiệm vụ của bài toán là phân loại chính xác tới từng pixel trong ảnh. Hình ảnh dưới đây mô tả kết quả phân vùng với tập dữ liệu PASCAL VOC (theo thứ tự từ trái qua phải, lần lượt là ảnh đầu vào, ảnh kết quả và ảnh dự đoán).

Dễ thấy, kết quả của bài toán l...

Thumbnail Image
5.4K
104
11 35
Avatar Phạm Văn Toàn thg 2 21, 2023 3:50 SA
24 min read

ChatGPT hay là "Chết GPT"?

Cảnh báo

Bài viết này chỉ là quan điểm cá nhân của mình về ChatGPT - một ứng dụng AI sốt sình sịch trong thời gian gần đây. Tuy nhiên, bài viết này sẽ có cả những luận điểm không vừa tai về nó. Chống chỉ định với các Fan cuồng ChatGPT hay hội các nhà tư tưởng đang mơ mộng về một tương lai AI có thể thay thế con người.

Cha đẻ của ChatGPT là ai?

Có lẽ trong những ngày gần đây ChatGPT là một cụ...

Thumbnail Image
621
14
2 6
Avatar Nguyễn Văn Quân thg 2 19, 2023 4:56 SA
13 min read

[paper explain] Meta Pseudo Labels: khi ngai vàng thuộc về Semi-Supervised

  1. Mở đầu Như chúng ta đã biết thì các phương pháp semi-supervised learning đã góp công không nhỏ trong việc cải thiện hơn nữa các model state-of-the-art trong rất nhiều computer vision tasks như image classification, object detection, và semantic segmentation. Các phương pháp như Pseudo Labels hay self-training chắc cũng khá quen thuộc với những người từng làm về semi-supervised learning. Hôm...
Thumbnail Image
1.1K
20
3 6
Avatar Nguyen Mai thg 1 31, 2023 7:01 SA
12 min read

[Paper Explain] MetaFormer: Khi Attention is NOT all you need cho bài toán phân loại ảnh

Yêu cầu nhỏ Hiểu về các lớp Norm khác nhau hoạt động như nào: BatchNorm (BN), GroupNorm (GN), LayerNorm (LN) và biết cách sử dụng Pytorch

Hình 0. Cách hoạt động của các lớp Norm khác nhau

Mở đầu Từ khi Transformer được áp dụng cho bài toán phân loại ảnh qua ViT, đã có rất nhiều models mới tập trung vào cải thiện phép Self-Attention. Một khối encoder của Transformer có kiến trúc chung như ở hì...

Thumbnail Image
357
12
1 0
Avatar Nguyen Tung Thanh thg 1 31, 2023 3:40 SA
14 min read

Những sự thật thú vị về PT4AL: một SOTA Active Learning

Lời mở đầu Nhân dịp đầu xuân năm mới, chúc mọi người sức khỏe dồi dào và có những bước tiến lớn trong sự nghiệp.

Khoảng thời gian này cũng là dịp mình thường nhìn lại năm cũ và lên kế hoạch cho năm mới. Để hưởng ứng hoạt động khai bút đầu xuân, mình đã chọn viết về một trải nghiệm nhỏ cuối năm 2022. Hy vọng trong năm mới dựa trên những trải nghiệm này, chúng ta có thể rút kinh nghiệm để đạt đư...

Thumbnail Image
1.3K
17
1 0
Avatar Trung Đức thg 1 29, 2023 1:39 CH
16 min read

ChatGPT và 10 điều tồi tệ nhất có thể xảy ra

Nhân dịp đầu năm mới, chúc mọi người cùng gia đình luôn tràn đầy sức khỏe, an khang thịnh vượng!

Chào mọi người, sau một thời gian vắng bóng trên mặt trận chia sẻ kiến thức trên Viblo thì nay mình đã trở lại rồi đây. Trong không khí nghỉ lễ, trên khắp các mặt trận, đặc biệt là TikTok, mình thấy các reviewer liên tục đề cập tới một hiện tượng tương đối hot - ChatGPT. ChatGPT là gì? Tại sao nó l...

Thumbnail Image
623
7
3 1
Avatar Trần Đức Trung thg 12 22, 2022 10:21 SA
16 min read

Xử lý dữ liệu hơi lớn một xíu với Dask

Khi nhắc đến xử lý dữ liệu bảng thì đa số chúng ta sẽ lựa chọn Pandas để đọc và thao tác với dữ liệu, và mình cũng không ngoại lệ. Tuy vậy khi nhu cầu xử lý tăng dần theo số lượng, ta sẽ cần tìm kiếm các thư viện cũng như cách thức triển khai khác để tối ưu được lượng tài nguyên cần đầu tư. Bài viết này giới thiệu về Dask và nói chi tiết hơn về cách thư viện này xử lý phân tán trên lượng dữ liệ...

Thumbnail Image
655
8
0 0
Avatar Trinh Quang Huy thg 12 19, 2022 4:35 CH
11 min read

[Paper Explain] EfficientFormer: Vision Transformers at MobileNet Speed

I. Mở Đầu: Mô hình transformer là một mô hình cực kỳ nổi tiếng trong lĩnh vực NLP, và một năm trở lại đây nó đã được đưa qua lĩnh vực computer vision và được nghiên cứu cực kỳ phổ biến nhưng một điểm yếu của nó là cực kỳ nặng và có độ chễ cao. Với điểm yếu này thì cực kỳ khó để có thể triển khai trên các thiết bị có cấu hình phần cứng yếu như mobile phone. Paper hôm nay sẽ giúp giải quyết vấn đ...

Featured member
Viblo
Let's register a Viblo Account to get more interesting posts.