Sun* AI Research Team

Nhà sáng tạo nội dung hạng Bạc

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Bài viết được ghim

Phạm Văn Toàn

thg 5 7, 2023 6:13 SA 27 phút đọc

Langchain #1 - Điểm qua các chức năng sừng sỏ nhất của Langchain - một framework cực bá đạo khi làm việc với LLM

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator

19.5K

Thao Hoang Thu

Bạn đã biết gì về prompt engineering? - Tổng hợp các tips tạo lời nhắc cho ChatGPT

Mayfest2023 ContentCreator ChatGPT Generative AI

9.4K

Nguyen Mai

[Paper Explain] YOLOv7: Sử dụng các "trainable bag-of-freebies" đưa YOLO lên một tầm cao mới (phần 3)

ContentCreator Object detection Yolo

5.3K

Trần Đức Trung

[Paper Explain] Reading Race: AI Recognises Patient's Racial Identity In Medical Images

ContentCreator Race Detection Medical imaging

341

Phan Huy Hoang

[Deep Learning] Graph Neural Network - A literature review and applications

Machine Learning Deep Learning Graph Neural Network Graph Representation Learning Graph Convolution Network

37.6K

198

Nguyen Mai

[Vinh danh Paper] QLoRA: Quantize để training mô hình hàng tỷ tham số trên Google Colab

ContentCreator Deep Learning LLM PEFT

7.4K

Tất cả bài viết

1.6K

Thao Hoang Thu thg 1 31, 2024 4:48 CH

8 phút đọc

Bạn đã biết gì về prompt engineering? (P3) - Cải thiện Retrieval Augmented Generation (RAG) với query transformation

Ở bài trước mình đã giới thiệu sơ qua về RAG - Retrieval Augmented Generation - một phương pháp hữu hiệu giải quyết vấn đề hallucination cho các bài toán dùng LLM để truy xuất và cung cấp thông tin.

RAG giúp nâng cao kiến thức của mô hình ngôn ngữ bằng thông tin từ các nguồn bên ngoài đáng tin cậy như Wikipedia, các tài liệu về một vấn đề cụ thể. Vì vậy bước quan trọng nhất đối với RAG là đảm ...

ContentCreator ChatGPT LLM Prompt Engineering

311

Tiểu Hoàng Hạnh thg 1 31, 2024 1:35 CH

4 phút đọc

Skorch: Cách để Pytorch trở nên đơn giản

Giới thiệu Skorch PyTorch luôn là một lựa chọn của hầu hết các anh em AI engineer để xây dựng bất kỳ mô hình học sâu nào. Tuy nhiên, có một điều đặc biệt mà anh em nào từng code PyTorch cũng thường xuyên gặp phải như hình bên dưới:

Trong đoạn code trên, với mỗi epoch thì chính ta cần lặp qua hết các batch dữ liệu. Mỗi batch dữ liệu chúng ta cần forward qua mô hình, tính loss và backward để cập...

ContentCreator PyTorch

1.2K

Pham Thi Hong Anh thg 1 29, 2024 10:08 SA

6 phút đọc

Viết code chỉ bằng mô tả, có thể không? Cùng thử Jupyter AI nhé.

Chào các bạn, như chúng ta cũng đã thấy ChatGPT đã làm khuấy động thị trường được gần 1 năm rồi. Kể cả tech hay non-tech đều sử dụng GPT khá là nhiều. Và vì vậy mình cũng muốn thử tìm kiếm xem có thể viết code chỉ bằng những mô tả từ ngữ thì có thể không? Và mình đã tìm thấy jupyter-ai . Với Jupyter-ai chúng ta ssẽ sử dụng Jupyter AI trực tiếp trong Jupyter Notebook và Jupyter Lab của mình để d...

ContentCreator Jupyter Pandas

736

Trung Đức thg 1 26, 2024 10:04 SA

16 phút đọc

6 chiến lược để prompt hiệu quả mà OpenAI đưa ra có gì hot? (Phần 1)

Lời mở đầu Chào các bạn, mình trở lại rồi đây. Sau một thời gian làm dự án về một hệt thống trợ lý ảo sử dụng các công nghệ bên thứ 3 như OpenAI, Azure thì hôm nay, mình sẽ chia sẻ cho các bạn một kiến thức khá hot dạo gần đầy liên quan đến lĩnh vực Prompt Engineering, đó là prompt sao cho hiệu quả ChatGPT xịn xò, nhưng nếu bạn không biết cách hỏi hay hướng dẫn nó trả lời sao cho đúng ý bạn, th...

ContentCreator ChatGPT Prompt Engineering

5.9K

Nguyen Tu Xuan Cong thg 12 29, 2023 8:44 SA

19 phút đọc

Ý nghĩa của tên gọi "Cross-Entropy"

Giới thiệu Chắc hẳn các bạn không còn xa lạ gì với các mô hình ngôn ngữ lớn (large language models - LLM), kể từ khi OpenAI ra mắt ChatGPT vào tháng 11 năm ngoái (2022) thì thuật ngữ này ngày càng xuất hiện nhiều hơn và AI cũng được chú ý đến nhiều hơn. Sau hơn 1 năm số lượng các mô hình ngôn ngữ gia tăng một cách chóng mặt với đa dạng về kích thước, ngôn ngữ, phạm vi ứng dụng. Có thể nói lĩnh ...

ContentCreator AI Machine Leaning

177

Hieu Bui thg 12 29, 2023 8:29 SA

8 phút đọc

Callback trong fastai (P3)

Intro Tiếp tục chuỗi bài viết về thư viện fastai, trong bài viết hôm nay, chúng ta sẽ cùng nhau tìm hiểu về hệ thống callback - nguyên liệu chính của training loop trong class Learner.

Một chút về Callback Callback là gì? Callback về cơ bản chỉ là một function được gọi khi một sự kiện nào đó xảy ra. Ví dụ khi các bạn code 1 trang web bằng HTML với một nút trên đó. Nếu bạn muốn có 1 tác vụ nào ...

ContentCreator Deep Leanring fastai

2.6K

Nguyễn Văn Quân thg 12 26, 2023 1:42 CH

17 phút đọc

[Từ Transformer Đến Language Model] Tổng quan về Large Language Model (phần 2)

ADAPTATION TUNING OF LLMS Sau quá trình pretraining, tiếp đến ta sẽ cần finetune mô hình với downstream task nếu muốn mô hình hoạt động tốt với các tác vụ thực tế. Ở thời điểm hiện tại có 2 hướng finetuning chính cho LLM là : instruction tuning và alignment tuning. Cách tiếp cận đầu tiên chủ yếu nhằm mục đích nâng cao (hoặc mở khóa) khả năng của LLM, trong khi cách tiếp cận sau nhằm mục đích đi...

ContentCreator LLM PaperExplain

328

Trần Đức Trung thg 12 26, 2023 8:45 SA

16 phút đọc

[Paper Explain] IAG: Induction-Augmented Generation Framework for Answering Reasoning

Cũng khá lâu rồi thì mình mới viết Viblo, một phần vì lười và cũng một phần vì có quá nhiều thứ cần cập nhật, đặc biệt là LLM khi cứ vài tuần lại có thêm một thứ mới để đọc. Nhưng lười mãi thì cũng không tốt, bài viết này sẽ giới thiệu về bài báo mình đang đọc có tên gọi "IAG: Induction-Augmented Generation Framework for Answering Reasoning Questions". Mọi người có thể đọc nội dung chi tiết của...

ContentCreator RAG LLM

800

Nguyen Toan Thinh thg 11 28, 2023 2:18 SA

14 phút đọc

Xử lý dữ liệu cơ bản trên S3 với boto3 và django-storage

Hiện nay, việc làm việc với dữ liệu trên đám mây đã trở thành một phần quan trọng và phổ biến. Trong số các dịch vụ đám mây phổ biến, Amazon Web Services (AWS) S3 (Simple Storage Service) là một trong những dịch vụ lưu trữ đám mây hàng đầu. Với khả năng linh hoạt, độ tin cậy và khả năng mở rộng, S3 đã trở thành một lựa chọn phổ biến cho việc lưu trữ và quản lý dữ liệu.

Trong bài viết này, chún...

ContentCreator AWS S3 boto3

641

Trung Đức thg 11 24, 2023 9:16 SA

7 phút đọc

Dùng Chat GPT ẵm quà sự kiện của Viblo chỉ với 30 phút?

Độ hot của ChatGPT thời gian vừa rồi thì không phải bàn cãi nữa rồi, đợt này mình có thử nghiệm để nó sinh content đề bài cho một bài giải thuật để tham gia sự kiện kiếm tí quà ăn Tết xem thế nào.

Link sự kiện Viblo Contribution Event 2023 cho mọi người tham khảo và kiếm quà Tết cùng mình: https://contribution.viblo.asia/ (quà thấp nhất là 1 chiếc áo phông rất xinh, và cao nhất lên đến 3tr) ...

ContentCreator viblo code contribute ChatGPT

3.4K

Pham Thi Hong Anh thg 11 24, 2023 3:17 SA

6 phút đọc

Tips vẽ biểu đồ đẹp bằng Python: Tạo Hiệu Ứng Vizual Hấp Dẫn

Việc sử dụng Python để vẽ biểu đồ không chỉ là hiệu quả mà còn là một cách thú vị để trình bày dữ liệu. Với python chúng ta có thể custom chart theo như mình mong muốn. Trong bài viết này, chúng ta sẽ khám phá một số tips hữu ích để tạo ra những biểu đồ đẹp và ấn tượng bằng Python.

Chọn thư viện phù hợp

Python cung cấp nhiều thư viện hữu ích cho việc vẽ biểu đồ, như Matplotlib, Seaborn, Plotl...

ContentCreator Python Visualization

4.9K

Nguyễn Văn Quân thg 11 22, 2023 8:50 SA

30 phút đọc

[Từ Transformer Đến Language Model] Tổng quan về Large Language Model (phần 1)

Ở 2 bài viết trước mình đã trình bày các kiến thức cơ bản về mô hình transformer. Để tiếp nối series tìm hiểu về large language model, lần này mình sẽ trình bày tổng quan về Large Language Model. Nhóm bài viết sẽ tập trung vào 4 khía cạnh chính của LLMs: pre-training, adaptation tuning, utilization, và capacity evaluation. Ở bài này, mình sẽ tập trung vào các khái niệm cơ bản của LLM và LLM pre...

ContentCreator LLM Transformer PaperExplain

1.4K

Trung Đức thg 11 20, 2023 3:13 SA

15 phút đọc

Đừng lạc lối nữa! Azure Cognitive Search sẽ giúp bạn tìm đúng những gì bạn đang tìm kiếm

Mở đầu Azure là một nền tảng đám mây thông minh, do chính Microsoft phát triển. Gần đây thì nó không còn là một khái niệm mới nữa mà đã và đang được ứng dụng rất rộng rãi trong các doanh nghiệp rồi.

Với Azure, bạn có thể biến Cloud thành "ngôi nhà thứ hai" cho ứng dụng và dịch vụ của bạn. Nó cung cấp cho bạn một cách thức dễ dàng để lưu trữ, xử lý và quản lý dữ liệu của mình. Tưởng tượng rằng ...

ContentCreator azure Azure Cognitive Search ChatBot

514

Đặng Hồng Thanh thg 11 14, 2023 3:02 SA

9 phút đọc

[Paper Explain] Segment Anything in High Quality

Title: Segment Anything in High Quality
Original Paper: https://arxiv.org/pdf/2306.01567.pdf
Code: https://github.com/SysCV/sam-hq

Giới thiệu Gần đây, Segment Anything Model (SAM) đã đánh dấu một bước ngoặt lớn trong segmentation models. Mặc dù được huấn luyện với 1.1 tỉ mask nhưng mask prediction của SAM vẫn khá tệ trong nhiều trường hợp, đặc biệt là khi xử lý với những object mà có cấu...

ContentCreator segment anything Deep Learning

365

Trinh Quang Huy thg 11 6, 2023 2:40 SA

14 phút đọc

[Paper Explain] DAMFormer: Enhancing Polyp Segmentation through Dual Attention Mechanism

I. Mở đầu: Việc đưa các các hệ thống học máy vào trong y tế nhằm giúp các bác sĩ hay các chuyên gia y tế chuẩn đoán chính xác đang dần trở lên phổ biến hơn. Đặc biệt là phải nhắc đến nội soi trực tràng nhằm phát hiện các khối u bất thường, điều này cực kỳ quan trọng khi giúp phát hiện và loại bỏ các khối u ra khỏi cơ thể tránh chúng phát triển thành ung thư. Việc các khối u có hình dáng, kích t...

ContentCreator AI segmentation

7.8K

Đặng Hồng Thanh thg 11 5, 2023 9:07 SA

11 phút đọc

Các kỹ thuật tuning mô hình Large Language Model (LLM)

Sự nổi dậy của chat GPT và các mô hình ngôn ngữ lớn (Large Languae Model - LLM) đã thu hút được sự quan tâm lớn của công chúng. Chỉ trong 5 năm, các mô hình ngôn ngữ lớn - Transformer đã biến đổi gần như hoàn toàn lĩnh vực xử lý ngôn ngữ tự nhiên. Ngoài ra, chúng đang bắt đầu lấn sân các lĩnh vực như thị giác máy tính và sinh học tính toán. Mình cũng mới bắt đầu tìm hiểu LLM, nên mình sẽ cố gắn...

ContentCreator deeplearning

1.8K

Pham Minh Hoang thg 11 5, 2023 4:10 SA

11 phút đọc

Ảnh của bạn đã đẹp nay sẽ còn đẹp hơn với CodeFormer

Lời mở đầu Lâu lắm rồi mới quay lại viết bài 🥲. Thôi vào đề luôn đi.

Việc chụp một bức ảnh đẹp thường bị ảnh hưởng bởi rất nhiều yếu tố: thiết bị di động, khung cảnh, góc chụp, khoảng cách, thời điểm. Nếu trong một ngày mà bạn không may mắn thì chất lượng ảnh của bạn sẽ rất ba chấm: mờ, giật, nhiễu, v.v...

Hồi phục một bức ảnh mang ý nghĩa là gia tăng chất lượng cũng như độ chân thực của ảnh....

ContentCreator Basic Python Machine Learning PyTorch Super Resolution

3.1K

Thao Hoang Thu thg 10 31, 2023 4:36 CH

7 phút đọc

Bạn đã biết gì về prompt engineering? (P2) - Retrieval Augmented Generation - cứu cánh cho sự "ảo tưởng" của các LLM

Gần đây, sự phát triển của các mô hình ngôn ngữ lớn đã mở đường cho những tiến bộ vượt bậc trong lĩnh vực xử lý ngôn ngữ tự nhiên cũng như đẩy mạnh việc ứng dụng AI tạo sinh vào cuộc sống. Tuy nhiên, những mô hình mạnh mẽ này cũng đi kèm với một số thách thức cần phải giải quyết. Một trong những vấn đề lớn là hiện tượng "hallucination" - ảo giác, tức việc LLM tạo ra các thông tin không chính xá...

ContentCreator ChatGPT LLM Generative AI

803

Nguyen Mai thg 10 30, 2023 8:45 SA

16 phút đọc

[Paper Explain] Sử dụng Self-Instruct và Unnatural Instruction để tạo thêm dữ liệu training LLM

Instruction finetuning Việc có một mô hình ngôn ngữ (LM) có khả năng generalize tốt (trong quá khứ) thì khá là khó. Ta đã có thể train instance-level generalize model một cách khá ổn. Tức là, ta sẽ train một model thực hiện mapping input sang output trong task : với . Và khi thực hiện test thì ta sẽ test trên các instance với cùng task .

Tuy nhiên, một LM mạnh, như đã nói, thì cần phải có...

ContentCreator Deep Learning LLM

9.7K

Bui Quang Manh thg 10 30, 2023 1:41 SA

11 phút đọc

Tổng quan Search Engine và Vector Database [Part 1]

Hiện nay, các công cụ Vector Search Engine như Elastic Search, Azure Cognitive Search vừa lưu trữ data vừa có tính năng search trong khi các Vector database như supabase,... cũng hỗ trợ cả hai tính năng đó. Điều này đôi khi khiến chúng ta khó phân biệt giữa hai khái niệm này. Trong chuỗi bài viết này, mình sẽ cùng các bạn tìm hiểu về hai khái niệm này cũng như phân biệt giữa chúng.

A. Một số ...

ContentCreator Seach Engine Vector Database Azure Cognitive Search Vector Search