Sun* AI Research Team

Nhà sáng tạo nội dung hạng Bạc

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Bài viết được ghim

Phạm Văn Toàn

thg 5 7, 2023 6:13 SA 27 phút đọc

Langchain #1 - Điểm qua các chức năng sừng sỏ nhất của Langchain - một framework cực bá đạo khi làm việc với LLM

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator

18.4K

Thao Hoang Thu

Bạn đã biết gì về prompt engineering? - Tổng hợp các tips tạo lời nhắc cho ChatGPT

Mayfest2023 ContentCreator ChatGPT Generative AI

8.3K

Nguyen Mai

[Paper Explain] YOLOv7: Sử dụng các "trainable bag-of-freebies" đưa YOLO lên một tầm cao mới (phần 3)

ContentCreator Object detection Yolo

5.1K

Trần Đức Trung

[Paper Explain] Reading Race: AI Recognises Patient's Racial Identity In Medical Images

ContentCreator Race Detection Medical imaging

322

Phan Huy Hoang

[Deep Learning] Graph Neural Network - A literature review and applications

Machine Learning Deep Learning Graph Neural Network Graph Representation Learning Graph Convolution Network

35.9K

195

Nguyen Mai

[Vinh danh Paper] QLoRA: Quantize để training mô hình hàng tỷ tham số trên Google Colab

ContentCreator Deep Learning LLM PEFT

6.1K

Tất cả bài viết

11.3K

Phạm Văn Toàn thg 7 23, 2023 2:23 SA

37 phút đọc

Tất tần tật về LLaMA-2 - liệu có đủ làm nên một cuộc cách mạng mới

Lời giới thiệu

Xin chào tất cả các bạn, đã lâu lắm rồi kể từ sau bài viết về Trải lòng sau khi đọc GPT-4 Technical Report của OpenAI - các bác nên đổi tên công ty đi mình không có viết bài về LLM nữa. Không phải vì mình không còn quan tâm đến lĩnh vực này mà bởi vì một phần mình chưa thực sự gặp được một LLM nào đủ hay về mặt kĩ thuật để chia sẻ đến tất cả mọi người, một phần vì mình đang tập ...

ContentCreator LLM

14.7K

Nguyen Mai thg 6 23, 2023 7:38 SA

10 phút đọc

Fine-tuning một cách hiệu quả và thân thiện với phần cứng: Adapters và LoRA

Fine-tuning là gì? Trong Machine Learning, Fine-tuning là một phương pháp của transfer learning, sử dụng weight của một pre-trained model để train với một bộ data mới, phù hợp với mục đích của người dùng và số lượng dataset thường nhỏ hơn khi pre-train. Việc làm này giúp tăng độ chính xác của model so với việc train trực tiếp với bộ dataset nhỏ của chúng ta. Thông thường, khi thực hiện fine-tun...

ContentCreator Deep Learning PEFT LLM

1.8K

Trung Đức thg 6 14, 2023 8:56 SA

11 phút đọc

Microsoft Fabric - Vừa mới vừa "cũ"

Giới thiệu

Vấn đề đặt ra: hệ thống phân tích dữ liệu của doanh nghiệp thường bao gồm một số dịch vụ sử dụng các định dạng dữ liệu độc quyền do các dịch vụ này được cung cấp từ các nhà cung cấp khác nhau. Điều này làm cho việc tích hợp trở nên phức tạp, tốn thời gian và chi phí, và các hệ thống kết quả thường rất dễ hỏng.
Vào ngày 23/5/2023 vừa qua, một giải pháp mới của Microsoft ra đời: M...

ContentCreator Data-Analysis data science

6.2K

Trung Đức thg 6 13, 2023 10:42 SA

9 phút đọc

Cứ thực hành Airflow dễ hiểu và đơn giản đã, chưa làm gì phức tạp cả

Mở đầu Tiếp nối bài viết chỉ toàn lý thuyết Bài viết về Airflow cho người mới như mình thì chúng ta đi ngay tới bài thực hành này thôi

Chú ý là mình sẽ thực hành cùng với Python nhé ạ, bài viết sẽ gồm 2 phần thực hành chính

Thực hành với các tác vụ đơn giản
Thực hành với bài toán đào tạo mô hình Deep Learning

Cài đặt môi trường

Trong bài viết của anh Hoàng, có đề cập tới việc setup nhan...

ContentCreator airflow Data engineer

12.8K

Trung Đức thg 6 13, 2023 10:42 SA

12 phút đọc

Bài viết về Airflow cho người mới như mình

Mở đầu Lướt dạo một vòng thì bài viết Airflow trên Viblo cũng có một số bài tương đối chi tiết như Tất tần tật về Airflow (P1) của anh Hoàng hay Một số điểm cần lưu ý khi sử dụng Airflow - Phần 1 của bạn Trung. Các bạn có thể đọc để hiểu hơn về Airflow

Đứng trên phương diện một người mới (đúng nghĩa, chưa từng làm việc với nó) thì bài viết này, mình rất mong muốn có thể vừa để lưu lại kiến thứ...

ContentCreator airflow Data engineer

1.3K

Trung Đức thg 6 5, 2023 7:39 SA

13 phút đọc

ETL vs ELT không đơn giản chỉ là LT và TL?

Giới thiệu Một trong những việc mà những người làm việc với Data cần làm, đặc biệt là Data Engineering, cần quan tâm đó là việc trích xuất dữ liệu từ nhiều nguồn, đổ về một chỗ (Data Warehouse, Data Lake, ...), để lưu trữ và phân tích dữ liệu. Chúng ta có thể gọi nó là Data Pipeline. Để hiểu hơn về nó, trước hết chúng ta cùng đi trao đổi về ETL và ELT nào. Lẹt doit E-T-L là gì đã? Extract

Kha...

ContentCreator data science Data engineer Data pipeline

3.0K

Bui Tien Tung thg 5 31, 2023 11:17 SA

19 phút đọc

Lightweight Fine-Tuning: Một hướng đi cho những người làm AI trong kỉ nguyên của các Super Large Models (Phần 2)

Note: Tiêu đề và nội dung của bài viết này được lấy cảm hứng từ bài viết của sếp mình: "Hướng đi nào cho những người làm AI trong kỉ nguyên của các Super Large Models?". Recommend các bạn nên đọc để tìm thêm những hướng phát triển trong tương lai (nếu các bạn là AI Engineer).

Nếu các bạn chưa đọc phần 1, có thể bắt đầu từ link này trước để có một cái nhìn tổng quan nhất: Lightweight Fine-Tunin...

Mayfest2023 ContentCreator AI Fine Tuning LLM

8.3K

Thao Hoang Thu thg 5 22, 2023 1:31 CH

19 phút đọc

Bạn đã biết gì về prompt engineering? - Tổng hợp các tips tạo lời nhắc cho ChatGPT

Chắc thời gian qua các bạn cũng đã bắt gặp những bài viết với tiêu đề như "Kỹ sư tạo lời nhắc cho chatbot AI có thể kiếm 7,86 tỉ đồng/năm mà không cần bằng cấp công nghệ", hay "How to Get a Six-Figure Job as an AI Prompt Engineer". Vậy bạn có từng tự hỏi, chính xác thì kỹ sư tạo lời nhắc (prompt engineer) là làm cái gì?

Có thể so sánh như này, nếu mô hình ngôn ngữ lớn (LLM) như ChatGPT là sức ...

Mayfest2023 ContentCreator ChatGPT Generative AI

570

Pham Thi Hong Anh thg 5 21, 2023 4:32 CH

5 phút đọc

Pandas 2.0 có gì mới?

Xin chào các bạn Pandas cũng đã cập nhật lên bản 2.0 một thời gian rồi, ở bài viết này mình sẽ viết bài review xem có khác biệt gì với version cũ không nhé. Ok chúng ta cùng bắt đầu thôi nào...

Upgrade pandas 2.0 Việc đầu tiên chúng ta cần làm là update lên pandas 2.0

Nâng cao hiệu suất

Pandas 2.0 cải thiện hiệu suất, fixbug và hoạt động hiệu quả hơn. Dựa vào việc sủ dụng Apacge Arrow - một ...

Mayfest2023 ContentCreator Pandas

3.1K

Nguyễn Văn Quân thg 5 19, 2023 2:15 SA

15 phút đọc

[Từ Transformer Đến Language Model] Bài 2: Kiến trúc và phương pháp Generative-Pretraining của GPT model

Tiếp nối series kiến thức nền tảng của large language model. Ở Bài 1: Bắt đầu với kiến trúc mô hình - Transformer, mình đã giới thiệu với các bạn về kiến trúc khởi nguồn của large language model - transformer. Trong phần này chúng ta sẽ tiếp tục đi sâu vào những thay đổi về mặt mô hình và phương pháp training unsupervised hiệu quả của language model thông qua lý thuyết và ví dụ code đơn giản mô...

Mayfest2023 ContentCreator Transformer NLP LLM Language Model

1.1K

Pham Thi Hong Anh thg 5 16, 2023 7:36 SA

5 phút đọc

Visualize data chọn biểu đồ như thế nào cho hợp lý?

Hello mọi người, để tiếp tục chuỗi series khóa học Statistics with python, mình sẽ viết tiếp bài viết tóm tắt tuần thứ 3 của khóa học. Ở bài trước mình viết về kiến thức thống kê cơ bản. ở bài này mình sẽ viết về trực quan hóa các loại dữ liệu và làm sao để lựa chọn biểu đồ cho phù hợp. Nào chúng ta cùng bắt đầu nhé

Như các bạn cũng biết mục đích cuả trực quan hóa dữ liệu là để cho người ng...

Mayfest2023 ContentCreator data visualize Python statistics

424

Trinh Quang Huy thg 5 14, 2023 11:11 SA

39 phút đọc

"Nguyên tắc và Đạo đức" trong phát triển AI, đã đến lúc chúng ta cần quan tâm

Mở đầu Sự phát triển nhanh chóng của trí tuệ nhân tạo (AI) đã mang lại những thay đổi mang tính cách mạng cho nhiều ngành công nghiệp khác nhau, định hình lại cách chúng ta tương tác với công nghệ hàng ngày. Từ chăm sóc sức khỏe, tài chính hay đến giáo dục. Tuy nhiên, với tốc độ phát triển ngày càng nhanh, điển hình như trong thời gian gần đây với sự trỗi dậy của các mô hình Super Large Model đ...

Mayfest2023 ContentCreator AI

5.4K

Nguyễn Văn Quân thg 5 10, 2023 7:06 SA

20 phút đọc

[Từ Transformer Đến Language Model] Bài 1: Bắt đầu với kiến trúc mô hình - Transformer

Chỉ trong vòng vài tháng trở lại đây, thế giới công nghệ đã bị khuynh đảo bởi các mô hình AI như ChatGPT, GPT-4, DALLE-2, Midjourney... Các mô hình AI đã và đang thực sự thay đổi cách thế giới này vận hành, rất nhiều những job title sống dựa vào các ứng dụng AI được sinh ra, đồng thời cũng rất nhiều những công việc khác dần bị loại bỏ. Nếu không nhanh nhạy và kịp thích ứng, thậm chí đến những A...

Mayfest2023 ContentCreator Deep Learning Language Model NLP Transformer

208

Đặng Hồng Thanh thg 5 9, 2023 8:23 SA

6 phút đọc

[Paper Explained] Boostrapping Semantic Segmentation with Regional Contrast (ReCo)

Giới thiệu ReCo (Regional Contrast) là một pixel-level Contrastive framework định nghĩa một làm loss mới giúp cho semantic segmentation không những học từ local context (những pixel lân cận) mà còn học từ global context từ toàn bộ dataset (semantic class relationships). Reco được sử dụng để hỗ trợ cả học giám sát và học không giám sát. Với mỗi class xuất hiện trong 1 mini-batch, ReCo sẽ lấy ...

Mayfest2023 ContentCreator Contrastive Learning Image Segmentation

4.0K

Bui Tien Tung thg 5 8, 2023 8:02 SA

22 phút đọc

Lightweight Fine-Tuning: Một hướng đi cho những người làm AI trong kỉ nguyên của các Super Large Models (Phần 1)

Tất nhiên, khi sếp đã đặt vấn đề thì mình cũng muốn viết 1 bài để phân tích sâu thêm một số khía cạnh, trường hợp ở đây...

Mayfest2023 ContentCreator AI Fine Tuning LLM Adaptation

18.4K

Phạm Văn Toàn thg 5 7, 2023 6:13 SA

27 phút đọc

Langchain #1 - Điểm qua các chức năng sừng sỏ nhất của Langchain - một framework cực bá đạo khi làm việc với LLM

Độ hot của Langchain

Mayfest2023 ContentCreator

409

Nguyen Tung Thanh thg 5 5, 2023 10:05 SA

7 phút đọc

[Paper Explain] Label-Efficient Semantic Segmentation with Diffusion Models: Tính discriminative của mô hình generative

Lời mở đầu DIffusion thì đã quá nổi tiếng với những task sinh ảnh từ text rồi. Trong bài này, mình sẽ giới thiệu về một nghiên cứu liên quan đến tính discriminative trong mô hình sinh để có thể ứng dụng của nó vào việc giải quyết các bài toán discriminative. Đó là paper: Label-Efficient Semantic Segmentation with Diffusion Models, được publish tại ICLR2022.

Với các bạn chưa có background về mô...

Mayfest2023 ContentCreator diffusion-model few-shot

254

Hieu Bui thg 5 5, 2023 9:19 SA

7 phút đọc

Cơ bản về fastai (P2) - DataBlock API

TIếp nối bài viết lần trước về các tính năng mì ăn liền của fastai, trong bài viết hôm nay, mình sẽ giới thiệu cho các bạn về để xử lý dữ liệu và hệ thống callback của fastai. Let's get started.

DataBlock API Thư viện fastai được thiết kế theo kiểu phân tầng. Ở trên cùng là tầng applications cho phép chúng ta train mô hình chỉ với vài dòng code như đã thấy ở bài viết trước.

Ví dụ để tạo Da...

Mayfest2023 ContentCreator

1.5K

Nguyen Mai thg 5 5, 2023 9:17 SA

14 phút đọc

[Paper Explain] YOLOF: Lời tạm biệt cho multi-scale features trong Object Detection?

Ôn lại kiến thức Multi-scale features là gì và tại sao chúng lại cần thiết cho Object Detection? Lấy ví dụ về một mạng Object Detection khá phổ biến: YOLO. Như đã biết, điểm yếu của YOLO hồi mới ra mắt đó chính là khả năng phát hiện vật thể nhỏ cực kì kém. Đó là vì YOLO đã không tận dụng được Multi-scale features. YOLOv1 thực hiện đưa ra kết quả dự đoán Bounding Box (BBox) và Class dựa trên fea...

Mayfest2023 ContentCreator Object detection Yolo Computer Vision

366

Nguyen Toan Thinh thg 5 5, 2023 8:29 SA

12 phút đọc

SQL Query Antipatterns and Solution (Part 2)

Tiếp tục Seri về SQL Antipatterns, ở phần 1 mình đã giới thiệu với các bạn khái niệm về Antipatterns và một số Antipatterns đơn giản. Trong phần này chúng ta sẽ tiếp tục đi sâu vào những vấn đề phức tạp hơn. Cùng bắt đầu nào.

Một số SQL Antipatterns phổ biến (tiếp) 5. Tối ưu các công cụ tìm kiếm Đặt vấn đề Khi bạn muốn thực hiện tìm kiếm toàn văn bản, bạn sử dụng các toán tử khớp mẫu (ví dụ: L...

Mayfest2023 ContentCreator SQL tối ưu hoá