Image Cover
Avatar

Sun* AI Research Team

level partner

Nhà sáng tạo nội dung hạng Bạc

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Bài viết được ghim

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
19.8K
66
32 8

Tất cả bài viết

Thumbnail Image
19
1
0 0
Avatar Do Thanh Tung B Thứ Sáu, 12:35 CH
7 phút đọc

PHẦN 2: MASTERCLASS QAT PIPELINE – TUYỆT KỸ ĐẠT HIỆU NĂNG INT8 "VÔ HAO TỔN" CHO YOLOv8 / YOLO11

Lời mở đầu: Vượt qua giới hạn của PTQ

Trong đợt "xuất quân" trước, chúng ta đã cùng nhau giải mã cấu trúc đồ thị tính toán của YOLO và các bài toán lượng tử hóa căn bản. Nếu bạn vô tình lướt qua hoặc muốn ôn lại nội dung cốt lõi, hãy đọc ngay tại đây nhé:

🔗 Đọc lại bài viết trước: PHẦN 1: Tối ưu hóa "thần tốc" YOLO – Nghệ thuật ép cân từ FP32 xuống INT8 và giải mã cấu trúc đồ thị tính toán. ...

Thumbnail Image
17
1
0 0
Avatar Do Thanh Tung B Thứ Sáu, 12:22 CH
8 phút đọc

PHẦN 1: TỐI ƯU HÓA "THẦN TỐC" YOLO – NGHỆ THUẬT ÉP CÂN TỪ FP32 XUỐNG INT8 VÀ GIẢI MÃ CẤU TRÚC ĐỒ THỊ TÍNH TOÁN

Lời mở đầu: Trận chiến sống còn trên thiết bị Edge

Hãy tưởng tượng bạn vừa huấn luyện xong một mô hình YOLOv8 hoặc YOLO11 "vực sâu không đáy" với độ chính xác (mAP) cao ngất ngưởng. Bạn tự hào mang nó đi deploy lên các thiết bị phần cứng giới hạn (Edge Devices) như NVIDIA Jetson, camera thông minh, hay thiết bị nhúng. Nhưng... Bùm! FPS tụt dốc không phanh, thiết bị nóng rực, và độ trễ (latency...

Thumbnail Image
94
0
0 0
Avatar Trung Đức Chủ Nhật, 4:41 SA
7 phút đọc

Lượn một vòng RAG để xem mình outdate thế nào rồi nào (P2)

Lời mở đầu

  • Tiếp nối phần 1, chúng ta sẽ cùng trao đổi tiếp tại phần 2 này nhé
  1. 💡 LightRAG — Dual-Level Graph Retrieval

Reference: Guo et al. (HKUST), "LightRAG: Simple and Fast Retrieval-Augmented Generation", arXiv:2410.05779, Oct 2024 GitHub: HKUDS/LightRAG (22k+ stars)

Ý tưởng cốt lõi

Vấn đề của RAG truyền thống: Vector search tìm được các đoạn text "ngữ nghĩa gần" nhưng không hiểu m...

Thumbnail Image
97
0
2 0
Avatar Trung Đức Chủ Nhật, 1:47 SA
14 phút đọc

Lượn một vòng RAG để xem mình outdate thế nào rồi nào (P1)

Mở đầu

  • RAG là một công nghệ mình đã đi cùng nó khá lâu, từ RAG truyền thống, GraphRAG rồi AgenticRAG. Các dự án về chatbot cũng không phải là ít nên thời điểm này từ góc độ mình nó vẫn là một công nghệ tiềm năng, chẳng qua là mình cải tiến nó đủ sâu đến đâu, mang nó đi được tới đâu trong hệ thống của khách hàng.
  • Nhân dịp May Fest + sắp tới phát triển hơn về RAG + đã lui về ở ẩn khá lâu, mìn...
Thumbnail Image
248
1
0 0
Avatar Trần Trung Kiên thg 11 24, 2025 7:38 SA
12 phút đọc

Giải thích kiến trúc của XTTS: a Massively Multilingual Zero-Shot Text-to-Speech Model

  1. Lời mở đầu Xin chào mọi người, lại là tôi đây. Trong bài viết này mình sẽ giới thiệu về XTTS của Coqui AI, một mô hình ứng dụng trong việc clone giọng nói của người khác, đầu vào là file audio mình muốn clone và text mà mình muốn nói bằng giọng đó, kết quả trả ra sẽ là đoạn âm thanh mong muốn.

Ok thì câu hỏi đặt ra là tại sao lại là voice clone, thì đợt này mình đang làm đồ án tốt nghiệ...

Thumbnail Image
725
13
0 0
Avatar Trần Trung Kiên thg 11 5, 2025 3:32 SA
15 phút đọc

Mem0 - Kiến trúc Long Term Memory cho hệ thống AI Agent

  1. Giới Thiệu Xin chào mọi người, lại là tôi đây. Trong bài viết này mình xin giới thiệu về Mem0, một phương pháp quản lý Long Term Memory trong hệ thống AI Agents. Bài này mình chủ yếu đọc từ paper và trình bày cấu trúc theo paper: Mem0

Mọi người có thể đọc paper gốc để nắm được chi tiết.

Mem0 sẽ tập trung vào vấn đề chính là phần Long Term Memory trong hệ thống AI Agents. Thì trước tiên...

Thumbnail Image
7.9K
20
20 1
Avatar Phạm Văn Toàn thg 10 15, 2025 7:32 SA
65 phút đọc

Long mạch của Vibe Coding - Phần 1 - Spec Driven Development (SDD) và GitHub Speckit

1. Spec Driven Development (SDD) là gì? Mục tiêu và lợi ích trong thực tế

Spec Driven Development (Phát triển hướng Đặc tả) là một phương pháp phát triển phần mềm đặt đặc tả (specification) lên hàng đầu. Thay vì viết mã ngay, nhóm phát triển đầu tiên soạn thảo một tài liệu đặc tả chi tiết mô tả cái cần xây dựng và tại sao, rồi mới quyết định như thế nào để thực hiện. Đặc tả này đóng vai ...

Thumbnail Image
234
8
0 0
Avatar Trần Trung Kiên thg 10 4, 2025 3:39 CH
24 phút đọc

SADTALER - XÂY DỰNG BỨC ẢNH BIẾT NÓI

Lời mở đầu Chắc hẳn bạn đã từng ao ước có thể "thổi hồn" vào những bức ảnh tĩnh, biến chúng trở nên sống động và biết nói? Hay bạn đang tìm kiếm một công cụ đột phá để tạo ra những video độc đáo, thu hút cho các dự án của mình mà không cần đến kỹ năng quay dựng phức tạp? Nếu câu trả lời là có, thì bạn đã tìm đến đúng nơi rồi đấy

Trong thế giới kỹ thuật số không ngừng phát triển, trí tuệ nhân t...

Thumbnail Image
3.5K
11
4 2
Avatar Trần Trung Kiên thg 9 15, 2025 5:07 CH
8 phút đọc

Tất tần tật về Model Context Protocol (MCP)

Lời mở đầu Xin chào mọi người, lại là tôi đây. Trong thế giới AI ngày nay, một trong những thách thức lớn nhất không chỉ là xây dựng những mô hình mạnh mẽ, mà còn là làm thế nào để mô hình có thể giao tiếp, hiểu và phối hợp hiệu quả với các công cụ, dữ liệu, hay dịch vụ bên ngoài. Đây chính là lý do Model Context Protocol (MCP) ra đời.

Trong bài viết này, chúng ta sẽ cùng nhau đi sâu vào khám ...

Thumbnail Image
286
1
0 0
Avatar HOneOhOne thg 5 31, 2025 4:28 CH
12 phút đọc

Tìm hiểu về giải pháp Digital Humans phần 5: AIORTC - Đưa Digital human đến gần hơn với người dùng

Sơ đồ hoạt động của hệ thống: Dưới đây là sơ đồ hoạt động của hệ thống digital human:

Nhìn vào kiến trúc tổng thể, ta thấy rằng để hiển thị Digital Humans một cách sống động, chúng ta cần đồng bộ hóa giữa hình ảnh video và âm thanh, và đẩy cả hai vào một luồng stream duy nhất. Nhưng đó mới chỉ là một nửa câu chuyện. Trải nghiệm sẽ chẳng thể trọn vẹn nếu người dùng không thể tương tác trực tiếp...

Thumbnail Image
736
9
7 1
Avatar Hoàng Minh An thg 5 31, 2025 4:06 CH
13 phút đọc

[Advanced-LLM] Điều gì thật sự "ẩn dấu" sau "sự suy luận" của LLM ? Vén màn một chút sự thật....

Mở đầu. Hiện tại đang là 31/5🫠, mình về quê, chưa biết làm gì cả, thôi thì viết thêm một bài nữa kết thúc tháng 5 nào 😉.

Thì 3 bài trước đó mình đã viết loanh quanh về khả năng của LLM. Vậy thì chính xác model LLM đã làm gì, điều gì khiến nó trở lên lên thông minh như vậy ? Tại sao nó làm được nhưng điều tưởng chừng chỉ có con người mới làm được ? Liệu LLM đã thật sự suy luận hay AGI đang đến ...

Thumbnail Image
396
2
2 2
Avatar Duong Quang Minh B thg 5 28, 2025 6:02 CH
6 phút đọc

BentoML - Serving đơn giản mà hiệu quả

Introduction Trong quá trình triển khai mô hình machine learning/deep learning lên sản phẩm thực tế, những thách thức lớn không chỉ nằm ở việc huấn luyện mô hình, mà còn nằm ở khâu triển khai (serving) sao cho nhanh chóng, ổn định và dễ bảo trì. Trước kia, rất nhiều người bắt đầu bằng cách tự viết Flask hoặc FastAPI để dựng API cho mô hình, kết hợp với Docker nhằm mục đích đóng gói. Nhưng khi s...

Thumbnail Image
1.6K
6
4 0
Avatar Hoàng Minh An thg 5 27, 2025 10:04 SA
24 phút đọc

[Advanced-LLM] Reasoning LLM và Qwen 3 : Vị vua không ngai trong giới Open Source Phần 3.

Mở đầu. Ở phần 1 mình đã nói khá nhiều về các khái niệm của các dạng LLm, cách hoạt động và hình thành, đồng thời nói về các cách tạo nên reasoning của LLMs và phần 2 thì mình có nói đến một paper nói rằng :

  • RLVR chưa phải là một cách đột phá trong việc khiến base model tìm kiếm ra được những reasoning path vượt ra khỏi ngưỡng kiến thức của mô hình base. và việc tạo ra dataset gồm nhiều reas...
Thumbnail Image
379
2
1 0
Avatar Duong Quang Minh B thg 5 26, 2025 7:52 SA
12 phút đọc

Ensemble NVIDIA DALI Backend để xử lý dữ liệu trong Triton Inference Server ?

Overview Trong các bài viết trước đây, mình đã lần lượt giới thiệu đến các bạn hai công cụ cho quá trình tăng tốc xử lý dữ liệu và triển khai mô hình Deep Learning là NVIDIA DALI và Triton Inference Server. Mình xin phép nhắc lại thông tin cơ bản một chút.

NVIDIA DALI Với NVIDIA DALI (Data Loading Library), mình đã trình bày các khái niệm nền tảng về thư viện này với mục đích tối ưu hóa khâu t...

Thumbnail Image
160
2
1 0
Avatar Duong Quang Minh B thg 5 25, 2025 3:26 CH
7 phút đọc

Thử nghiệm hiệu suất NVIDIA DALI ?

Overview Trong bài viết lần trước , mình đã đề cập đến những thông tin cơ bản nhất của NVIDIA DALI, bao gồm khái niệm tổng quan về thư viện này, mục đích sử dụng cũng như những ưu điểm nổi bật mà nó mang lại trong quá trình xử lý dữ liệu hình ảnh và video cho các mô hình học sâu. Bên cạnh đó, mình cũng đã giới thiệu sơ lược về cách tích hợp DALI vào pipeline huấn luyện, giúp tăng tốc độ tiền xử...

Thumbnail Image
380
2
1 0
Avatar Duong Quang Minh B thg 5 24, 2025 5:41 CH
9 phút đọc

NVIDIA DALI - Tăng tốc xử lý dữ liệu ?

Introduction Khi huấn luyện các mô hình deep learning, chúng ta thường dành nhiều sự quan tâm đến kiến trúc mô hình, lựa chọn loss function phù hợp, optimizer, tuning hyperparameters,... Nhưng có một thứ cũng khá quan trọng mà ta thường không quan tâm nhiều đó là hiệu suất xử lý dữ liệu đầu vào.

Multi-stage data preprocessing pipelines bao gồm loading, decoding hay augmentations là bước không ...

Thumbnail Image
1.7K
6
5 1
Avatar HOneOhOne thg 5 24, 2025 2:22 SA
13 phút đọc

Giáo án LangGraph 101: Vì sao cần LangGraph và những khái niệm cơ bản

Giới thiệu

Nói chung LangGraph là một thư viện được xây dựng dựa trên LLM và LangChain, giúp ta đơn giản hóa việc xây dựng các Agent tự động hóa các tác vụ trong thế giới thực.

Vì sao cần LangGraph?

Ta thấy rằng LangChain cho phép chúng ta xây dựng code bằng LCEL( LangChain Expression Language ). Về cơ bản LCEL xây dựng các Chain, để dễ hiểu ta hãy xét một Chain cơ bản sau:

Có thể thấy, một...

Thumbnail Image
737
2
3 0
Avatar Ben thg 5 23, 2025 7:34 SA
8 phút đọc

[LangGraph Series] Part 2: Bàn tay con người giữa cỗ máy - Human-In-The-Loop

Introduction Bối cảnh Human-in-the-loop (HITL) trong LangGraph thật ra khá là đơn giản, chính cái tên dường như đã giúp bạn hình dung phần nào về định nghĩa của nó. Khi chúng ta cần sự tích hợp của con người vào quá trình xử lý của mô hình AI, hay nói cách khác là ta đang cố gắng kiểm soát chúng, hiệu chỉnh và xác nhận kết quả. Điều này khá quan trọng trong các hệ thống sử dụng LangGraph, đặc b...

Thành viên nổi bật
Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí