Image Cover
Avatar

Sun* AI Research Team

level partner

Nhà sáng tạo nội dung hạng Bạc

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Bài viết được ghim

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
11.4K
53
21 7

Tất cả bài viết

Thumbnail Image
3.0K
9
3 5
Avatar Trung Đức Jun 13th, 2023 10:42 a.m.
9 phút đọc

Cứ thực hành Airflow dễ hiểu và đơn giản đã, chưa làm gì phức tạp cả

Mở đầu Tiếp nối bài viết chỉ toàn lý thuyết Bài viết về Airflow cho người mới như mình thì chúng ta đi ngay tới bài thực hành này thôi

Chú ý là mình sẽ thực hành cùng với Python nhé ạ, bài viết sẽ gồm 2 phần thực hành chính

  • Thực hành với các tác vụ đơn giản
  • Thực hành với bài toán đào tạo mô hình Deep Learning

Cài đặt môi trường

  • Trong bài viết của anh Hoàng, có đề cập tới việc setup nhan...
Thumbnail Image
4.9K
7
4 0
Avatar Trung Đức Jun 13th, 2023 10:42 a.m.
12 phút đọc

Bài viết về Airflow cho người mới như mình

Mở đầu Lướt dạo một vòng thì bài viết Airflow trên Viblo cũng có một số bài tương đối chi tiết như Tất tần tật về Airflow (P1) của anh Hoàng hay Một số điểm cần lưu ý khi sử dụng Airflow - Phần 1 của bạn Trung. Các bạn có thể đọc để hiểu hơn về Airflow

Đứng trên phương diện một người mới (đúng nghĩa, chưa từng làm việc với nó) thì bài viết này, mình rất mong muốn có thể vừa để lưu lại kiến thứ...

Thumbnail Image
765
6
3 0
Avatar Trung Đức Jun 5th, 2023 7:39 a.m.
13 phút đọc

ETL vs ELT không đơn giản chỉ là LT và TL?

Giới thiệu Một trong những việc mà những người làm việc với Data cần làm, đặc biệt là Data Engineering, cần quan tâm đó là việc trích xuất dữ liệu từ nhiều nguồn, đổ về một chỗ (Data Warehouse, Data Lake, ...), để lưu trữ và phân tích dữ liệu. Chúng ta có thể gọi nó là Data Pipeline. Để hiểu hơn về nó, trước hết chúng ta cùng đi trao đổi về ETL và ELT nào. Lẹt doit E-T-L là gì đã? Extract

  • Kha...
Thumbnail Image
1.8K
25
7 2
Avatar Bui Tien Tung May 31st, 2023 11:17 a.m.
19 phút đọc

Lightweight Fine-Tuning: Một hướng đi cho những người làm AI trong kỉ nguyên của các Super Large Models (Phần 2)

Note: Tiêu đề và nội dung của bài viết này được lấy cảm hứng từ bài viết của sếp mình: "Hướng đi nào cho những người làm AI trong kỉ nguyên của các Super Large Models?". Recommend các bạn nên đọc để tìm thêm những hướng phát triển trong tương lai (nếu các bạn là AI Engineer).

Nếu các bạn chưa đọc phần 1, có thể bắt đầu từ link này trước để có một cái nhìn tổng quan nhất: Lightweight Fine-Tunin...

Thumbnail Image
5.7K
23
11 1
Avatar Thao Hoang Thu May 22nd, 2023 1:31 p.m.
19 phút đọc

Bạn đã biết gì về prompt engineering? - Tổng hợp các tips tạo lời nhắc cho ChatGPT

Chắc thời gian qua các bạn cũng đã bắt gặp những bài viết với tiêu đề như "Kỹ sư tạo lời nhắc cho chatbot AI có thể kiếm 7,86 tỉ đồng/năm mà không cần bằng cấp công nghệ", hay "How to Get a Six-Figure Job as an AI Prompt Engineer". Vậy bạn có từng tự hỏi, chính xác thì kỹ sư tạo lời nhắc (prompt engineer) là làm cái gì?

Có thể so sánh như này, nếu mô hình ngôn ngữ lớn (LLM) như ChatGPT là sức ...

Thumbnail Image
505
3
0 6
Avatar Pham Thi Hong Anh May 21st, 2023 4:32 p.m.
5 phút đọc

Pandas 2.0 có gì mới?

Xin chào các bạn Pandas cũng đã cập nhật lên bản 2.0 một thời gian rồi, ở bài viết này mình sẽ viết bài review xem có khác biệt gì với version cũ không nhé. Ok chúng ta cùng bắt đầu thôi nào...

Upgrade pandas 2.0 Việc đầu tiên chúng ta cần làm là update lên pandas 2.0

Nâng cao hiệu suất

Pandas 2.0 cải thiện hiệu suất, fixbug và hoạt động hiệu quả hơn. Dựa vào việc sủ dụng Apacge Arrow - một ...

Thumbnail Image
1.5K
10
3 4
Avatar Nguyễn Văn Quân May 19th, 2023 2:15 a.m.
15 phút đọc

[Từ Transformer Đến Language Model] Bài 2: Kiến trúc và phương pháp Generative-Pretraining của GPT model

Tiếp nối series kiến thức nền tảng của large language model. Ở Bài 1: Bắt đầu với kiến trúc mô hình - Transformer, mình đã giới thiệu với các bạn về kiến trúc khởi nguồn của large language model - transformer. Trong phần này chúng ta sẽ tiếp tục đi sâu vào những thay đổi về mặt mô hình và phương pháp training unsupervised hiệu quả của language model thông qua lý thuyết và ví dụ code đơn giản mô...

Thumbnail Image
895
9
0 0
Avatar Pham Thi Hong Anh May 16th, 2023 7:36 a.m.
5 phút đọc

Visualize data chọn biểu đồ như thế nào cho hợp lý?

Hello mọi người, để tiếp tục chuỗi series khóa học Statistics with python, mình sẽ viết tiếp bài viết tóm tắt tuần thứ 3 của khóa học. Ở bài trước mình viết về kiến thức thống kê cơ bản. ở bài này mình sẽ viết về trực quan hóa các loại dữ liệu và làm sao để lựa chọn biểu đồ cho phù hợp. Nào chúng ta cùng bắt đầu nhé 😄

Như các bạn cũng biết mục đích cuả trực quan hóa dữ liệu là để cho người ng...

Thumbnail Image
328
12
3 0
Avatar Trinh Quang Huy May 14th, 2023 11:11 a.m.
39 phút đọc

"Nguyên tắc và Đạo đức" trong phát triển AI, đã đến lúc chúng ta cần quan tâm

Mở đầu Sự phát triển nhanh chóng của trí tuệ nhân tạo (AI) đã mang lại những thay đổi mang tính cách mạng cho nhiều ngành công nghiệp khác nhau, định hình lại cách chúng ta tương tác với công nghệ hàng ngày. Từ chăm sóc sức khỏe, tài chính hay đến giáo dục. Tuy nhiên, với tốc độ phát triển ngày càng nhanh, điển hình như trong thời gian gần đây với sự trỗi dậy của các mô hình Super Large Model đ...

Thumbnail Image
2.6K
15
4 3
Avatar Nguyễn Văn Quân May 10th, 2023 7:06 a.m.
20 phút đọc

[Từ Transformer Đến Language Model] Bài 1: Bắt đầu với kiến trúc mô hình - Transformer

Chỉ trong vòng vài tháng trở lại đây, thế giới công nghệ đã bị khuynh đảo bởi các mô hình AI như ChatGPT, GPT-4, DALLE-2, Midjourney... Các mô hình AI đã và đang thực sự thay đổi cách thế giới này vận hành, rất nhiều những job title sống dựa vào các ứng dụng AI được sinh ra, đồng thời cũng rất nhiều những công việc khác dần bị loại bỏ. Nếu không nhanh nhạy và kịp thích ứng, thậm chí đến những A...

Thumbnail Image
158
5
0 0
Avatar Đặng Hồng Thanh May 9th, 2023 8:23 a.m.
6 phút đọc

[Paper Explained] Boostrapping Semantic Segmentation with Regional Contrast (ReCo)

  1. Giới thiệu ReCo (Regional Contrast) là một pixel-level Contrastive framework định nghĩa một làm loss mới giúp cho semantic segmentation không những học từ local context (những pixel lân cận) mà còn học từ global context từ toàn bộ dataset (semantic class relationships). Reco được sử dụng để hỗ trợ cả học giám sát và học không giám sát. Với mỗi class xuất hiện trong 1 mini-batch, ReCo sẽ lấy ...
Thumbnail Image
2.6K
36
18 2
Avatar Bui Tien Tung May 8th, 2023 8:02 a.m.
22 phút đọc

Lightweight Fine-Tuning: Một hướng đi cho những người làm AI trong kỉ nguyên của các Super Large Models (Phần 1)

Note: Tiêu đề và nội dung của bài viết này được lấy cảm hứng từ bài viết của sếp mình: "Hướng đi nào cho những người làm AI trong kỉ nguyên của các Super Large Models?". Recommend các bạn nên đọc để tìm thêm những hướng phát triển trong tương lai (nếu các bạn là AI Engineer).

Tất nhiên, khi sếp đã đặt vấn đề thì mình cũng muốn viết 1 bài để phân tích sâu thêm một số khía cạnh, trường hợp ở đây...

Thumbnail Image
11.4K
53
21 7
Avatar Phạm Văn Toàn May 7th, 2023 6:13 a.m.
27 phút đọc

Langchain #1 - Điểm qua các chức năng sừng sỏ nhất của Langchain - một framework cực bá đạo khi làm việc với LLM

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
Thumbnail Image
266
4
0 0
Avatar Nguyen Tung Thanh May 5th, 2023 10:05 a.m.
7 phút đọc

[Paper Explain] Label-Efficient Semantic Segmentation with Diffusion Models: Tính discriminative của mô hình generative

Lời mở đầu DIffusion thì đã quá nổi tiếng với những task sinh ảnh từ text rồi. Trong bài này, mình sẽ giới thiệu về một nghiên cứu liên quan đến tính discriminative trong mô hình sinh để có thể ứng dụng của nó vào việc giải quyết các bài toán discriminative. Đó là paper: Label-Efficient Semantic Segmentation with Diffusion Models, được publish tại ICLR2022.

Với các bạn chưa có background về mô...

Thumbnail Image
197
5
0 0
Avatar Hieu Bui May 5th, 2023 9:19 a.m.
7 phút đọc

Cơ bản về fastai (P2) - DataBlock API

TIếp nối bài viết lần trước về các tính năng mì ăn liền của fastai, trong bài viết hôm nay, mình sẽ giới thiệu cho các bạn về để xử lý dữ liệu và hệ thống callback của fastai. Let's get started.

DataBlock API Thư viện fastai được thiết kế theo kiểu phân tầng. Ở trên cùng là tầng applications cho phép chúng ta train mô hình chỉ với vài dòng code như đã thấy ở bài viết trước.

Ví dụ để tạo Da...

Mayfest2023 ContentCreator
Thumbnail Image
1.0K
12
0 0
Avatar Nguyen Mai May 5th, 2023 9:17 a.m.
14 phút đọc

[Paper Explain] YOLOF: Lời tạm biệt cho multi-scale features trong Object Detection?

Ôn lại kiến thức Multi-scale features là gì và tại sao chúng lại cần thiết cho Object Detection? Lấy ví dụ về một mạng Object Detection khá phổ biến: YOLO. Như đã biết, điểm yếu của YOLO hồi mới ra mắt đó chính là khả năng phát hiện vật thể nhỏ cực kì kém. Đó là vì YOLO đã không tận dụng được Multi-scale features. YOLOv1 thực hiện đưa ra kết quả dự đoán Bounding Box (BBox) và Class dựa trên fea...

Thumbnail Image
315
5
2 1
Avatar Nguyen Toan Thinh May 5th, 2023 8:29 a.m.
12 phút đọc

SQL Query Antipatterns and Solution (Part 2)

Tiếp tục Seri về SQL Antipatterns, ở phần 1 mình đã giới thiệu với các bạn khái niệm về Antipatterns và một số Antipatterns đơn giản. Trong phần này chúng ta sẽ tiếp tục đi sâu vào những vấn đề phức tạp hơn. Cùng bắt đầu nào.

Một số SQL Antipatterns phổ biến (tiếp) 5. Tối ưu các công cụ tìm kiếm Đặt vấn đề Khi bạn muốn thực hiện tìm kiếm toàn văn bản, bạn sử dụng các toán tử khớp mẫu (ví dụ: L...

Thumbnail Image
671
5
3 1
Avatar Nguyen Toan Thinh May 5th, 2023 8:28 a.m.
12 phút đọc

SQL Query Antipatterns and Solution (part 1)

SQL là một ngôn ngữ không còn xa lạ với mọi lập trình viên và đối với với lập trình viên backend việc làm chủ được SQL là một điều rất quan trọng. Trong quá trình làm việc của mình với SQL mình đã tham khảo rất nhiều nguồn để tìm hiểu các lỗi hay mắc phải, các giải quyết/tối ưu nó. Bài viết này mình sẽ chia sẻ những kỹ thuật mình đang sử dụng để tối ưu hệ thống của mình với SQL.

Antipatterns l...

Thumbnail Image
101
3
0 0
Avatar Trần Quang Vinh May 5th, 2023 8:27 a.m.
8 phút đọc

[Paper explained] NISER: Normalized Item and Session Representations to Handle Popularity Bias

Nếu đã dùng qua các trang web như YouTube, có thể bạn đã từng để ý rằng một khi các bạn đã click vào một video nào đó, hệ thống của YouTube sẽ tự động gợi ý các video liên quan ở autoplay list hay là trang homepage. Điều này là do YouTube, dùng một Recommendation System để tự động gợi ý các video có độ liên quan cao đến video bạn vừa xem kể cả khi bạn đã login hay chưa login tài khoản Google. N...

Thumbnail Image
480
5
0 1
Avatar Trần Đức Trung May 5th, 2023 7:58 a.m.
14 phút đọc

Một số điểm cần lưu ý khi sử dụng Airflow - Phần 2

Sự linh hoạt của Airflow giúp cho chúng ta có thể tùy biến tối đa mã nguồn để đáp ứng các mục đích khác nhau. Bài viết này liệt kê một số điểm cần lưu ý để có thể tổ chức cũng như tạo mã nguồn tối ưu để sử dụng chung với Airflow.

Import đúng chỗ, tạo biến đúng chỗ

Để tối ưu hiệu suất của Airflow, ta tốt nhất là chỉ viết mã cần thiết để tạo các operator, định nghĩa các hàm callable và định ngh...

Thành viên nổi bật
Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí