Image Cover
Avatar

Sun* AI Research Team

level partner

Nhà sáng tạo nội dung hạng Bạc

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Bài viết được ghim

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
14.1K
57
28 8

Tất cả bài viết

Thumbnail Image
176
5
0 0
Avatar Đặng Hồng Thanh thg 5 9, 2023 8:23 SA
6 phút đọc

[Paper Explained] Boostrapping Semantic Segmentation with Regional Contrast (ReCo)

  1. Giới thiệu ReCo (Regional Contrast) là một pixel-level Contrastive framework định nghĩa một làm loss mới giúp cho semantic segmentation không những học từ local context (những pixel lân cận) mà còn học từ global context từ toàn bộ dataset (semantic class relationships). Reco được sử dụng để hỗ trợ cả học giám sát và học không giám sát. Với mỗi class xuất hiện trong 1 mini-batch, ReCo sẽ lấy ...
Thumbnail Image
3.2K
38
20 2
Avatar Bui Tien Tung thg 5 8, 2023 8:02 SA
22 phút đọc

Lightweight Fine-Tuning: Một hướng đi cho những người làm AI trong kỉ nguyên của các Super Large Models (Phần 1)

Note: Tiêu đề và nội dung của bài viết này được lấy cảm hứng từ bài viết của sếp mình: "Hướng đi nào cho những người làm AI trong kỉ nguyên của các Super Large Models?". Recommend các bạn nên đọc để tìm thêm những hướng phát triển trong tương lai (nếu các bạn là AI Engineer).

Tất nhiên, khi sếp đã đặt vấn đề thì mình cũng muốn viết 1 bài để phân tích sâu thêm một số khía cạnh, trường hợp ở đây...

Thumbnail Image
14.1K
57
28 8
Avatar Phạm Văn Toàn thg 5 7, 2023 6:13 SA
27 phút đọc

Langchain #1 - Điểm qua các chức năng sừng sỏ nhất của Langchain - một framework cực bá đạo khi làm việc với LLM

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
Thumbnail Image
300
4
0 0
Avatar Nguyen Tung Thanh thg 5 5, 2023 10:05 SA
7 phút đọc

[Paper Explain] Label-Efficient Semantic Segmentation with Diffusion Models: Tính discriminative của mô hình generative

Lời mở đầu DIffusion thì đã quá nổi tiếng với những task sinh ảnh từ text rồi. Trong bài này, mình sẽ giới thiệu về một nghiên cứu liên quan đến tính discriminative trong mô hình sinh để có thể ứng dụng của nó vào việc giải quyết các bài toán discriminative. Đó là paper: Label-Efficient Semantic Segmentation with Diffusion Models, được publish tại ICLR2022.

Với các bạn chưa có background về mô...

Thumbnail Image
215
5
0 0
Avatar Hieu Bui thg 5 5, 2023 9:19 SA
7 phút đọc

Cơ bản về fastai (P2) - DataBlock API

TIếp nối bài viết lần trước về các tính năng mì ăn liền của fastai, trong bài viết hôm nay, mình sẽ giới thiệu cho các bạn về để xử lý dữ liệu và hệ thống callback của fastai. Let's get started.

DataBlock API Thư viện fastai được thiết kế theo kiểu phân tầng. Ở trên cùng là tầng applications cho phép chúng ta train mô hình chỉ với vài dòng code như đã thấy ở bài viết trước.

Ví dụ để tạo Da...

Mayfest2023 ContentCreator
Thumbnail Image
1.2K
12
0 0
Avatar Nguyen Mai thg 5 5, 2023 9:17 SA
14 phút đọc

[Paper Explain] YOLOF: Lời tạm biệt cho multi-scale features trong Object Detection?

Ôn lại kiến thức Multi-scale features là gì và tại sao chúng lại cần thiết cho Object Detection? Lấy ví dụ về một mạng Object Detection khá phổ biến: YOLO. Như đã biết, điểm yếu của YOLO hồi mới ra mắt đó chính là khả năng phát hiện vật thể nhỏ cực kì kém. Đó là vì YOLO đã không tận dụng được Multi-scale features. YOLOv1 thực hiện đưa ra kết quả dự đoán Bounding Box (BBox) và Class dựa trên fea...

Thumbnail Image
342
5
2 1
Avatar Nguyen Toan Thinh thg 5 5, 2023 8:29 SA
12 phút đọc

SQL Query Antipatterns and Solution (Part 2)

Tiếp tục Seri về SQL Antipatterns, ở phần 1 mình đã giới thiệu với các bạn khái niệm về Antipatterns và một số Antipatterns đơn giản. Trong phần này chúng ta sẽ tiếp tục đi sâu vào những vấn đề phức tạp hơn. Cùng bắt đầu nào.

Một số SQL Antipatterns phổ biến (tiếp) 5. Tối ưu các công cụ tìm kiếm Đặt vấn đề Khi bạn muốn thực hiện tìm kiếm toàn văn bản, bạn sử dụng các toán tử khớp mẫu (ví dụ: L...

Thumbnail Image
742
5
3 1
Avatar Nguyen Toan Thinh thg 5 5, 2023 8:28 SA
12 phút đọc

SQL Query Antipatterns and Solution (part 1)

SQL là một ngôn ngữ không còn xa lạ với mọi lập trình viên và đối với với lập trình viên backend việc làm chủ được SQL là một điều rất quan trọng. Trong quá trình làm việc của mình với SQL mình đã tham khảo rất nhiều nguồn để tìm hiểu các lỗi hay mắc phải, các giải quyết/tối ưu nó. Bài viết này mình sẽ chia sẻ những kỹ thuật mình đang sử dụng để tối ưu hệ thống của mình với SQL.

Antipatterns l...

Thumbnail Image
110
3
0 0
Avatar Trần Quang Vinh thg 5 5, 2023 8:27 SA
8 phút đọc

[Paper explained] NISER: Normalized Item and Session Representations to Handle Popularity Bias

Nếu đã dùng qua các trang web như YouTube, có thể bạn đã từng để ý rằng một khi các bạn đã click vào một video nào đó, hệ thống của YouTube sẽ tự động gợi ý các video liên quan ở autoplay list hay là trang homepage. Điều này là do YouTube, dùng một Recommendation System để tự động gợi ý các video có độ liên quan cao đến video bạn vừa xem kể cả khi bạn đã login hay chưa login tài khoản Google. N...

Thumbnail Image
600
5
0 1
Avatar Trần Đức Trung thg 5 5, 2023 7:58 SA
14 phút đọc

Một số điểm cần lưu ý khi sử dụng Airflow - Phần 2

Sự linh hoạt của Airflow giúp cho chúng ta có thể tùy biến tối đa mã nguồn để đáp ứng các mục đích khác nhau. Bài viết này liệt kê một số điểm cần lưu ý để có thể tổ chức cũng như tạo mã nguồn tối ưu để sử dụng chung với Airflow.

Import đúng chỗ, tạo biến đúng chỗ

Để tối ưu hiệu suất của Airflow, ta tốt nhất là chỉ viết mã cần thiết để tạo các operator, định nghĩa các hàm callable và định ngh...

Thumbnail Image
4.7K
12
6 0
Avatar Trung Đức thg 5 5, 2023 7:08 SA
18 phút đọc

PySpark với một project Machine Learning nho nhỏ

Trong không khi người người MayFest, nhà nhà MayFest, tiếp nối series tự học và khám phá về Data Sience, trong bài viết hôm nay mình sẽ chia sẻ cùng mọi người kiến thức cơ bản cũng như thực hành về Spark với một project Machine Learning nho nhỏ.

Là một người đã hoặc đang làm việc với dữ liệu, chắc hẳn các bạn đã quá quen với việc lưu trữ dữ liệu trên máy local cá nhân hoặc server cá nhân, công...

Thumbnail Image
687
4
1 0
Avatar Đinh Trọng Huy thg 5 4, 2023 4:37 CH
14 phút đọc

Evaluating and Testing models - có vẻ phức tạp hơn bạn nghĩ

Lời mở đầu Đánh giá/kiểm thử là một trong những khâu quan trọng nhất trong kỹ thuật phần mềm. Việc kiểm thử đảm bảo tránh các lỗi phát sinh trong quá trình sử dụng sản phẩm của người dùng, cũng như kiểm tra liệu sản phẩm đã đạt đến yêu cầu nào đó của người lập trình cũng như khách hàng.

Trong Machine Learning, mọi thứ cũng cơ bản là vậy. Đánh giá không chỉ đơn giản là dùng 1 metric nào đấy như...

Thumbnail Image
964
8
1 1
Avatar Nguyen Tung Thanh thg 5 4, 2023 12:43 CH
9 phút đọc

[Paper Explain] Improved Denoising Diffusion Probabilistic Models (v1)

Giới thiệu Năm 2020, DDPM (Denoising Diffusion Probabilistic Models) đưa ra một số cải tiến, đơn giản hoá cho mô hình diffusion và đạt được SOTA trên tập CIFAR10. Vài tháng sau đó, đầu năm 2021, OpenAI xuất bản một paper đưa ra một số cải tiến cho DDPM. Trong bài viết này mình sẽ cố gắng làm nổi bật một số điều hay ho trong paper cải tiến này. Mặc dù rất nhiều settings trong DDPM vẫn còn được d...

Thumbnail Image
801
6
1 0
Avatar Hieu Bui thg 5 4, 2023 10:03 SA
8 phút đọc

Cơ bản về fastai - Thư viện bậc cao cho Pytorch (P1)

Intro Hello mọi người, một mùa Mayfest nữa lại tới nên mình quay lại viết bài và chủ đề của bài viết ngày hôm nay là về thư viện fastai.

Nếu như trong Tensorflow có Keras thì Pytorch cũng có một số thư viện bậc cao để việc phát triển mô hình học sâu nhanh chóng và thuận tiện hơn như Lightning, Ignite và fastai. Fastai được thiết kế xung quanh 2 mục tiêu chính: Dễ tiếp cận và có thể nhanh chó...

Thumbnail Image
258
4
0 2
Avatar Bui Quang Manh thg 5 4, 2023 9:45 SA
7 phút đọc

Tối ưu quá trình huấn luyện với tf.data API

A. Tensorflow data pipelines

Theo định nghĩa từ trang chủ Tensorflow , tf.data API cho phép bạn xây dựng đầu vào dữ liệu cho các mô hình từ đơn giản tới phức tạp. Nhưng cho dù đơn giản hay phức tạp, data pipeline cũng thường có 3 bước như sau:

  • Extract
  • Transform
  • Load

import tensorflow as tf import tensorlfow_datasets as tfds

extract phase dataset = tfds.load(name="mnist", split=...

Thumbnail Image
4.5K
10
2 0
Avatar Trần Đức Trung thg 5 4, 2023 9:40 SA
18 phút đọc

Một số điểm cần lưu ý khi sử dụng Airflow - Phần 1

Airflow là một công cụ quản lý luồng dữ liệu phổ biến trong các hệ thống xử lý dữ liệu hiện đại. Tuy nhiên, việc sử dụng một tổ hợp nhiều thành phần như vậy đòi hỏi người dùng phải có nhiều kiến thức và kinh nghiệm để có thể sử dụng framework này một cách hiệu quả. Chính vì vậy, trong bài viết này, mình sẽ giới thiệu cho các bạn một số thứ cần quan tâm trong việc sử dụng Airflow, từ cách setup ...

Thumbnail Image
1.3K
8
1 0
Avatar Nguyen Mai thg 5 4, 2023 9:06 SA
14 phút đọc

[Paper Explain] RTMDet: YOLO của OpenMMLab

Mở đầu Mình khá là thích OpenMMLab, một team nghiên cứu đã cung cấp rất nhiều repo tăng tốc các thử nghiệm như MMDetection, MMSegmentation, MMCV,... Đây là lần đầu mình đọc, và phân tích một paper của OpenMMLab. Về cơ bản thì đây chỉ là một họ model Object Detection rất là nhanh, và chính xác gọi là Real-Time Models for Object Detection: RTMDet. Ngoài Object Detection, RTMDet còn có thể thực hi...

Thumbnail Image
234
5
0 0
Avatar Trần Quang Vinh thg 5 4, 2023 8:52 SA
11 phút đọc

[Paper explained] Non-local Neural Networks

Trong deep learning, việc lấy được các thông tin ở xa so với vị trí hiện tại khá là quan trọng. Ví dụ, với dữ liệu dạng sequence, ta có thể dùng phép recurrent để làm việc này. Còn với dữ liệu dạng ảnh, ta thường stack các phép convolution lên nhau để mở rộng receptive field. Cả hai phép này đều có đặc điểm là chúng chỉ xử lý các local neighborhood (các phép recurrent thường chỉ lấy thông tin c...

Thumbnail Image
2.5K
6
1 0
Avatar Trung Đức thg 5 4, 2023 8:13 SA
7 phút đọc

Cùng thiết lập Multi Node Cluster trong Hadoop 2.x nào!

Trong bài viết trước của mình, mình đã giới thiệu về Hadoop và các thành phần của Hadoop. Hadoop là một hệ sinh thái mã nguồn mở được sử dụng để lưu trữ và xử lý dữ liệu lớn. Nhân tiện một ngày đẹp trời được giao task setup multi node cluster để làm 1 số công việc trên công ty, mình viết luôn một bài coi như node lại quá trình cài đặt cũng như kiểm thử về multi node cluster trong Hadoop.

Việc ...

Thumbnail Image
330
4
0 0
Avatar Bui Quang Manh thg 5 4, 2023 7:35 SA
7 phút đọc

Graph execution và Eager execution trong Tensorflow

<img src="https://images.viblo.asia/0c976705-3d65-4272-8779-0972e528987c.png" >

   Figure 1. Eager Execution vs. Graph Execution  <br>
(https://towardsdatascience.com/eager-execution-vs-graph-execution-which-is-better-38162ea4dbf6)

Tensorflow là một nền tảng hỗ trợ cho việc học máy từ việc tải, xử lý dữ liệu đến huấn luyện, triển khai mô hình cùng vô vàn tác vụ khác.

Tensorflow...

Thành viên nổi bật
Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí