Image Cover
Avatar

Sun* AI Research Team

level partner

Silver Content Creator

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Pinned Posts

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
12.5K
56
24 8

All posts

Thumbnail Image
5.6K
30
17 9
Avatar Nguyen Van Dat thg 3 31, 2020 3:19 SA
21 min read

Recommendation System: Từ con số 0 đến hoàn chỉnh có gì?

I. Introduction Xin chào mọi người, cũng khá lâu rồi mình không chia sẻ được gì cho anh em viblo, phần vì mình lười viết, phần cũng vì cảm thấy kiến thức của bản thân còn hạn hẹp quá 😄 😄. Nay cũng là ngày gần cuối mình ở Nhật, thời gian bắt đầu dư giả hơn nên quyết định viết bài này chia sẻ tới ae những gì mình học được trong khoảng thời gian ở đây, cũng là một cách để mình refresh lại sau mộ...

Thumbnail Image
5.9K
23
8 3
Avatar Ngoc N Tran thg 3 23, 2020 6:12 CH
25 min read

Sự khác nhau giữa Linear Classification và Linear Regression? Tất cả những gì bạn cần biết về 2 mô hình cơ bản nhất ML.

Câu hỏi được đặt ra Sau một thời gian đi hóng phỏng vấn của các tay to trong team thì một câu hỏi hay được đặt ra để phân biệt giữa người hiểu lơ mơ và người hiểu không lơ mơ lắm chính là câu hỏi trên đề bài:

Phân biệt sự khác nhau giữa hồi quy tuyến tính và phân lớp tuyến tính?

Vậy thì bài viết này sẽ giải thích cụ thể sự khác nhau đó nhé, kèm tất cả những gì liên quan đến cả 2 mô hình trên....

Thumbnail Image
3.2K
22
10 8
Avatar Dark Knight thg 3 22, 2020 1:57 CH
8 min read

Tìm hiểu về class activation maping - Tại sao các mạng thần kinh lại đưa ra quyết định như vậy?

Visualizing neural network(Trực quan hoá mạng lưới thần kinh) là gì? Một khái niệm quá quen thuộc với deep learning đó chính là DNNs (deep neural network) , trong computer vision nó được áp dụng cực kỳ nhiều với các tác vụ như: phân loại, phát hiện, segmentation. Yep chúng ta biết DNNs đã làm điều đó, nhưng bằng cách nào, hay nói rõ hơn bên trong các layers hay nó đã xử lý để đưa ra quyết định ...

Thumbnail Image
14.9K
37
17 9
Avatar Phan Huy Hoang thg 3 20, 2020 9:25 SA
23 min read

[Deep Learning] Thiết kế module OCR cho bài toán nhận diện chữ cổ Nhật Bản - Building OCR module for Kuzushiji recognition

Các phần nội dung chính được đề cập trong bài blog lần này

  • Giới thiệu về Kuzushiji Recognize

  • Hướng tiệp cận

  • Text detection - Image Segmentation

  • Quá trình hậu xử lý mô hình - Post processing

  • Text recognition - Image Classification

  • Demo với streamlit

  • Triển khai model với tensorflow serving

  • Đóng gói model với Docker / docker-compose

  • Kết quả thu được sau bài blog này 😄

  • L...
Thumbnail Image
2.5K
26
9 7
Avatar Phạm Văn Toàn thg 3 16, 2020 10:29 SA
16 min read

Giải trí mùa corona - Ứng dụng Deep Learning tự động chơi game oản tù tì với deeplearn.js

Xin chào tất cả các bạn, corona thật sự đang rất ảnh hưởng đến cuộc sống của mỗi chúng ta đặc biệt là việc phải làm remote ở nhà với một cái màn hình máy tính thì thật là không vui chút nào. Nhớ những ngày được đi làm còn có đồng nghiệp hỏi han nhưng nay thui thủi chỉ ta với chiếc máy thì biết làm sao bây giờ. Thôi thì làm một ứng dụng tự chơi oẳn tù tì với máy cho vui vậy. Ứng dụng ngày hôm na...

Thumbnail Image
16.2K
30
7 10
Avatar Bui Tien Tung thg 3 16, 2020 8:43 SA
10 min read

Hiểu Rasa qua quy trình xây dựng một chatbot giúp bạn trả lời câu hỏi: "Hôm nay ăn gì?"

  1. Tổng quan về Rasa Trước tiên, để bắt đầu đi vào quy trình xây dựng một chatbot bằng Rasa, mình nghĩ các bạn sẽ cần biết Rasa là gì và Rasa có những ưu điểm vượt trội gì để được lựa chọn cho việc xây dựng chatbot.

Nếu các bạn là người bắt đầu muốn nghiên cứu về chatbot, hay chỉ đơn giản là nảy ra một ý tưởng xây dựng một chú "bot" thú vị có thể "chat", hoặc cập nhật tin tức, hoặc làm một tác...

Thumbnail Image
12.1K
34
5 18
Avatar Phạm Hữu Quang thg 3 15, 2020 10:16 CH
20 min read

Rasa chatbot: Tăng khả năng chatbot với custom component và custom tokenization(tiếng Việt + tiếng Nhật)

Vậy là đã tròn 6 tháng mình không viết bất cứ bài chia sẻ nào trên Viblo cả, kể cũng buồn và hơi nhớ. Một phần lý do là mình lười (phần quan trọng nhất, chiếm khoảng 90% ), phần còn lại là bị cuốn bởi 2 nền tảng khác của Viblo là Viblo Code và Viblo CTF nên tự dưng sao đãng Viblo Sharing.

Nhưng thôi, mình đã quay lại rồi và để kỉ niệm con số 6 tháng khá đẹp này thì mình lại kiếm 1 cái gì đó để...

Thumbnail Image
8.5K
31
8 7
Avatar Blink thg 3 15, 2020 6:55 CH
8 min read

Image Retrieval với thư viện FAISS

I. Introduction Faiss Facebook AI Similarity Search (Faiss) là một thư viện sử dụng similiarity search cùng với clustering các vector. Faiss được nghiên cứu và phát triển bởi đội ngũ Facebook AI Research; được viết trong C++ và đóng gói trên môi trường Python. Bộ thư viện bao gồm các thuật toán tìm kiếm vector đa chiều trong similarity search

Similarity search Hiện nay, phương pháp phổ biến nh...

Thumbnail Image
761
6
2 2
Avatar Pham Minh Hoang thg 3 15, 2020 3:38 CH
5 min read

Xử lý ngày tháng trong chatbot với Tiếng Việt

Lời mở đầu Với những ai từng làm chatbot cho Tiếng Việt chắc đều biết phần tiền xử lí thời gian là phần cực kỳ mệt và hiện giờ tôi đang làm phần này đây 😦. Vì khuôn khổ bài viết có hạn, tôi sẽ chỉ nêu ra một số vấn đề xảy ra trong khi xử lí ngày tháng Tiếng Việt và cách giải quyết vấn đề đó, nếu còn thiếu sót nhờ các bạn góp ý thêm.

Vấn đề bạn chắc chắn gặp phải Như các bạn đã biết, khi làm c...

Thumbnail Image
2.3K
10
7 4
Avatar Nguyen Viet Anh thg 3 15, 2020 11:15 SA
7 min read

Lựa chọn những thuộc tính quan trọng nhất trong một tập dữ liệu

Việc áp dụng Machine Learning vào kinh doanh đang trở nên rất phổ biến. Với các lĩnh vực như ngân hàng hay dịch vụ, bên cạnh đưa ra dự đoán hay phân loại vào các lớp, một mô hình có thể diễn giải được (interpretable) cũng rất quan trọng. Ví dụ, đối với một ngân hàng, ngoài việc dự đoán khả năng khách hàng A mở tài khoản tiết kiệm, ngân hàng này sẽ muốn mô hình đưa ra những yếu tố quan trọng nhấ...

Thumbnail Image
4.2K
22
3 10
Avatar Việt Hoàng thg 3 15, 2020 10:36 SA
5 min read

Sử dụng Rasa Custom Actions xử lý cuộc hội thoại cho chatbot

Bài viết này trong series Chatbots are cool. Let's build a chatbot!

  1. Rasa Custom Actions Tiếp tục chuỗi bài về Rasa Chatbot hôm nay mình xin giới thiệu các bạn một phần không thể thiếu để xử lý những cuộc hội thoại phức tạp. Trước khi bước vào bài đọc mình nghĩ các bạn nên nắm chắc các định nghĩa cũng như cách tạo các intent, entities, slot...trong bài viết "Tập tành Rasa Chatbot " của mình :...
Thumbnail Image
1.9K
15
3 0
Avatar Ngoc N Tran thg 3 11, 2020 2:19 CH
6 min read

Cách kết nối Chatwork với Rasa, và 5 phút mặc niệm latency trên trời.

TL;DR: Code đây. https://github.com/ngoctnq-1957/rasa-chatwork-echo

Mở bài Nếu bạn là người đi làm chatbot như mình, chắc hẳn bạn đã dùng Rasa. Với các ưu điểm vượt trội như là hoàn toàn local không sợ mất thông tin, một dialog handler xịn cùng các connector (cho dù bắt entity hơi ngu), Rasa là sự lựa chọn số 1 của các dự án cần tính bảo mật/hay cần mọi thứ trong 1 gói. Đồng thời, nếu bạn làm ...

Thumbnail Image
3.8K
71
29 9
Avatar Phạm Văn Toàn thg 2 17, 2020 7:52 SA
14 min read

Tạo chatbot trên Chatwork tự động giải đáp thông tin về dịch COVID-2020

Xin chào các bạn, có lẽ một trong những tiêu điểm của những tháng đầu năm 2020 đó chính là dịch viêm phổi cấp do chủng mới của virus corona gây ra. Theo ước tính cho tới thời điểm hiện tại ngày 15/2/2020 đã có trên 60.000 lượt nhiễm bệnh và gần 2000 người chết trên khắp thế giới. Để có thể có thêm một kênh thông tin cập nhật real time tình hình dịch bệnh thì hôm nay mình xin phép được hướng dẫn...

Thumbnail Image
15.1K
13
6 3
Avatar Pham Thi Hong Anh thg 2 17, 2020 1:13 SA
8 min read

Xử lý missing data trong Data analysis

Hello mn lại thêm một tháng nữa trôi qua =))), hôm nay mình sẽ chia sẻ về handle với Missing data trong data analysis. Như mọi người đã và đang làm việc với dữ liệu thực tế thì vấn đề missing data khá là phổ biến, vì vậy việc giải quyết vấn đề missing value là cần thiết để góp phần giúp cho bài toán của chúng ta được cải thiện một cách đáng kể hơn. Trong bài viết lần này mình sẽ trình bày một ...

Thumbnail Image
12.9K
29
3 4
Avatar Việt Hoàng thg 2 16, 2020 3:48 SA
8 min read

Tâp tành làm RASA CHATBOT

Bài viết nằm trong series Chatbots are cool. Let's build a chatbot!

Tuần trước mình có tham gia vào một dự án của công ty, một trong những nhiệm vụ của mình đó làm ra một trợ lý chatbot, sau một thời gian tìm hiểu và được sự suppor nhiệt tình của anh Phạm Hữu Quang thì hôm nay mình xin chia sẻ một số kinh nghiệm của mình với RASA - một NLU framework hỗ trợ chúng tôi tạo ra chatbot với mục ti...

Thumbnail Image
6.1K
11
11 10
Avatar Dark Knight thg 2 14, 2020 6:52 SA
5 min read

Xây dựng hệ thống nhận dạng khuôn mặt real time - Phần 1: Làm quen bài toán nhận dạng khuôn mặt với Approximate Nearest Neighbors Oh Yeah(Annoy)

Lý Thuyết ANNOY là gì ? Các thuật toán Tree-based là một trong những thứ được dùng khá nhiều khi nhắc đến ANN(Mạng neural nhân tạo) . Chúng ta xây dựng các rừng cây từ dữ liệu bằng cách cấu trúc lại nó thành những tập con dữ liệu. Một trong những giải pháp nổi bật nhất là Annoy.

Annoy: Approximate Nearest Neighbors Oh Yeah là một thư viện C ++ với các ràng buộc Python để tìm kiếm các điểm tron...

Thumbnail Image
4.5K
21
7 4
Avatar Bui Tien Tung thg 2 7, 2020 2:54 SA
16 min read

Deep Learning cho những máy tính thiếu RAM

RAM - Random Memory Access: Bộ nhớ truy xuất ngẫu nhiên, là nơi chứa và cung cấp tài nguyên cho các tiến trình đang được xử lí trên máy tính. Nếu bạn đang bắt đầu tìm hiểu về Deep Learning, hoặc đã có những kinh nghiệm nhất định trong lĩnh vực này, thì chắc chắn rằng bạn sẽ ít nhất một lần trong đời (nếu không phải bây giờ thì sẽ là sau này 😄), bạn sẽ bắt gặp trường hợp: Không có đủ bộ n...

Thumbnail Image
14.5K
58
21 20
Avatar Phan Huy Hoang thg 1 20, 2020 8:42 SA
29 min read

[Model Serving] Triển khai Machine Learning model lên production với Tensorflow Serving - Deploy Machine Learning model in production with Tensorflow Serving

Các phần nội dung chính sẽ đề cập trong bài blog lần này

  • Tensorflow Serving?
  • Triển khai Tensorflow Serving
  • gRPC vs RESTful
  • Benchmark
  • 1 số lưu ý
  • Model với nhiều inputs
  • Model với output phức tạp
  • Serving multiple models
  • CPU optimized
  • Cải thiện inference time với Protos
  • Cải thiện inference time với Batching
  • Tensorflow Serving với Docker / Docker-compose
  • Reference

Github r...

Thumbnail Image
18.6K
36
13 6
Avatar Pham Minh Hoang thg 1 17, 2020 4:53 SA
13 min read

Ensemble learning và các biến thể (P1)

I. Khái niệm "Đoàn kết là sức mạnh". Tôi không biết câu này xuất hiện ở đâu khi nào nhưng nó lại khái quát ý tưởng của phương thức Ensemble trong Machine Learning.

Lấy ví dụ thế này, bạn có 1 model nhưng đầu ra của model đó không tốt nên bạn thử các model khác. Sau khi tìm được model ưng ý và "có lẽ chính xác", bạn lại phải chỉnh chỉnh sửa sửa từ thuật toán đến hyperparameter để mô hình đạt độ...

Thumbnail Image
1.5K
15
5 4
Avatar Ngoc N Tran thg 1 16, 2020 7:44 SA
11 min read

Khi tất cả các phân tích học máy đều đã lỗi thời: overfitting (không) tồn tại.

Lý thuyết: Cổ điển (không còn gì) chưa được phân tích.

Nếu các bạn được học kỹ hơn về học máy, thì chắc hẳn các bạn đã được nghe về các khái niệm sau đây:

  • Vapnik-Chervonenkis (VC) dimension: giá trị này cho biết khả năng phân lớp của tất cả các loại data có thể cho vào, về cơ bản là độ phức tạp của mô hình một cách thực tiễn.
  • Rademacher complexity: đo độ phức tạp của data đưa vào bằng các...
Featured member
Viblo
Let's register a Viblo Account to get more interesting posts.