Image Cover
Avatar

Sun* AI Research Team

level partner

Nhà sáng tạo nội dung hạng Bạc

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Bài viết được ghim

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
13.2K
56
24 8

Tất cả bài viết

Thumbnail Image
765
6
2 2
Avatar Pham Minh Hoang thg 3 15, 2020 3:38 CH
5 phút đọc

Xử lý ngày tháng trong chatbot với Tiếng Việt

Lời mở đầu Với những ai từng làm chatbot cho Tiếng Việt chắc đều biết phần tiền xử lí thời gian là phần cực kỳ mệt và hiện giờ tôi đang làm phần này đây 😦. Vì khuôn khổ bài viết có hạn, tôi sẽ chỉ nêu ra một số vấn đề xảy ra trong khi xử lí ngày tháng Tiếng Việt và cách giải quyết vấn đề đó, nếu còn thiếu sót nhờ các bạn góp ý thêm.

Vấn đề bạn chắc chắn gặp phải Như các bạn đã biết, khi làm c...

Thumbnail Image
2.3K
10
7 4
Avatar Nguyen Viet Anh thg 3 15, 2020 11:15 SA
7 phút đọc

Lựa chọn những thuộc tính quan trọng nhất trong một tập dữ liệu

Việc áp dụng Machine Learning vào kinh doanh đang trở nên rất phổ biến. Với các lĩnh vực như ngân hàng hay dịch vụ, bên cạnh đưa ra dự đoán hay phân loại vào các lớp, một mô hình có thể diễn giải được (interpretable) cũng rất quan trọng. Ví dụ, đối với một ngân hàng, ngoài việc dự đoán khả năng khách hàng A mở tài khoản tiết kiệm, ngân hàng này sẽ muốn mô hình đưa ra những yếu tố quan trọng nhấ...

Thumbnail Image
4.2K
22
3 10
Avatar Việt Hoàng thg 3 15, 2020 10:36 SA
5 phút đọc

Sử dụng Rasa Custom Actions xử lý cuộc hội thoại cho chatbot

Bài viết này trong series Chatbots are cool. Let's build a chatbot!

  1. Rasa Custom Actions Tiếp tục chuỗi bài về Rasa Chatbot hôm nay mình xin giới thiệu các bạn một phần không thể thiếu để xử lý những cuộc hội thoại phức tạp. Trước khi bước vào bài đọc mình nghĩ các bạn nên nắm chắc các định nghĩa cũng như cách tạo các intent, entities, slot...trong bài viết "Tập tành Rasa Chatbot " của mình :...
Thumbnail Image
1.9K
15
3 0
Avatar Ngoc N Tran thg 3 11, 2020 2:19 CH
6 phút đọc

Cách kết nối Chatwork với Rasa, và 5 phút mặc niệm latency trên trời.

TL;DR: Code đây. https://github.com/ngoctnq-1957/rasa-chatwork-echo

Mở bài Nếu bạn là người đi làm chatbot như mình, chắc hẳn bạn đã dùng Rasa. Với các ưu điểm vượt trội như là hoàn toàn local không sợ mất thông tin, một dialog handler xịn cùng các connector (cho dù bắt entity hơi ngu), Rasa là sự lựa chọn số 1 của các dự án cần tính bảo mật/hay cần mọi thứ trong 1 gói. Đồng thời, nếu bạn làm ...

Thumbnail Image
3.8K
71
29 9
Avatar Phạm Văn Toàn thg 2 17, 2020 7:52 SA
14 phút đọc

Tạo chatbot trên Chatwork tự động giải đáp thông tin về dịch COVID-2020

Xin chào các bạn, có lẽ một trong những tiêu điểm của những tháng đầu năm 2020 đó chính là dịch viêm phổi cấp do chủng mới của virus corona gây ra. Theo ước tính cho tới thời điểm hiện tại ngày 15/2/2020 đã có trên 60.000 lượt nhiễm bệnh và gần 2000 người chết trên khắp thế giới. Để có thể có thêm một kênh thông tin cập nhật real time tình hình dịch bệnh thì hôm nay mình xin phép được hướng dẫn...

Thumbnail Image
15.3K
13
6 3
Avatar Pham Thi Hong Anh thg 2 17, 2020 1:13 SA
8 phút đọc

Xử lý missing data trong Data analysis

Hello mn lại thêm một tháng nữa trôi qua =))), hôm nay mình sẽ chia sẻ về handle với Missing data trong data analysis. Như mọi người đã và đang làm việc với dữ liệu thực tế thì vấn đề missing data khá là phổ biến, vì vậy việc giải quyết vấn đề missing value là cần thiết để góp phần giúp cho bài toán của chúng ta được cải thiện một cách đáng kể hơn. Trong bài viết lần này mình sẽ trình bày một ...

Thumbnail Image
13.0K
29
3 4
Avatar Việt Hoàng thg 2 16, 2020 3:48 SA
8 phút đọc

Tâp tành làm RASA CHATBOT

Bài viết nằm trong series Chatbots are cool. Let's build a chatbot!

Tuần trước mình có tham gia vào một dự án của công ty, một trong những nhiệm vụ của mình đó làm ra một trợ lý chatbot, sau một thời gian tìm hiểu và được sự suppor nhiệt tình của anh Phạm Hữu Quang thì hôm nay mình xin chia sẻ một số kinh nghiệm của mình với RASA - một NLU framework hỗ trợ chúng tôi tạo ra chatbot với mục ti...

Thumbnail Image
6.2K
11
11 10
Avatar Dark Knight thg 2 14, 2020 6:52 SA
5 phút đọc

Xây dựng hệ thống nhận dạng khuôn mặt real time - Phần 1: Làm quen bài toán nhận dạng khuôn mặt với Approximate Nearest Neighbors Oh Yeah(Annoy)

Lý Thuyết ANNOY là gì ? Các thuật toán Tree-based là một trong những thứ được dùng khá nhiều khi nhắc đến ANN(Mạng neural nhân tạo) . Chúng ta xây dựng các rừng cây từ dữ liệu bằng cách cấu trúc lại nó thành những tập con dữ liệu. Một trong những giải pháp nổi bật nhất là Annoy.

Annoy: Approximate Nearest Neighbors Oh Yeah là một thư viện C ++ với các ràng buộc Python để tìm kiếm các điểm tron...

Thumbnail Image
4.5K
21
7 4
Avatar Bui Tien Tung thg 2 7, 2020 2:54 SA
16 phút đọc

Deep Learning cho những máy tính thiếu RAM

RAM - Random Memory Access: Bộ nhớ truy xuất ngẫu nhiên, là nơi chứa và cung cấp tài nguyên cho các tiến trình đang được xử lí trên máy tính. Nếu bạn đang bắt đầu tìm hiểu về Deep Learning, hoặc đã có những kinh nghiệm nhất định trong lĩnh vực này, thì chắc chắn rằng bạn sẽ ít nhất một lần trong đời (nếu không phải bây giờ thì sẽ là sau này 😄), bạn sẽ bắt gặp trường hợp: Không có đủ bộ n...

Thumbnail Image
14.7K
58
21 20
Avatar Phan Huy Hoang thg 1 20, 2020 8:42 SA
29 phút đọc

[Model Serving] Triển khai Machine Learning model lên production với Tensorflow Serving - Deploy Machine Learning model in production with Tensorflow Serving

Các phần nội dung chính sẽ đề cập trong bài blog lần này

  • Tensorflow Serving?
  • Triển khai Tensorflow Serving
  • gRPC vs RESTful
  • Benchmark
  • 1 số lưu ý
  • Model với nhiều inputs
  • Model với output phức tạp
  • Serving multiple models
  • CPU optimized
  • Cải thiện inference time với Protos
  • Cải thiện inference time với Batching
  • Tensorflow Serving với Docker / Docker-compose
  • Reference

Github r...

Thumbnail Image
19.0K
36
13 6
Avatar Pham Minh Hoang thg 1 17, 2020 4:53 SA
13 phút đọc

Ensemble learning và các biến thể (P1)

I. Khái niệm "Đoàn kết là sức mạnh". Tôi không biết câu này xuất hiện ở đâu khi nào nhưng nó lại khái quát ý tưởng của phương thức Ensemble trong Machine Learning.

Lấy ví dụ thế này, bạn có 1 model nhưng đầu ra của model đó không tốt nên bạn thử các model khác. Sau khi tìm được model ưng ý và "có lẽ chính xác", bạn lại phải chỉnh chỉnh sửa sửa từ thuật toán đến hyperparameter để mô hình đạt độ...

Thumbnail Image
1.5K
15
5 4
Avatar Ngoc N Tran thg 1 16, 2020 7:44 SA
11 phút đọc

Khi tất cả các phân tích học máy đều đã lỗi thời: overfitting (không) tồn tại.

Lý thuyết: Cổ điển (không còn gì) chưa được phân tích.

Nếu các bạn được học kỹ hơn về học máy, thì chắc hẳn các bạn đã được nghe về các khái niệm sau đây:

  • Vapnik-Chervonenkis (VC) dimension: giá trị này cho biết khả năng phân lớp của tất cả các loại data có thể cho vào, về cơ bản là độ phức tạp của mô hình một cách thực tiễn.
  • Rademacher complexity: đo độ phức tạp của data đưa vào bằng các...
Thumbnail Image
2.9K
7
2 1
Avatar Trung Thành Nguyễn thg 1 16, 2020 6:00 SA
8 phút đọc

Tf-idf algorithm, Text retrieval and Search engines

[IMG]

1.TF-IDF Tf-idf là viết tắt của cụm từ: Term frequence -Inverse document frequency . Đây là một kĩ thuật rất nổi tiếng, được sử dụng trong nhiều bài toàn NLP và khai phá dữ liệu dạng văn bản với mục đích: tính weight (độ quan trọng) của word trong một văn bản cụ thể, văn bản đó nằm trong một tập nhiều văn bản khác nhau. Bản thân tên gọi này đã thể hiện được nội dung thuật toán

  • Term frequence...
Thumbnail Image
950
41
7 2
Avatar Phạm Văn Toàn thg 1 15, 2020 8:55 SA
28 phút đọc

Giải mã các công nghệ sử dụng trong hệ thống Sun* Room Booking

Xin chào tất cả mọi người. Sau một thời gian vắng bóng trên chiến trường Viblo thì mình đã trở lại rồi đây. Dạo gần đây trên trang báo điện tử chính thức của Sun* có đăng một bài về dự án Room Booking sử đụng các công nghệ AI để quản lý phòng họp, chi tiết tại đây. Đây là một dự án nội bộ của Sun* tuy nhiên nó cũng có nhiều kĩ thuật khá hay mà mình nghĩ rằng nó đáng để chia sẻ. Đứng trên góc nh...

Thumbnail Image
15.7K
21
5 3
Avatar Bui Tien Tung thg 1 14, 2020 6:30 CH
12 phút đọc

U-net : Kiến trúc mạnh mẽ cho Segmentation

  1. Segmentation! Segmentation! Đôi chút về Image Processing trong Deep Learning Với Deep Learning (hay Neural Network), máy tính ngày càng có khả năng quan sát và xử lí những hình ảnh phức tạp ở nhiều tác vụ khác nhau. Nếu các bạn thắc mắc máy tính khả năng như nào rồi, hãy cùng mình điểm qua một vài tác vụ kinh điển sau đây.
  • Image Classification

Phân lớp hình ảnh: Tác vụ cơ bản v...

Thumbnail Image
9.6K
16
2 1
Avatar Việt Hoàng thg 1 12, 2020 2:08 CH
4 phút đọc

SIFT ( Scale-invariant feature transform) - Huấn luyện mô hình cho các bài toán phân loại

I. SIFT là gì ? Tiếp nối chuỗi bài viết về các phương pháp trong xử lý ảnh, hôm nay mình xin giới thiệu tới các bạn về phương pháp trích chon đặc trưng SIFT. SIFT (Scale-invariant feature transform) là một feature descriptor được sử dụng trong computer vision và xử lý hình ảnh được dùng để nhận dạng đối tượng, matching image, hay áp dụng cho các bài toán phân loại...

  • Với đầu vào là một ...
Thumbnail Image
3.4K
4
3 0
Avatar Pham Thi Hong Anh thg 12 21, 2019 10:58 SA
4 phút đọc

Áp dụng model Machine learning vào bài toán phân khúc khách hàng

Hello mọi người đến hẹn lại lên =))). Ở bài viết Viblo lần này mình sẽ chia sẻ về một bài toán mà hầu hết các trang TMDT đều cần - Phân Khúc Khách Hàng. Tuy nhiên mình sẽ dùng model ML để giải quyết bài toán này.

Phân khúc khách hàng là việc tìm và lựa chọn nhóm khách hàng mà doanh nghiệp, tổ chức có khẳ năng thỏa mãn nhu cầu tốt hơn đối thủ cạnh tranh. mình tham khảo ở đây

Mục đích:

  • Để lựa...
Thumbnail Image
12.1K
13
1 0
Avatar Việt Hoàng thg 12 18, 2019 2:53 CH
4 phút đọc

Xử lý ảnh : Erosion, Dilation, Opening, Closing

Lí thuyết Hôm nay mình xin giới thiệu về một số phương pháp xử ảnh nhị phân sẽ được dùng trong quá trình preprocessing hoặc postprocessing. Tuỳ theo dữ liệu mà chúng ta sẽ áp dụng những phương pháp xử lý cho phù hợp với những bộ lọc phù hợp nó sẽ giúp cho hình ảnh sau khi xử lý loại bỏ bớt nhiễu, cân bằng sáng.. gây ảnh hưởng tới chất lượng của ảnh. Bài hôm nay mình xin giới thiệu 4 phương pháp...

Thumbnail Image
35.7K
12
1 2
Avatar Trung Thành Nguyễn thg 11 22, 2019 7:30 SA
5 phút đọc

Xử lí ảnh: thuật toán cân bằng histogram ảnh

[IMG]

  1. Lý thuyết 1.1 Khái niệm.

Trong lĩnh vực xử lí ảnh, histogram là biểu đồ tần xuất được dùng để thống kê số lần xuất hiện các mức sáng trong ảnh. Dưới đây là ảnh minh họa.

Nhìn vào biểu đồ (chưa cần quan tâm tới đường màu đỏ), dựa vào các cột gía trị có thể dễ dàng thấy được rằng: hầu hết các pixel có giá trị nằm trong khoảng [150, 200]. Điều đó khiến cho toàn bộ ảnh bị sáng hơn mức cần thi...

Thumbnail Image
4.8K
17
5 1
Avatar Phan Huy Hoang thg 11 20, 2019 7:46 SA
15 phút đọc

[Model Optimization] Tối ưu hóa model với OpenVINO toolkit - Model Optimization with OpenVINO toolkit

Những phần nội dung chính sẽ được đề cập trong bài blog lần này:

  • OpenVINO?!

  • Basic inference workflow

  • Model Optimization

  • Inference mode

  • Benchmarks

  • OpenVINO with OpenCV

  • OpenVINO model server

  • Cons

  • Some other toolkits / platforms

  • Some common usecases and conclusion

  • Loạt seri các bài viết khác về Model Compression, Model Pruning, Multi-tasks Learning by Model Pruning, Model Op...

Thành viên nổi bật
Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí