Image Cover
Avatar

Sun* AI Research Team

level partner

Silver Content Creator

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Pinned Posts

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
12.5K
56
24 8

All posts

Thumbnail Image
2.8K
7
2 1
Avatar Trung Thành Nguyễn Jan 16th, 2020 6:00 a.m.
8 min read

Tf-idf algorithm, Text retrieval and Search engines

[IMG]

1.TF-IDF Tf-idf là viết tắt của cụm từ: Term frequence -Inverse document frequency . Đây là một kĩ thuật rất nổi tiếng, được sử dụng trong nhiều bài toàn NLP và khai phá dữ liệu dạng văn bản với mục đích: tính weight (độ quan trọng) của word trong một văn bản cụ thể, văn bản đó nằm trong một tập nhiều văn bản khác nhau. Bản thân tên gọi này đã thể hiện được nội dung thuật toán

  • Term frequence...
Thumbnail Image
945
41
7 2
Avatar Phạm Văn Toàn Jan 15th, 2020 8:55 a.m.
28 min read

Giải mã các công nghệ sử dụng trong hệ thống Sun* Room Booking

Xin chào tất cả mọi người. Sau một thời gian vắng bóng trên chiến trường Viblo thì mình đã trở lại rồi đây. Dạo gần đây trên trang báo điện tử chính thức của Sun* có đăng một bài về dự án Room Booking sử đụng các công nghệ AI để quản lý phòng họp, chi tiết tại đây. Đây là một dự án nội bộ của Sun* tuy nhiên nó cũng có nhiều kĩ thuật khá hay mà mình nghĩ rằng nó đáng để chia sẻ. Đứng trên góc nh...

Thumbnail Image
15.2K
20
5 1
Avatar Bui Tien Tung Jan 14th, 2020 6:30 p.m.
12 min read

U-net : Kiến trúc mạnh mẽ cho Segmentation

  1. Segmentation! Segmentation! Đôi chút về Image Processing trong Deep Learning Với Deep Learning (hay Neural Network), máy tính ngày càng có khả năng quan sát và xử lí những hình ảnh phức tạp ở nhiều tác vụ khác nhau. Nếu các bạn thắc mắc máy tính khả năng như nào rồi, hãy cùng mình điểm qua một vài tác vụ kinh điển sau đây.
  • Image Classification

Phân lớp hình ảnh: Tác vụ cơ bản v...

Thumbnail Image
9.4K
16
2 1
Avatar Việt Hoàng Jan 12th, 2020 2:08 p.m.
4 min read

SIFT ( Scale-invariant feature transform) - Huấn luyện mô hình cho các bài toán phân loại

I. SIFT là gì ? Tiếp nối chuỗi bài viết về các phương pháp trong xử lý ảnh, hôm nay mình xin giới thiệu tới các bạn về phương pháp trích chon đặc trưng SIFT. SIFT (Scale-invariant feature transform) là một feature descriptor được sử dụng trong computer vision và xử lý hình ảnh được dùng để nhận dạng đối tượng, matching image, hay áp dụng cho các bài toán phân loại...

  • Với đầu vào là một ...
Thumbnail Image
3.3K
4
3 0
Avatar Pham Thi Hong Anh Dec 21st, 2019 10:58 a.m.
4 min read

Áp dụng model Machine learning vào bài toán phân khúc khách hàng

Hello mọi người đến hẹn lại lên =))). Ở bài viết Viblo lần này mình sẽ chia sẻ về một bài toán mà hầu hết các trang TMDT đều cần - Phân Khúc Khách Hàng. Tuy nhiên mình sẽ dùng model ML để giải quyết bài toán này.

Phân khúc khách hàng là việc tìm và lựa chọn nhóm khách hàng mà doanh nghiệp, tổ chức có khẳ năng thỏa mãn nhu cầu tốt hơn đối thủ cạnh tranh. mình tham khảo ở đây

Mục đích:

  • Để lựa...
Thumbnail Image
11.9K
13
1 0
Avatar Việt Hoàng Dec 18th, 2019 2:53 p.m.
4 min read

Xử lý ảnh : Erosion, Dilation, Opening, Closing

Lí thuyết Hôm nay mình xin giới thiệu về một số phương pháp xử ảnh nhị phân sẽ được dùng trong quá trình preprocessing hoặc postprocessing. Tuỳ theo dữ liệu mà chúng ta sẽ áp dụng những phương pháp xử lý cho phù hợp với những bộ lọc phù hợp nó sẽ giúp cho hình ảnh sau khi xử lý loại bỏ bớt nhiễu, cân bằng sáng.. gây ảnh hưởng tới chất lượng của ảnh. Bài hôm nay mình xin giới thiệu 4 phương pháp...

Thumbnail Image
35.4K
12
1 2
Avatar Trung Thành Nguyễn Nov 22nd, 2019 7:30 a.m.
5 min read

Xử lí ảnh: thuật toán cân bằng histogram ảnh

[IMG]

  1. Lý thuyết 1.1 Khái niệm.

Trong lĩnh vực xử lí ảnh, histogram là biểu đồ tần xuất được dùng để thống kê số lần xuất hiện các mức sáng trong ảnh. Dưới đây là ảnh minh họa.

Nhìn vào biểu đồ (chưa cần quan tâm tới đường màu đỏ), dựa vào các cột gía trị có thể dễ dàng thấy được rằng: hầu hết các pixel có giá trị nằm trong khoảng [150, 200]. Điều đó khiến cho toàn bộ ảnh bị sáng hơn mức cần thi...

Thumbnail Image
4.7K
17
5 1
Avatar Phan Huy Hoang Nov 20th, 2019 7:46 a.m.
15 min read

[Model Optimization] Tối ưu hóa model với OpenVINO toolkit - Model Optimization with OpenVINO toolkit

Những phần nội dung chính sẽ được đề cập trong bài blog lần này:

  • OpenVINO?!

  • Basic inference workflow

  • Model Optimization

  • Inference mode

  • Benchmarks

  • OpenVINO with OpenCV

  • OpenVINO model server

  • Cons

  • Some other toolkits / platforms

  • Some common usecases and conclusion

  • Loạt seri các bài viết khác về Model Compression, Model Pruning, Multi-tasks Learning by Model Pruning, Model Op...

Thumbnail Image
56.4K
42
8 4
Avatar Việt Hoàng Nov 16th, 2019 4:48 a.m.
8 min read

Tìm hiểu về YOLO trong bài toán real-time object detection

1.Yolo là gì? Trong bài viết này mình xin chia sẻ một chút kiến thức hiểu biết của mình về YOLO, hi vọng có thể giúp mọi người trong các bài toán Object Detection. Object Detection là một bài toán quan trọng trong lĩnh vực Computer Vision, thuật toán Object Detection được chia thành 2 nhóm chính:

  • Họ các mô hình RCNN ( Region-Based Convolutional Neural Networks) để giải quyết các bài toán ...
Thumbnail Image
628
5
2 0
Avatar Pham Thi Hong Anh Nov 16th, 2019 1:00 a.m.
5 min read

A Baseline Model for Hit-song prediction Of Zalo AI Challenge 2019

Xin chào tất cả mọi người hôm nay mình sẽ chia sẻ một model baseline cho bài toán HIt-song prediction của cuộc thi Zalo AI challenge 2019. Link cuộc thi tại đây.

Giới thiệu Về cuộc thi Trong cuộc thi Zalo AI challenge 2019 gồm có 3 bài toán: Hit Song Prediction, MotoBike Generation và Vietnamese WIki Question Answering. Tuy nhiên mình chỉ tham gia mỗi cuộc thi Hit Song Prediction với mục đích ...

Thumbnail Image
412
4
5 0
Avatar Dark Knight Nov 15th, 2019 7:29 a.m.
6 min read

RaLSGAN cho bài toán Motorbike Generator trong cuộc thi Zalo Challenge

Zalo đang tổ chức một cuộc thi về Ai cho toàn thể ACE trong "Ngành". Một trong ba bài toán đó là bài Motorbike Generator và tất nhiên requirement của nó y hệt như cái bài Dog Generator trên Kaggle, khác mỗi đầu ra là 128x128 còn bài Dog Generator là 64x64 :v. Và mình cũng tham gia góp vui với một tinh thần 3H - Ham học hỏi :v. Bài viết này mình đề cập tới những kinh nghiệm của mình trong việc ...

Thumbnail Image
3.4K
61
21 12
Avatar Phạm Văn Toàn Nov 14th, 2019 6:18 a.m.
29 min read

Ông Toằn Vi Lốc - Bí kíp võ công để tạo mô hình siêu siêu nhỏ li ti với độ chính xác khổng lồ

Xin chào các cháu, lại là ông đây. Hôm nay ông sẽ đem đến cho các cháu một chủ đề hết sức thú vị đó chính là Làm thế nào để xây dựng được các mô hình siêu nhỏ li ti mà vẫn đảm bảo độ chính xác cao. Đây chắc hẳn là một câu hỏi vô cùng thú vị với bất kì cháu nào đang thử nghiệm với các thuật toán Deep Learning và đặc biệt là các cháu đã có thích tìm hiểu về các kĩ thuật tăng hiệu năng cho model t...

Thumbnail Image
1.3K
26
12 6
Avatar Ngoc N Tran Nov 11th, 2019 11:02 a.m.
15 min read

Làm thế nào để dùng một model cho nhiều công chuyện?

Đầu bài Các bạn có biết rằng, để dạy cho máy học một mô hình, chúng ta đã thải ra lượng các-bon lớn gấp 5 lần một chiếc xe ô-tô trong cả quá trình vòng đời của nó? Vậy thì phải xem có thể làm gì với mô hình đó nữa cho bõ công phá hoại môi trường nào.

Chắc các bạn cũng biết, điểm xuất phát của các trọng số trong một mô hình có ảnh hưởng khá nhiều đến kết quả học máy. Nếu bạn xuất phát ở một nơi...

Thumbnail Image
4.5K
30
10 12
Avatar Phạm Hữu Quang Sep 21st, 2019 12:06 p.m.
20 min read

Compression model: Áp dụng các kỹ thuật nén để tăng hiệu năng sử dụng các mô hình deep learning(Phần 1)

Trong suốt một thập kỉ qua, sự phát triển mạnh mẽ các công nghệ phần cứng cũng như sự giàu có về nguồn dữ liệu đã là đòn bẩy cho sự phát triển mạnh mẽ của ngành nghiên cứu trí tuệ nhân tạo. Sự nổi bật nhất mang tên Deep learning. Cứ vài ba tháng, một mô hình Deep learning mới lại ra đời, các state-of-the-art của các bài toán gần như đều đã thuộc về các mô hình Deep learning với vô vàn kiểu thiế...

Thumbnail Image
4.8K
17
5 10
Avatar Nguyen Van Dat Sep 21st, 2019 10:06 a.m.
9 min read

Xây dựng ứng dụng realtime tự động nhận diện khuôn mặt

Introduction

Xin chào mọi người, sau những bài viết trước có thiên hướng đi vào lý thuyết, bài viết này của mình sẽ có thiên hướng thực hành nhiều hơn, cụ thể sẽ là bài toán Face Recognition. Có lẽ những bài toán liên quan đến face như face detection, face alignment, face recognization không còn quá xa lạ trong giới AI, nhưng đến nay có thể nói nó vẫn còn khá nhiều vấn đề còn tồn tại chưa đ...

Thumbnail Image
4.9K
18
17 2
Avatar Phạm Hoàng Anh Sep 19th, 2019 10:27 a.m.
21 min read

Tìm hiểu và xây dựng các hệ thống Chatbot trong thực thế

Xu hướng và hiệu quả của việc sử dụng Chatbot những năm gần đây Vào thời điểm mình viết bài viết này, Chatbot thậm chí đã là một danh từ nổi tiếng mà khi nhắc đến thì mỗi người đều đã có những hình dung khá cụ thể của riêng mình dành cho nó. Theo một thống kê thực tế từ đầu năm 2018 của Hubspot, số lượng hàng hóa bán ra cho người dùng trên toàn thế giới thông qua chatbot chiếm tới hơn 47% và co...

Thumbnail Image
1.5K
5
1 0
Avatar Cao Minh Ngoc Sep 19th, 2019 7:30 a.m.
22 min read

Feature Engineering (Phần 5): Phương pháp nâng cao để xử lý dữ liệu dạng văn bản, phi cấu trúc (2/2)

Xin chào mọi người, trong phần trước của series mình đã giới thiệu với mọi người phần đầu của bài viết Phương pháp nâng cao để xử lý dữ liệu dạng văn bản (Text Data). Trong phần tiếp theo này chúng ta sẽ tiếp tục với series Understanding Feature Engineering của Dipanjan (DJ) Sarkar để tìm hiểu phần còn lại của các phương pháp nâng cao hơn để xử lý dữ liệu văn bản, phi cấu trúc.

Xây dựng mô hìn...

Thumbnail Image
2.0K
11
3 2
Avatar Trung Thành Nguyễn Sep 17th, 2019 12:24 p.m.
1 min read

[GAN series-3] Sinh nhân vật Anime với Deep learning - GAN

[IMG]

  1. Dataset Trong hai bài trước, mình đã nói qua về khái niệm GAN và thực hành GAN với bộ dataset đơn giản: Mnist. Trong bài này, mình sẽ tiến hành code một GAN phức tạp hơn, trên dataset phức tạp hơn: bộ chân dung các nhân vật Anime. Anime Dataset được public trên Kaggle theo link sau: Kaggle anime-faces . Bạn có thể download về máy hoặc code trực tiếp trên Kaggle (bằng cách click vào New note...
Thumbnail Image
2.0K
10
1 3
Avatar Trung Thành Nguyễn Sep 17th, 2019 12:11 p.m.
10 min read

[GAN series - 4] Những khó khăn khi train GAN và những kĩ thuật cải tiến train.

Những vấn đề khi train GAN Hồi mới học GAN, mình đã mất cả tuần để tự code 1 ứng dụng đơn giản: sinh chữ viết tay dựa trên Mnist dataset. Code chỉ mất 2 giờ, nhưng quá trình train GAN lại mất gần 1 tuần, thử đi thử lại cả trăm lần với đủ các loại model, layer, tham số. Cuối cùng vào một buổi chiều, đột nhiên quá trình train thành công khi mình thay đổi learning rate từ 0.00015 thành 0.0001.

Dù...

Thumbnail Image
2.1K
5
1 6
Avatar Trung Thành Nguyễn Sep 17th, 2019 12:10 p.m.
3 min read

[GAN series-2] Tự sinh chữ viết tay với GAN

Trong bài viết trước, mình đã điểm qua các khái niệm và công thức trong GAN. Nội dung bài này sẽ tập trung vào thực hành, mình sẽ bắt tay vào code một ứng dụng demo nho nhỏ. Nếu chưa hiểu về GAN, hãy đọc lại bài đầu tiên của mình . Dataset Để không mất quá nhiều thời gian vào việc chuẩn bị dữ liệu và tập trung vào thuật toán, mình sẽ dùng bộ dữ liệu đơn giản nhất mà ai cũng biết: Mnist - bộ dữ ...

Featured member
Viblo
Let's register a Viblo Account to get more interesting posts.