Image Cover
Avatar

Sun* AI Research Team

level partner

Silver Content Creator

We're AI Research Team of R&D Lab @Sun Asterisk .Inc

Pinned Posts

Độ hot của Langchain

Langchain là một framework vô cùng hot hit trong thời gian gần đây. Nó được sinh ra để tận dụng sức mạnh của các mô hình ngôn ngữ lớn LLM như ChatGPT, LLaMA... để tạo ra các ứng dụng trong thực tế. Dù mới được phát triển cách đây khoảng 6 tháng (10/2022) và vẫn được cập nhật liên tục hàng ngày nhưng trên Github Langchain đã nhận được những tương tác khủng với lượng star lê...

Mayfest2023 ContentCreator
13.3K
56
24 8

All posts

Thumbnail Image
12.9K
37
21 25
Avatar Phạm Hoàng Anh Nov 15th, 2018 1:36 p.m.
29 min read

Lý thuyết về mạng Bayes và ứng dụng vào bài toán lọc thư rác

Máy tính đang học như thế nào?

Dạo gần đây mình đã có viết tương đối nhiều bài viết về việc sử dụng các thư viện, hàm có sẵn để có thể tiếp cận và tạo ra được những ứng dụng của Machine Learning theo những cách đơn giản nhất. Đối với mình, cách học/ tiếp cận (top-down) này là một phương pháp rất hiệu quả vì nó vừa giúp chúng ta cải thiện về lý thuyết, đồng thời giúp chúng ta luôn cảm thấy hứng...

Thumbnail Image
5.0K
15
8 2
Avatar Phạm Văn Toàn Nov 15th, 2018 2:23 a.m.
16 min read

Xây dựng chatbot tự động chat trên Chatwork với Chatterbot và Django

Xin chào tất cả các bạn, dạo gần đây mình thấy khá là nhiều bài viết liên quan đến chủ đề Chatbot trên Viblo tuy nhiên đa phần nội dung đều không nói rõ cách thực hiện Chatbot và deploy chatbot như thế nào. Đại đa số sử dụng một vài framework khá ăn liền như API của Simsimi hay Facebook Messenger điều này có một hạn chế là các bạn sẽ không tự custom nội dung được và một số API Chatbot như Simsi...

Thumbnail Image
1.9K
23
9 6
Avatar Phan Huy Hoang Nov 14th, 2018 3:40 p.m.
13 min read

[Paper Explained] Product Quantization for Approximate Nearest Neighbor Search

  • Keyword: Product Quantization, Approxiamate Nearest Neighbor Search, Similar Search, Deep Binary Hashing, Polysemous Codes, Binary Hash Codes

  • Kĩ năng đọc hiểu paper không chỉ là 1 kĩ năng cần thiết đối với những người làm nghiên cứu hay researcher mà còn đối với những người đang làm về machine learning, deep learning nói chung: machine learning engineer, data analysis, data scientist, .....

Thumbnail Image
3.1K
28
15 32
Avatar Phạm Hữu Quang Nov 7th, 2018 5:25 a.m.
7 min read

Không biết Deep Learning vẫn làm được Deep Learning với AutoML: Bài toán phát hiện ảnh "nhạy cảm".

[IMG]

Trong bài viết trước về buổi phỏng vấn đầy thú vị giữa nhà báo công nghệ Tony Peng và tiến sĩ Lê Viết Quốc- chuyên gia AI, đồng sáng lập Google Brain, chúng ta đã được hiểu qua về công nghệ AutoML mà Google đã và đang phát triển với khả năng tự động xây dựng các mô hình Deep Learning cho bài toán Computer Vision(Thị giác máy tính). Kết quả đạt được khá ấn tượng khi mô hình được sinh ra bởi má...

Thumbnail Image
8.1K
24
9 7
Avatar Phan Huy Hoang Oct 16th, 2018 8:57 a.m.
8 min read

Data Visualization với thuật toán t-SNE sử dụng Tensorflow Projector

Data Visualization với thuật toán t-SNE sử dụng Tensorflow Projector

  • Data Visualization là một trong những kĩ năng quan trọng đòi hỏi các Data Science hoặc BI Analysis phải xử lí thành thạo và trau dồi kĩ năng hàng ngày. Với tiêu chí "Learn by doing", trong bài blog lần này, mình sẽ giới thiệu và hướng dẫn cho các bạn sử dụng Tensorflow Projector để visual trên tập dữ liệu embedding với thuậ...
Thumbnail Image
10.1K
40
21 13
Avatar Phạm Hoàng Anh Oct 15th, 2018 1:28 a.m.
20 min read

Tạo Language Model để tự động sinh văn bản tiếng Việt

Google tìm kiếm đọc được suy nghĩ của bạn

Đây không còn là một điều quá lạ lẫm với chúng ta, tuy nhiên đó vẫn là một tính năng tuyệt vời giúp tăng trải nghiệm cho người dùng của Google.
Khi bạn bắt đầu gõ vào ô tìm kiếm của trên trang Google Search, bạn có thể nhìn thấy ngay vài từ tiếp theo, thậm chí là tất cả phần còn lại ở phần gợi ý tìm kiếm. Hệ thống của Google Search sử dụng một thu...

Thumbnail Image
18.5K
41
14 21
Avatar Phạm Hữu Quang Oct 14th, 2018 6:49 a.m.
18 min read

Phân tích phản hồi khách hàng hiệu quả với Machine learning(Vietnamese Sentiment Analysis)

Thu thập thông tin phản hồi của khách hàng là một cách tuyệt vời giúp cho các doanh nghiệp hiểu được điểm mạnh, điểm yếu trong sản phẩm, dịch vụ của mình; đồng thời nhanh chóng nắm bắt được tâm ký và nhu cầu khách hàng để mang đến cho họ sản phẩm, dịch vụ hoàn hảo nhất.

Ngày nay, với sự phát triển vượt bậc của khoa học và công nghệ, đặc biệt là sự bùng nổ của Internet với các phương tiện truyề...

Thumbnail Image
5.7K
40
28 14
Avatar Phạm Văn Toàn Sep 25th, 2018 2:30 a.m.
26 min read

Nhận dạng chữ Kanji và Deploy mô hình Deep Learning với Tensorflow JS

Xin chào các bạn, cũng đã lâu rồi mình không có bài viết mới trên Viblo bởi dạo này mình tập trung vào làm Video Tutorial hơn. Nhưng xa Viblo lâu ngày quá cũng thấy buồn buồn, nhân tiện có nhiều người hỏi về cách thức thực hiện của bài toán Nhận dạng chữ số viết tay tiếng Nhật mà mình đã có chia sẻ demo trên Facebook tại đây mình viết luôn một bài Viblo chia sẻ lại luôn. Bài viết này mình sẽ cố...

Thumbnail Image
7.6K
39
26 7
Avatar Phan Huy Hoang Sep 13th, 2018 5:09 p.m.
19 min read

Xây dựng hệ thống gợi ý đơn giản cho ... website Viblo!

Xây dựng hệ thống gợi ý bài viết cho ... website Viblo

  • Hệ gợi ý (Hệ khuyến nghị) hay Recommender System (hoặc Recommendation System) hiện nay là một trong những vấn đề được các công ty hay các trang thương mại điện tử rất quan tâm. Ngày nay, trên thế giới nói chung và tại Việt Nam nói riêng, các hệ thống recommender system đã trở thành một xu hướng không thể thiếu trong thương mai điện tử. M...
Thumbnail Image
28.4K
64
23 24
Avatar Phạm Hữu Quang Sep 9th, 2018 3:00 p.m.
23 min read

Xây dựng mô hình không gian vector cho Tiếng Việt

Trong xử lý ngôn ngữ tự nhiên, việc biểu diễn một từ thành một vector đóng một vai trò cực kỳ quan trọng. Nó lợi ích rất nhiều trong việc thể hiện sự tương đồng, đối lập về ngữ nghĩa giữa các từ, giúp mô hình hóa vector cho 1 câu hay đoạn văn, tìm các câu có nghĩa tương đồng,...

Trong bài viết này, mình sẽ trình bày một cách sơ lược về cách mô hình hóa không gian vector cho Tiếng Việt.

Bài vi...

Thumbnail Image
18.7K
70
49 67
Avatar Phạm Hoàng Anh Sep 7th, 2018 5:00 a.m.
36 min read

Xây dựng chương trình tóm tắt văn bản (tiếng Việt) đơn giản với Machine Learning

Việc tóm tắt văn bản ngày càng trở nên cần thiết! Trong một thời đại mà mỗi ngày, mỗi giờ , mỗi phút đều có một lượng thông tin khổng lồ được sinh ra, nhưng giới hạn về thời gian, về khả năng đọc và tiếp thu của con người là có hạn, việc hiểu và nắm bắt thật nhiều thông tin một cách nhanh chóng không phải là vấn đề đơn giản với bất kỳ ai.

Đã bao giờ bạn tìm kiếm các kiến thức trên inte...

Thumbnail Image
9.3K
32
19 1
Avatar Phạm Văn Toàn Jul 15th, 2018 3:42 p.m.
10 min read

Deploy mô hình Deep Learning lên production một cách đơn giản

Deep Learning là một thứ rất hay ho nhưng nó không hề dễ tiếp cận với người mới bắt đầu. Việc training Deep Learning làm sao để ra được một mô hình tốt thực sự là một thử thách lớn đối khá nhiều người. Tuy nhiên giả sử như khi bạn đã có một mô hình tốt thì cũng không phải dễ dàng cho người mới bắt đầu vì kiến trúc server của nó khá khác lạ so với các kiến trúc Web Services thông thường. Nếu bạn...

Thumbnail Image
12.8K
40
20 24
Avatar Phạm Hoàng Anh Jul 9th, 2018 7:14 a.m.
12 min read

Chấm phiếu điền trắc nghiệm bằng OpenCV và Deep Learning

Phiếu trắc nghiệm không phải lúc nào cũng có dạng chuẩn..? Thi trắc nghiệm đã và đang trở thành xu hướng bởi tính khách quan (Không phụ thuộc người chấm) của nó. Tuy nhiên, việc chấm một số lượng lớn bài thi trắc nghiệm đôi khi lại là một công việc không hề "hứng thú 😦" chút nào bởi đơn giản không phải ở đâu chúng ta cũng có được những máy chấm trắc nghiệm tự động để khiến cho công việc này tr...

Thumbnail Image
23.3K
67
27 5
Avatar Phạm Văn Toàn Feb 27th, 2018 6:42 a.m.
15 min read

Một vài hiểu nhầm khi mới học Machine Learning

Xin chào các bạn, đã lâu lắm rồi tôi mới có dịp được viết một bài chia sẻ với các bạn về chủ đề vô cùng quen thuộc đó là Machine Learning. Sau một thời gian làm về Machine Learning tôi nhận thấy có một vài vấn đề mà không ít người mới học hay ngay cả những người đã từng làm rất lâu trong lĩnh vực này cũng đang bị nhầm lẫn. Chính vì lẽ đó tôi xin được mạn phép viết một bài viết nêu lên một số kh...

Thumbnail Image
7.1K
6
4 1
Avatar Phạm Văn Toàn Jan 28th, 2018 4:20 p.m.
12 min read

Làm thế nào để xây dựng một Recommender System (RS) - Phần 3

Chào các bạn, trong bài trước mình đã giới thiệu với các bạn về một phương pháp rất kinh điển để xây dựng một Hệ gợi ý cơ bản đó là phương pháp Lọc cộng tác dựa trên item. Ngày hôm nay mình sẽ tiếp tục vào phần tiếp theo đó là xây dựng hệ gợi ý sử dụng phương pháp thứ hai đó chính là Lọc cộng tác dựa trên người dùng. OK chúng ta bắt đầu thôi

Lọc cộng tác dựa trên người dùng

Hãy tưởng tượng r...

Thumbnail Image
3.2K
10
3 1
Avatar Phạm Văn Toàn Dec 29th, 2017 6:40 a.m.
18 min read

Ứng dụng Deep Learning xây dựng bộ dịch Tiếng Việt mới về Tiếng Việt cũ

Xin chào các bạn. Nếu các bạn đã theo dõi trong bài viết trước của mình Thay đổi cách viết Tiếng Việt - là dân công nghệ thì không phải sợ thì có thấy là mình đã giới thiệu một ứng dụng nhỏ đó chính là chuyển đổi từ Tiếng Việt cũ về Tiếng Việt mới và trong phần cuối cùng của bài viết đó mình có đề cập đến một phần mới đó là ứng dụng chuyển đổi từ Tiếng Việt mới về Tiếng Việt cũ và cũng đã giới...

Thumbnail Image
1.9K
29
6 5
Avatar Phạm Văn Toàn Nov 28th, 2017 9:38 a.m.
10 min read

Thay đổi cách viết Tiếng Việt - là dân công nghệ thì không phải sợ

Có lẽ trong những ngày gần dây trào lưu viết chữ Tiếng Việt chuẩn đang trở nên vô cùng hot trên mạng xã hội. Mình thì không muốn lạm bàn nhiều về vấn đề thay đổi chữ viết Tiếng Việt đúng hay sai vì bản thân Viblo là một nền tảng để chia sẻ kiến thức kĩ thuật của ngành công nghệ thông tin chứ không phải của ngành xã hội học nên nếu bạn muốn tiếp cận theo hướng của một người làm kĩ thuật thì hãy ...

Thumbnail Image
44.9K
93
31 37
Avatar Phạm Văn Toàn Oct 5th, 2017 11:38 a.m.
17 min read

[Data Analysis] Phân tích dữ liệu xổ số miền Bắc

Có lẽ từ xổ số hay lottery đã không còn là cụm từ xa lạ đổi với mỗi người chúng ta. Thậm chí dân chơi còn có một câu khá nổi tiếng ví von như sau:

Lô đề cờ bạc muôn đời thịnh Học hành chăm chỉ vạn kiếp suy

Nghe mà muốn khóc quá chừng, mình làm Đa ta sai ừn vất vả là thế mà vẫn vạn kiếp suy thì tính sao bây giờ. Trong một phút yếu lòng mình đã nghĩ đến việc thử phân tích dữ liệu xổ số miền Bắc...

Thumbnail Image
30.7K
30
23 3
Avatar Phạm Văn Toàn Aug 18th, 2017 8:00 a.m.
12 min read

Ứng dụng thuật toán Naive Bayes trong giải quyết bài toán chuẩn đoán bệnh tiểu đường

Chào tất cả mọi người, đã rất lâu rồi mình mới có một bài Viblo mới viết về Machine Learning và hôm nay chúng ta sẽ đến với một phương pháp không phải là mới trong học máy nhưng vẫn luôn là một phương pháp đem lại hiệu quả tốt trong lớp các bài toán phân lớp hay dự đoán. Giải thuật mà chúng ta sẽ thảo luận ngày hôm nay chính là Naive Bayes - một trong những thuật toán rất tiêu biểu cho hướng ph...

Thumbnail Image
11.7K
13
13 9
Avatar Phạm Văn Toàn May 12th, 2017 4:42 a.m.
14 min read

Làm thế nào để xây dựng một Recommender System (RS) - Phần 2

Trong bài trước mình đã trình bày với mọi người những khái niệm cơ bản về một Hệ gợi ý và chúng ta cũng đã biết đến hai hướng tiếp cận chính để xây dựng một hệ thống gợi ý đó là Content-based và Collaborative Filtering cũng như phân tích ưu nhược điểm của chúng. Từ phần này chúng ta bắt đầu đi sâu hơn xây dựng một hệ gợi ý đơn giản sử dụng phương pháp lọc công tác với từng hướng tiếp cận của nó...

Featured member
Viblo
Let's register a Viblo Account to get more interesting posts.