0

Làm Chủ Các Tham Số LLM: Bí Quyết "Thuần Hoá" Trí Tuệ Nhân Tạo

Chào mừng bạn đến với thế giới của Prompt Engineering! Có bao giờ bạn copy một prompt y hệt trên mạng nhưng AI của bạn lại trả về kết quả chán ngắt hoặc nói nhảm không? Vấn đề đôi khi không nằm ở prompt, mà nằm ở các "nút vặn" ẩn bên dưới — chính là các tham số của mô hình ngôn ngữ lớn (LLM settings).

Việc điều khiển AI cũng giống như việc nấu ăn. Bạn có nguyên liệu tốt (Prompt), nhưng nếu nêm nếm gia vị (Settings) sai cách, tác phẩm vẫn sẽ mất ngon. Dựa trên các nguyên tắc cơ bản của việc tinh chỉnh AI, bài viết này sẽ giúp bạn giải mã từng tham số một cách dễ hiểu nhất kèm theo ví dụ minh hoạ.

1. Temperature (Nhiệt độ) — Núm vặn của sự sáng tạo

Temperature là tham số phổ biến nhất, dùng để kiểm soát mức độ ngẫu nhiên (randomness) trong câu trả lời của mô hình. Tham số này thường dao động từ 0.0 đến 2.0.

  • Temperature thấp (0.0 - 0.3): Mô hình trở nên cẩn trọng, logic và dễ đoán. Nó sẽ luôn ưu tiên chọn những từ có xác suất xuất hiện cao nhất. Rất phù hợp cho việc lập trình, trích xuất dữ liệu, hoặc trả lời các câu hỏi yêu cầu sự thật.
  • Temperature cao (0.7 - 1.0+): Mô hình "bay bổng" và sáng tạo hơn. Nó sẵn sàng mạo hiểm chọn những từ có xác suất thấp hơn để tạo ra những ý tưởng mới lạ. Phù hợp cho sáng tác thơ, kể chuyện, hoặc brainstorming.

Ví dụ minh hoạ: Cùng một prompt: "Hãy viết một câu mở đầu cho câu chuyện về một chú chó."

  • Temperature = 0.0: "Chú chó mực tên là Cậu Vàng đang nằm sưởi nắng trước hiên nhà." (Rất an toàn, cơ bản)
  • Temperature = 1.0: "Vượt qua dải ngân hà ngập tràn mùi xương hầm, Đại úy Gâu Gâu vừa hạ cánh chiếc phi thuyền hình đĩa xích đu xuống hành tinh Mèo." (Cực kỳ sáng tạo, bất ngờ)

2. Top-P (Nucleus Sampling) — Vùng an toàn của từ vựng

Tương tự như Temperature, Top-P cũng dùng để kiểm soát tính sáng tạo, nhưng hoạt động theo một cơ chế lọc xác suất cộng dồn. Top-P sẽ giới hạn nhóm từ mà mô hình được phép chọn sao cho tổng xác suất của nhóm từ đó vừa bằng ngưỡng P.

Ví dụ, nếu bạn đặt Top-P = 0.90, mô hình sẽ gom các từ có khả năng xuất hiện cao nhất lại sao cho tổng xác suất của chúng cộng lại bằng 90%, và chỉ được phép chọn ngẫu nhiên 1 từ trong nhóm đó. Nhóm 10% những từ vô lý nhất sẽ bị gạch bỏ hoàn toàn khỏi sự lựa chọn.

Ví dụ minh hoạ: Prompt: "Món ăn sáng yêu thích của tôi là..." Các từ tiếp theo mà AI dự đoán: Bánh mì (50%), Phở (25%), Xôi (15%), Bê tông (8%), Bóng đèn (2%).

  • Nếu Top-P = 0.90: AI chỉ được phép chọn giữa Bánh mì, Phở,Xôi (50 + 25 + 15 = 90%). "Bê tông" và "Bóng đèn" bị loại để đảm bảo câu văn không bị vô nghĩa.

Mẹo nhỏ: Các chuyên gia thường khuyên chỉ nên thay đổi Temperature HOẶC Top-P. Hiếm khi bạn nên thay đổi cả hai cùng lúc để tránh làm mô hình bị nhiễu.

3. Top-K — Sàng lọc "Top Trending"

Nếu Top-P lấy theo phần trăm, thì Top-K cắt tỉa từ vựng theo số lượng cố định. Tham số này buộc mô hình chỉ được phép xem xét đúng K từ có xác suất cao nhất cho bước tiếp theo.

Ví dụ minh hoạ: Nếu bạn đặt Top-K = 50, ở mỗi bước viết từ mới, mô hình sẽ tính toán hàng ngàn từ trong từ điển nhưng sẽ gạch bỏ tất cả, chỉ giữ lại đúng 50 từ có điểm số cao nhất để bốc thăm. Việc này giúp AI không bao giờ đi chệch hướng và thốt ra một từ hoàn toàn xa lạ với ngữ cảnh.

4. Max Length / Max Tokens (Độ dài tối đa)

Đây là ranh giới cứng để ngăn AI nói quá nhiều, bị lan man hoặc tiêu tốn quá nhiều tài nguyên API. Max Tokens xác định số lượng token (đơn vị từ/ký tự) tối đa mà AI có thể sinh ra trong câu trả lời.

Ví dụ minh hoạ: Bạn yêu cầu AI tóm tắt một bài báo dài nhưng chỉ cần nắm ý chính nhanh gọn. Bạn có thể cài đặt Max Tokens = 150. Mô hình sẽ bị ép phải gói gọn ý tưởng, hoặc sẽ dừng ngay lập tức khi chạm mốc 150 tokens. (Lưu ý: Nếu đặt quá thấp, câu văn có thể bị cắt đứt giữa chừng, chưa có dấu chấm câu).

5. Stop Sequences (Chuỗi dừng)

Đây là một tính năng vô cùng quyền lực khi bạn muốn kiểm soát chặt chẽ cấu trúc văn bản. Stop Sequence là một chuỗi ký tự (hoặc một từ) mà khi mô hình chuẩn bị viết ra nó, quá trình tạo văn bản sẽ lập tức kết thúc.

Ví dụ minh hoạ: Bạn dùng AI để soạn hàng loạt email công việc nhưng không muốn AI tự động bịa ra một cái tên giả mạo ở phần ký tên. Bạn thiết lập Stop Sequence là: Trân trọng,. Lúc này, AI sẽ viết xong nội dung chính, và ngay khi nó định gõ cụm từ "Trân trọng,", nó sẽ dừng lại ngay lập tức, trả lại cho bạn một văn bản hoàn hảo để bạn tự chèn chữ ký của chính mình vào.

6. Frequency Penalty & Presence Penalty (Hình phạt chống lặp từ)

Nếu AI của bạn thi thoảng bắt đầu nói lặp đi lặp lại một từ như một con vẹt, đây là lúc bạn cần tinh chỉnh hai "mức phạt" này:

  • Frequency Penalty (Phạt tần suất): Phạt dựa trên số lần một từ đã xuất hiện. Càng lặp lại nhiều lần, xác suất từ đó được dùng lại càng thấp. Tham số này giúp câu văn mượt mà và đa dạng từ vựng hơn.
  • Presence Penalty (Phạt hiện diện): Phạt chỉ cần từ đó đã từng xuất hiện trong văn bản, dù chỉ một lần. Tham số này khuyến khích AI chủ động chuyển sang chủ đề mới thay vì cứ xoay quanh một ý tưởng cũ.

Ví dụ minh hoạ: Khi viết một bài luận về "Môi trường", mô hình có thể lặp lại từ "ô nhiễm" trong mọi câu. Bằng cách tăng Frequency Penalty, bạn ép AI phải lục lọi từ điển để tìm các từ đồng nghĩa như "suy thoái", "vấy bẩn", "hủy hoại" để thay thế.

Tóm lại: Nên cài đặt thông số thế nào cho chuẩn?

Dù không có bộ thông số nào là hoàn hảo tuyệt đối cho mọi tình huống, bạn có thể tham khảo "công thức" khởi đầu sau đây:

Mục đích sử dụng Temperature Top-P Lý do
Lập trình / Dữ kiện thực tế 0.0 - 0.2 1.0 Cần sự chính xác tuyệt đối, không có chỗ cho sự "sáng tạo" sai lệch (hallucination).
Viết Blog / Chatbot thông thường 0.5 - 0.7 0.9 Tạo ra sự cân bằng hoàn hảo giữa logic mạch lạc và văn phong tự nhiên, có điểm nhấn.
Sáng tác thơ / Nhập vai (Roleplay) 0.8 - 1.2 0.95 Khuyến khích AI bứt phá khỏi các khuôn mẫu thông thường, mang lại sự ngạc nhiên.

Việc nắm vững các tham số này sẽ chuyển bạn từ một người "dùng AI" thành một người "điều khiển AI". Hãy thử tinh chỉnh các nút vặn này trong lần prompt tiếp theo, bạn sẽ bất ngờ với sức mạnh mà chúng mang lại!


All Rights Reserved

Viblo
Let's register a Viblo Account to get more interesting posts.