Điều chỉnh Settings trong OpenAI Background | P1

OpenAI Playground là một công cụ tương tác dựa trên web cho phép người dùng thử nghiệm các mô hình ngôn ngữ của OpenAI, chẳng hạn như GPT-3 và GPT-4. Nó cung cấp một giao diện thân thiện với người dùng, nơi bạn có thể nhập lời nhắc văn bản và nhận phản hồi văn bản được tạo từ các mô hình. Sau đây là một số tính năng và khái niệm chính liên quan đến OpenAI Playground:

P2: Prompting cơ bản

Temperature

Trong bối cảnh của OpenAI và các mô hình ngôn ngữ của nó, Temperature là một siêu tham số kiểm soát tính ngẫu nhiên của đầu ra của mô hình. Nó được sử dụng trong quá trình lấy mẫu trong quá trình tạo văn bản.

Prompt: Ngày xửa ngày xưa tại một khu rừng nọ,

Low Temperature (1<): Đầu ra của mô hình sẽ mang tính xác định và tập trung hơn, vì phân phối xác suất của từ tiếp theo sắc nét hơn, ưu tiên các từ có xác suất cao nhất. Điều này có thể dẫn đến văn bản lặp lại và truyền thống hơn hơn:

Ngày xửa ngày xưa tại một khu rừng nọ, những chú chim hót líu lo vào buổi sáng gọi nhau bắt đầu một ngày mới, những chú kiến vẫn miệt mài kiếm ăn nhặt nhạnh từng mảnh vụn của trái táo.

Nhiệt độ cao (>1): Đầu ra sẽ ngẫu nhiên và đa dạng hơn, vì phân phối xác suất của từ tiếp theo phẳng hơn, cho phép chọn nhiều từ có thể hơn. Điều này có thể làm cho văn bản sáng tạo hơn nhưng cũng kém mạch lạc hơn:

Ngày xửa ngày xưa tại một khu rừng nọ, chúa chim là bà hoàng có sức mạnh vô song một ngày tập hợp các vị thần của khu rừng là cây biết nói, hồ nước biết đi, và thần sấm sét mang hình hài của một con sư tử tới cùng nhau hát ca ăn mừng.

Top P

Top P, còn được gọi là lấy mẫu hạt nhân, là một tham số được sử dụng trong quá trình tạo văn bản giúp kiểm soát tính đa dạng và tính sáng tạo của đầu ra của mô hình. Nó hoạt động bằng cách chỉ xem xét các từ tiếp theo có khả năng xảy ra nhất cho đến khi xác suất tích lũy của các từ đó đạt đến một ngưỡng nhất định, được xác định bởi giá trị Top P.

Giá trị của Top P càng cao, văn bản đầu ra càng sáng tạo và đa dạng, ngược lại giá trị Top P càng thấp, văn bản đầu ra càng truyền thống và ít sáng tạo.

Stop Sequences

Stop Sequences hoặc mã thông báo dừng là các mẫu hoặc chuỗi ký tự cụ thể báo hiệu cho mô hình ngôn ngữ khi nào dừng tạo thêm văn bản. Các chuỗi này hoạt động như tín hiệu kết thúc để kết thúc quá trình tạo, giúp kiểm soát độ dài và phạm vi của đầu ra.

Frequency penalty

Frequency penalty là một tham số được sử dụng trong các mô hình tạo văn bản để kiểm soát tần suất lặp lại của một số từ hoặc cụm từ nhất định. Nó giúp quản lý sự trùng lặp và khuyến khích mô hình tạo ra văn bản đa dạng và thú vị hơn.

Presence Penalty

Presence Penalty là một tham số được sử dụng trong các mô hình tạo văn bản để ảnh hưởng đến khả năng mô hình giới thiệu các chủ đề hoặc khái niệm mới. Nó giúp kiểm soát tính đa dạng của nội dung được tạo ra bằng cách phạt việc sử dụng các từ hoặc cụm từ đã xuất hiện trong văn bản.

Nói một cách dễ hiểu, Presence Penalty giúp bạn kiểm soát kết quả đầu ra hạn chế việc lặp đi lặp lại sử dụng một từ nào đó. Giả sử bạn đang tạo một câu chuyện về một khu rừng kỳ diệu và bạn đặt Presence Penalty

Prompt: Trong khu rừng kỳ diệu, một cô gái trẻ đã phát hiện ra một,

Presence Penalty (=0): Kết quả có thể thường xuyên lặp lại các từ liên quan đến khu rừng kỳ diệu, chẳng hạn như “rừng”, “ma thuật” hoặc “cô gái”.

Presence Penalty (>0): Mô hình sẽ bị phạt vì sử dụng lại những từ này và có khả năng sẽ chọn những từ hoặc khái niệm mới, đa dạng hơn, dẫn đến một câu chuyện đa dạng hơn.

Trả lời