Ngày 1/6, tài liệu nghiên cứu mới nhất do OpenAI công bố cho thấy công ty đang sử dụng một phương pháp mới để huấn luyện các mô hình trí tuệ nhân tạo (AI) nhằm chống lại “ảo tưởng” về trí tuệ nhân tạo. Ảo giác AI đề cập đến khả năng của một mô hình AI tạo ra nội dung không dựa trên bất kỳ dữ liệu nào trong thế giới thực mà thay vào đó là sản phẩm của trí tưởng tượng của chính mô hình đó. Có những lo ngại về những vấn đề tiềm ẩn mà những ảo giác như vậy có thể gây ra, bao gồm những vấn đề về đạo đức, xã hội và thực tế.
Các nhà nghiên cứu của OpenAI báo cáo rằng ngay cả những mô hình trí tuệ nhân tạo tiên tiến nhất cũng có xu hướng nói dối và chúng thường thể hiện xu hướng bịa đặt sự thật trong những thời điểm không chắc chắn. Và những ảo tưởng này đặc biệt nghiêm trọng trong các lĩnh vực đòi hỏi lập luận nhiều bước, trong đó một lỗi logic duy nhất cũng đủ để làm hỏng một giải pháp lớn hơn. Chiến lược mới do công ty đề xuất là thưởng cho mỗi bước suy luận đúng khi huấn luyện mô hình trí tuệ nhân tạo, thay vì chỉ thưởng cho kết luận cuối cùng đúng. Theo các nhà nghiên cứu, phương pháp này, được gọi là “giám sát quá trình”, thay vì giám sát kết quả, có thể cải thiện hiệu suất và độ chính xác của AI vì chiến lược này khuyến khích các mô hình tuân theo “chuỗi suy nghĩ” giống con người hơn.