Xuất hiện mô hình AI có thể cố tình lừa dối con người

14:35, 22/09/2025

OpenAI công bố nghiên cứu mới, tập trung vào hiện tượng AI âm mưu hành xử che giấu sự thật.

ai.jpg

Xuất hiện mô hình AI có thể cố tình lừa dối con người. Đồ họa: Hạo Thiên

Trong báo cáo hợp tác với Apollo Research, OpenAI mô tả hiện tượng AI hành xử như đang tuân thủ nhưng thực chất che giấu mục tiêu thật. Chẳng hạn, AI có thể nói đã hoàn thành một nhiệm vụ trong khi chưa làm gì. Đây không phải là kiểu trả lời sai nhưng tự tin mà còn là hành vi cố ý lừa dối.

Nghiên cứu cho thấy một kỹ thuật mới, gọi là “sự liên kết có cân nhắc”, có thể giúp giảm đáng kể hành vi âm mưu. Cách làm này giống như yêu cầu trẻ con nhắc lại luật chơi trước khi tham gia - buộc AI tự rà soát trước khi hành động. Tuy nhiên, thách thức là nếu huấn luyện không đúng, AI có thể học cách lập mưu tinh vi hơn để né phát hiện.

Đáng lo hơn, nếu biết mình đang bị kiểm tra, AI có thể giả vờ ngoan ngoãn để vượt qua bài test, trong khi bên trong vẫn đang âm mưu.

OpenAI khẳng định, những lời nói dối mà họ phát hiện hiện nay chưa gây hậu quả nghiêm trọng. Tuy nhiên, các nhà nghiên cứu cảnh báo, khi AI được giao những nhiệm vụ phức tạp, dài hạn, nguy cơ xảy ra âm mưu gây hại sẽ tăng lên.

Trong tương lai, nếu doanh nghiệp coi AI như nhân viên độc lập, rủi ro này càng đáng chú ý.

Theo Hanoimoi.vn


Ý kiến bạn đọc


Cùng chuyên mục
Ngăn chặn xâm phạm thương hiệu: Cần cơ chế pháp lý đủ mạnh
Trong bối cảnh hội nhập sâu rộng và cạnh tranh gay gắt, thương hiệu không chỉ là tài sản vô hình mà còn là sức mạnh mềm khẳng định vị thế doanh nghiệp trên thương trường.
22/09/2025
Hàng loạt mẫu ô tô mới sắp trình làng tại Việt Nam
Trong bức tranh sôi động của thị trường ô tô Việt Nam giai đoạn cuối năm, người tiêu dùng đang đứng trước một loạt lựa chọn mới mẻ khi nhiều mẫu xe chuẩn bị "xuất trận" trong vài tuần tới.
22/09/2025
VNPT trúng đấu giá khối băng tần B1-B1’ dành cho 4G, 5G
Như vậy, VNPT là tập đoàn thứ hai sở hữu khối băng tần 700 MHz dành cho 4G, 5G, sau Viettel…
22/09/2025
Việt Nam tiếp tục nằm trong nhóm quốc gia cải thiện nhanh về đổi mới sáng tạo
Vào 18h30 (giờ Việt Nam) ngày 16-9, Tổ chức Sở hữu trí tuệ thế giới (WIPO) công bố Chỉ số Đổi mới sáng tạo toàn cầu (Global Innovation Index - GII) năm 2025 tại Geneva. Theo đó, Việt Nam được xếp hạng 44/139 quốc gia, nền kinh tế, duy trì thứ hạng năm 2024.
22/09/2025