Солодка брехня від ШІ замість гіркої правди?

опубліковано  25 жовт 2023
Фото - Солодка брехня від ШІ замість гіркої правди?
Недавнє дослідження Anthropic AI показує, що штучний інтелект часто надає відповіді, які люди хочуть почути, а не повноцінну правду.

Згідно з аналізом, п’ять найсучасніших мовних моделей демонструють цю тенденцію, яку дослідники назвали підлабузництвом.

Anthropic припускає, що така поведінка може бути результатом способу навчання цих моделей, зокрема через навчання з підкріпленням на основі зворотного зв’язку людини (RLHF).

Тож компанія вважає, що потрібні розробки нових методів навчання, які виходять за межі використання самостійних неекспертних людських оцінок.

Більше актуальних новин
Sidebar ad banner