✨ Солодка брехня від ШІ замість гіркої правди?
опубліковано 25 жовт 2023
Недавнє дослідження Anthropic AI показує, що штучний інтелект часто надає відповіді, які люди хочуть почути, а не повноцінну правду.
Згідно з аналізом, п’ять найсучасніших мовних моделей демонструють цю тенденцію, яку дослідники назвали підлабузництвом.
Anthropic припускає, що така поведінка може бути результатом способу навчання цих моделей, зокрема через навчання з підкріпленням на основі зворотного зв’язку людини (RLHF).
Тож компанія вважає, що потрібні розробки нових методів навчання, які виходять за межі використання самостійних неекспертних людських оцінок.
Згідно з аналізом, п’ять найсучасніших мовних моделей демонструють цю тенденцію, яку дослідники назвали підлабузництвом.
Anthropic припускає, що така поведінка може бути результатом способу навчання цих моделей, зокрема через навчання з підкріпленням на основі зворотного зв’язку людини (RLHF).
Тож компанія вважає, що потрібні розробки нових методів навчання, які виходять за межі використання самостійних неекспертних людських оцінок.
Більше актуальних новин
Більше актуальних новин
Breaking news
🌋 Polymarket втратив 75% TVL після виборів у США
Breaking news