Сладкая ложь от ИИ вместо горькой правды?

опубликовано  25 окт 2023
Фото - Сладкая ложь от ИИ вместо горькой правды?
Недавнее исследование Anthropic AI показывает, что искусственный интеллект часто предоставляет ответы, которые люди хотят услышать, а не полноценную правду.

Согласно анализу, пять самых современных языковых моделей демонстрируют эту тенденцию, которую исследователи назвали подхалимством.

Anthropic предполагает, что такое поведение может быть результатом способа обучения этих моделей, в частности через обучение с подкреплением на основе обратной связи от человека (RLHF).

Поэтому компания считает, что нужно разрабатывать новые методы обучения, которые выходят за рамки использования неэкспертных человеческих оценок.

Больше актуальных новостей
Sidebar ad banner