Сладкая ложь от ИИ вместо горькой правды?

Недавнее исследование Anthropic AI показывает, что искусственный интеллект часто предоставляет ответы, которые люди хотят услышать, а не полноценную правду.

Недавнее исследование Anthropic AI показывает, что искусственный интеллект часто предоставляет ответы, которые люди хотят услышать, а не полноценную правду.

Согласно анализу, пять самых современных языковых моделей демонстрируют эту тенденцию, которую исследователи назвали подхалимством.

Anthropic предполагает, что такое поведение может быть результатом способа обучения этих моделей, в частности через обучение с подкреплением на основе обратной связи от человека (RLHF).

Поэтому компания считает, что нужно разрабатывать новые методы обучения, которые выходят за рамки использования неэкспертных человеческих оценок.

✨ Сладкая ложь от ИИ вместо горькой правды?

Подписывайтесь на нашу рассылку новостей

Подписывайтесь на нашу рассылку новостей

Больше актуальных новостей

Больше актуальных новостей

Orbiter Finance запускает собственный токен, анонсировав эйрдроп

Возможен ли запуск Dogecoin ETF?

Институциональный бум: Wintermute увеличивает объемы OTC-торгов

Рекомендации

ИИ в поп-культуре: 5 фильмов, которые стоит посмотреть

Эксклюзивное интервью с Руном Кристенсеном (MakerDAO)

Как искусственный интеллект меняет рынок труда