✨ Сладкая ложь от ИИ вместо горькой правды?
опубликовано 25 окт 2023
Недавнее исследование Anthropic AI показывает, что искусственный интеллект часто предоставляет ответы, которые люди хотят услышать, а не полноценную правду.
Согласно анализу, пять самых современных языковых моделей демонстрируют эту тенденцию, которую исследователи назвали подхалимством.
Anthropic предполагает, что такое поведение может быть результатом способа обучения этих моделей, в частности через обучение с подкреплением на основе обратной связи от человека (RLHF).
Поэтому компания считает, что нужно разрабатывать новые методы обучения, которые выходят за рамки использования неэкспертных человеческих оценок.
Согласно анализу, пять самых современных языковых моделей демонстрируют эту тенденцию, которую исследователи назвали подхалимством.
Anthropic предполагает, что такое поведение может быть результатом способа обучения этих моделей, в частности через обучение с подкреплением на основе обратной связи от человека (RLHF).
Поэтому компания считает, что нужно разрабатывать новые методы обучения, которые выходят за рамки использования неэкспертных человеческих оценок.
Больше актуальных новостей
Больше актуальных новостей
Breaking news
🌋 Объемы торгов NFT достигли годового максимума
Breaking news