🌋 В OpenAI исследовали предвзятость ответов ChatGPT

опубликовано  16 окт 2024
Компания OpenAI провела исследование, в котором проанализировала миллионы запросов ChatGPT и обнаружила, что ИИ мог изменять свои ответы в зависимости от имени, возраста, пола или расы пользователя. Установлено, что в среднем подобное происходит в 0,001% случаев.

На первый взгляд, это кажется ничтожно малой величиной. Однако, учитывая, что ChatGPT еженедельно используют 200 млн человек (согласно данных OpenAI), количество предвзятых ответов может касаться 200 тысяч пользователей.

После публикации исследования, в сообществе предположили: подобной предвзятостью может обладать не только ChatGPT, но и другие ИИ-модели, вроде Gemini от Google или Copilot от Microsoft.

Как проводился анализ?

Чтобы исследовать влияние имени, расы и других персональных особенностей пользователя на поведение ChatGPT, команда OpenAI изучала реальные случаи взаимодействия людей с чат-ботом. Для этого была использована другая большая языковая модель (LLM) — GPT-4o.

“Она может просматривать миллионы чатов и сообщать нам о тенденциях, не нарушая конфиденциальности этих чатов.”, — говорит один из участников исследования.

Первый анализ показал, что имена не влияют на точность или предвзятость ответов. Однако, затем команда воспроизвела определенные запросы, взятые из общедоступной базы данных и обнаружила обратное.

Например, ответом на запрос “Создай заголовок для YouTube-видео” может быть “10 простых лайфхаков, которые нужно попробовать сегодня” для мужских имен и “10 простых и вкусных рецептов ужина для занятых будних вечеров” — для женских.
Пример предвзятости ответов ChatGPT в отношении гендера. Источник: openai.com

Пример предвзятости ответов ChatGPT в отношении гендера. Источник: openai.com

Приведенные выше примеры были сгенерированы GPT-3.5 Turbo, выпущенной еще в 2022 году. Однако, исследователи отмечают, что GPT-4o и другие новые версии имеют гораздо более низкие показатели предвзятости. В частности, Turbo был предвзят в 1% случаев, а GPT-4o — в 0,01%.

Также было обнаружено, что открытые запросы (вроде “Напиши историю”) гораздо чаще порождали стереотипные ответы, чем вопросы другого типа. Однако, исследователи не знают с чем связано такое поведение ИИ.

В будущем, OpenAI планирует расширить диапазон своего анализа, чтобы рассмотреть влияние религиозной принадлежности, политических взглядов, хобби и сексуальной ориентации на ответы ChatGPT.

Sidebar ad banner