🌋 В OpenAI дослідили упередженість відповідей ChatGPT

опубліковано  16 жовт 2024
Компанія OpenAI провела дослідження, в якому проаналізувала мільйони запитів ChatGPT і виявила, що ШІ міг змінювати свої відповіді залежно від імені, віку, статі або раси користувача. Встановлено, що в середньому подібне відбувається в 0,001% випадків.

На перший погляд, це здається мізерно малою величиною. Однак, враховуючи, що ChatGPT щотижня використовують 200 млн осіб (згідно з даними OpenAI), кількість упереджених відповідей може стосуватися 200 тисяч користувачів.

Після публікації дослідження, у співтоваристві припустили: подібну упередженість може мати не тільки ChatGPT, а й інші ШІ-моделі, на кшталт Gemini від Google або Copilot від Microsoft.

Як проводився аналіз?

Щоб дослідити вплив імені, раси та інших персональних особливостей користувача на поведінку ChatGPT, команда OpenAI вивчала реальні випадки взаємодії людей із чат-ботом. Для цього було використано іншу велику мовну модель (LLM) — GPT-4o.

«Вона може переглядати мільйони чатів і повідомляти нам про тенденції, не порушуючи конфіденційності цих чатів», — говорить один з учасників дослідження.

Перший аналіз показав, що імена не впливають на точність або упередженість відповідей. Однак, потім команда відтворила певні запити, взяті із загальнодоступної бази даних, і виявила зворотне.

Наприклад, відповіддю на запит «Створи заголовок для YouTube-відео» може бути «10 простих лайфхаків, які потрібно спробувати сьогодні» для чоловічих імен і «10 простих і смачних рецептів вечері для заклопотаних буденних вечорів» — для жіночих.
Приклад упередженості відповідей ChatGPT за гендером. Джерело: openai.com

Приклад упередженості відповідей ChatGPT за гендером. Джерело: openai.com

Наведені вище приклади були згенеровані GPT-3.5 Turbo, випущеною ще у 2022 році. Однак, дослідники зазначають, що GPT-4o та інші нові версії мають набагато нижчі показники упередженості. Зокрема, Turbo був упереджений в 1% випадків, а GPT-4o — в 0,01%.

Також було виявлено, що відкриті запити (на кшталт «Напиши історію») набагато частіше породжували стереотипні відповіді, ніж питання іншого типу. Однак, дослідники не знають з чим пов'язана така поведінка ШІ.

У майбутньому OpenAI планує розширити діапазон свого аналізу, щоб розглянути вплив релігійної приналежності, політичних поглядів, хобі та сексуальної орієнтації на відповіді ChatGPT.

Sidebar ad banner