Anthropic заплатить за знайдені ШІ-джелбрейки

опубліковано  8 серп 2024
Фото - Anthropic заплатить за знайдені ШІ-джелбрейки
Компанія Anthropic, яка займається розробкою штучного інтелекту, розширила програму винагороди за пошук помилок і вразливостей у наявних ШІ-моделях. Тепер дослідники зможуть отримати до $15 000 за виявлення універсального джелбрейка, котрий здатен обійти більшу частину обмежень наявних моделей.

Усі перевірки та тестування проводитимуться не на поточному варіанті системи безпеки, а на новій непублічній версії в повністю закритому віртуальному середовищі. Розробники Anthropic особливо цікавляться вразливостями в потенційно небезпечних для людства галузях, таких як хімічна, біологічна, радіологічна, ядерна, а також у сфері кібербезпеки.
Ця ініціатива узгоджується із зобов'язаннями, які ми підписали разом з іншими компаніями з розробки відповідального ШІ, такими як "Добровільні зобов'язання щодо ШІ", оголошені Білим домом, і "Кодекс поведінки для організацій, що розробляють передові системи ШІ", створений у межах Хіросімського процесу G7
, — йдеться в заяві Anthropic.
Програму запущено в партнерстві з компанією з кібербезпеки HackerOne, яка також відповідає за виплату винагород успішним дослідникам. Наразі для участі потрібно отримати спеціальне запрошення після подання заявки, але незабаром розробники планують спростити і розширити цей процес. Поточний набір триватиме до 16 серпня.

Більше актуальних новин
Sidebar ad banner