Anthropic заплатить за знайдені ШІ-джелбрейки

Компанія Anthropic, яка займається розробкою штучного інтелекту, розширила програму винагороди за пошук помилок і вразливостей у наявних ШІ-моделях.

Компанія Anthropic, яка займається розробкою штучного інтелекту, розширила програму винагороди за пошук помилок і вразливостей у наявних ШІ-моделях. Тепер дослідники зможуть отримати до $15 000 за виявлення універсального джелбрейка, котрий здатен обійти більшу частину обмежень наявних моделей.

Усі перевірки та тестування проводитимуться не на поточному варіанті системи безпеки, а на новій непублічній версії в повністю закритому віртуальному середовищі. Розробники Anthropic особливо цікавляться вразливостями в потенційно небезпечних для людства галузях, таких як хімічна, біологічна, радіологічна, ядерна, а також у сфері кібербезпеки.

Ця ініціатива узгоджується із зобов'язаннями, які ми підписали разом з іншими компаніями з розробки відповідального ШІ, такими як "Добровільні зобов'язання щодо ШІ", оголошені Білим домом, і "Кодекс поведінки для організацій, що розробляють передові системи ШІ", створений у межах Хіросімського процесу G7

, — йдеться в заяві Anthropic.

Програму запущено в партнерстві з компанією з кібербезпеки HackerOne, яка також відповідає за виплату винагород успішним дослідникам. Наразі для участі потрібно отримати спеціальне запрошення після подання заявки, але незабаром розробники планують спростити і розширити цей процес. Поточний набір триватиме до 16 серпня.

⚡ Anthropic заплатить за знайдені ШІ-джелбрейки

Підписуйтесь на нашу розсилку новин

Підписуйтесь на нашу розсилку новин

Більше актуальних новин

Більше актуальних новин

Telegram зробив TON єдиним блокчейном для міні-додатків

Енергокомпанія Enel вийшла на ринок RWA в партнерстві з Algorand

CEO Circle — банки готові працювати з цифровими активами

Рекомендації

Balenciaga прийматиме криптовалютні платежі

Криптоеквайринг в Україні: яке рішення найкраще

Віталік Бутерін висловив думку про потенціал криптоплатежів