ШІ-діпфейки отримують нове маркування

Фото - ШІ-діпфейки отримують нове маркування
ШІ-діпфейки поширюються світом з неймовірною швидкістю. Тому необхідні рішення, які зможуть запобігти негативним наслідкам.
Пам'ятаєте пісню Емінема My Name Is?

Її куплети спонтанно виринають у пам'яті, коли бачиш перед собою зображення Папи Римського в цьому епатажному білому пуховику. Дещо схожий на знаменитого репера, чи не так?
image
Ви вже могли натрапити на це зображення в інтернеті, проте є деталь, про яку важливо знати. Його згенерував штучний інтелект, але, здається, не всі люди це усвідомили.
«Настав бум ШІ-інструментів для генерації зображень, і в цього є конкретна причина: результати кумедні, процес захопливий, а моделі прості в застосуванні. Тоді як подібні технології відкривають нові можливості для творчості, вони також викликають і побоювання щодо зловмисного застосування ШІ. Зображення можуть цілеспрямовано використовувати для обману. Навіть ті з них, які були створені лише для розваги, можуть завіруситися, що в перспективі теж здатне ввести деяких людей в оману», — пишуть у Meta.
Фахівці команди Fundamental AI Research (FAIR) з Meta долають проблему розпізнавання ШІ-діпфейків. Спільно з компанією Inria вони випустили Stable Signature. Це технологія створення водяних знаків, які непомітні для очей, проте наявні в коді зображення. Ці рядки й надаватимуть інформацію про те, що зображення було створене за допомогою генеративної ШІ-моделі з відкритим вихідним кодом.

Поговоримо про механіку роботи технології.

Простою мовою, ці невидимі водяні знаки одразу зашито в цифровому контенті. Другим аспектом є Stable Signature, який запобігає видаленню маркування з коду. Тому за допомогою цього методу й можна відстежити, який інструмент використовували для створення зображення.

Щоб пояснити механізм конкретніше, представники Meta вдаються до прикладів двох людей, Аліси і Боба.

Аліса займається навчанням генеративної моделі ШІ. Але перш ніж розпочати її дистрибуцію, Аліса допрацьовує окрему деталь моделі, що зветься декодером. Цей декодер зашиває водяний знак, який з'являтиметься на контенті Боба. Ця мітка надалі дозволить визначити версію моделі, компанію-розробника, кінцевого користувача тощо.

Потім Боб отримає модель в персональне користування й почне генерувати контент. На створених ним зображеннях буде присутній конкретний водяний знак. Ці мітки зможуть аналізувати як Аліса, так і треті особи, що допоможе зацікавленим сторонам зрозуміти, чи справді саме Боб і згенерував зображення.

Якщо Боб вирішить поділитися зображенням з іншими, і ці користувачі захочуть його якось змінити, то мітка Stable Signature нікуди не зникне.

«Хоч би як користувач не модифікував зображення, вихідний водяний знак із практично стовідсотковою ймовірністю збережеться в структурі даних. Це допоможе визначити, яку модель було використано для генерації контенту», — пояснюють представники компанії.

Крім того, в Meta повідомили, що новий метод маркування дає змогу відстежувати також зображення, для генерації яких використали різні версії однієї ШІ-моделі. Пасивні методи ідентифікації не пропонують такого функціонала. В компанії інформують, що незабаром технологію передадуть фахівцям із дослідження сфери ШІ. Основна мета — стимулювати розвиток співпраці та вдосконалювати наявні технології.

«Подане нами дослідження зосереджене на генеративних зображеннях. Надалі ми сподіваємося розкрити нові можливості для інтеграції нашої технології Stable Signature в інші види генеративного ШІ», — пишуть у FAIR.

А раніше ми в GN Crypto з'ясовували, чому французькі ШІ-компанії незадоволені регуляторними нормами ЄС.