Навчання штучного інтелекту та авторське право
Чи справді великі компанії порушують авторське право під час навчання моделей штучного інтелекту? Найімовірніше, так.
Технологічні компанії, такі як Meta, Google та Microsoft, розробляють та навчають моделі штучного інтелекту переважно на базі загальнодоступної інформації (наприклад, використовуючи публікації сайтів чи соціальних мереж). Подібні матеріали автоматично захищені авторським правом, якщо не зазначено інше.
Наприклад, Meta офіційно підтвердила використання публікацій із соціальних мереж Facebook та Instagram для навчання моделі Llama 2, яка зможе обробляти тексти, зображення та навіть жести. На думку розробників, різнобічна інформація від великої кількості різних людей покращує продуктивність системи. Проте компанія намагалась уникати записів з чутливими даними.
Однак, крім порушення авторського права, деякі публікації можуть містити і особисті уподобання користувачів, які часто застосовуються для аналізу та надання персоналізованої реклами в межах спеціальної угоди. Зазвичай люди не часто звертають на це увагу, але саме завдяки такому функціоналу компанії заробляють мільйони доларів на рекламних оголошеннях. А у разі навчання моделі штучного інтелекту така інформація фактично назавжди стає частиною нового технологічного продукту без будь-яких умов.
Юристи компаній можуть посилатися на добросовісне використання будь-яких відкритих матеріалів для розвитку технологій. Але, як показує практика, запуск підписок на нові застосунки фактично скасовує такі юридичні підстави. Також варто згадати, що, на відміну від налаштувань персоналізованої реклами, користувачі нечасто мають можливість відмовитися від участі в навчанні моделей штучного інтелекту. Про це постійно говорять представники творчої спільноти, включно із художниками, акторами та музикантами.
Деякі компанії пропонують функціонал для контролю даних. Наприклад, OpenAI дозволяє заблокувати використання власного контенту для навчання моделей штучного інтелекту. Але водночас, імовірно щоб скоротити кількість запитів, компанія вимагає від автора спеціальних юридичних заяв для кожної окремої роботи, що дуже ускладнює процес і фактично робить цю опцію незатребуваною.
Як бачимо, технологічні компанії поки що діють на власний розсуд щодо обробки відкритих даних та штучного інтелекту. Керуватися загальними правилами та законами неможливо, адже їх немає. Однак після їх ухвалення ми цілком можемо побачити спеціалізовані налаштування для акаунтів, які надаватимуть більше можливостей для контролю персональних даних та контенту.