Алгоритми гумору: чи можна навчити ШІ сарказму?
Спілкування зі штучним інтелектом набуває нових родзинок. Банальні та сухі рядки залишилися в минулому — чат-боти тепер здатні доповнювати відповіді краплинками гумору. Нейромережі отримали можливість аналізувати тон користувача та продукувати дотепні реакції.
Але як глибоко машини здатні усвідомлювати сарказм? І чи має залізний розум здібність до того, аби створити справжній карколомний жарт, який змусить користувача ридати від реготу?
У пошуках ШІ-жартівників: як GPT-4o, Grok та інші мовні моделі генерують гумор
Навчання гумору — один із важливих аспектів тренувань нейромереж, особливо для тих компаній, що прагнуть побудувати ботів, які спроможні розпізнавати сарказм і жарти для більш приємного користувацького досвіду. Заради цього застосовують великі масиви даних, що містять текстовий та аудіоконтент. На різних прикладах мовні моделі вчаться відрізняти емоційно забарвлений контент від нейтрального та розпізнавати контексти взаємодії у спілкуванні.
Днями компанія OpenAI презентувала свою нову найпотужнішу мовну модель під назвою GPT-4o. Буква «о» в назві розшифровується як «всемогутній» (omnipotent — англ.). Модель здатна обробляти користувацькі запити в різних формах — їй можна згодувати текст, зображення, аудіо- та відеоматеріали. Однак мовні моделі різноманітні, їх можливості різняться залежно від технічної бази та особливостей структури навчання.
Серед основних переваг GPT-4o — вища швидкість генерації відповідей, поліпшення якості розпізнавання зображень і відео, розширений діапазон доступних мов і здатність жартувати. У деморолику на прохання згенерувати жарт ChatGPT відповів у тоні, який багато користувачів визнали схожим на голос Скарлетт Йоганссон із фільму «Вона». Відповідь бота була доволі кумедною, особливо остання репліка: «Почнімо вже, чого тягнути».
GPT має конкурентів на ниві гумору, серед яких і Grok Ілона Маска. За розробкою бота стоїть компанія xAI, а сама нейромережа належить до класу генеративного ШІ. Уперше чат-бот побачив світ у листопаді 2023 року.
Grok створений дотепно відповідати на запитання, і він має бунтарську жилку, тому якщо ви ненавидите гумор, не користуйтеся моделлю, будь ласка!— xAI.
Модель має доступ до матеріалів соцплатформи X (раніше Twitter) та отримує дані в реальному часі. Завдяки цим механізмам Grok надає користувачеві актуальні відомості, але також може й пожартувати на широкий спектр тем, серед яких політика, спорт і криптовалюти. Щоб скористатися гуморним потенціалом чат-бота, потрібна підписка на X Premium. А приклади його дотепів можна знайти в постах на просторах мережі. До вашої уваги каламбур про BTC і холодні гаманці.
Поява Grok має насичену історію. Ілон Маск, який увійшов до складу співзасновників OpenAI у 2015 році, не визнає сучасної орієнтації техногіганта. Підприємець переконаний, що OpenAI перебудувалася лише на генерацію прибутку, а закритий вихідний код її творінь ніяк не слугує підвищенню добробуту людства. У березні поточного року Маск навіть звернувся до суду з позовом проти компанії, яку колись допоміг заснувати. В очах Маска OpenAI зрадила власні початкові прагнення.
xAI, натомість, дотримується іншої стратегії розвитку. У березні компанія виклала вихідний код Grok у відкритий доступ. Відповідно, будь-хто тепер здатний проаналізувати принципи роботи бота та використовувати ці напрацювання для створення нових застосунків. Водночас ChatGPT пропонує своїм користувачам і безкоштовну модель, тоді як Grok орієнтований лише на платну підписку.
Ситкоми стали в пригоді: дослідники ШІ та їхні помічники у навчанні алгоритмів
Функції розпізнавання сарказму є частиною наукових досліджень і практичних рішень ШІ-індустрії з 2010-х років — часу розквіту алгоритмів машинного навчання. 2024 рік несе нові успіхи в розвитку цього аспекту нейромоделей. Нідерландські вчені побудували алгоритм, що здатен розпізнати 75% саркастичних фраз із ситкомів. Цю модель навчали на аудіо- і текстових матеріалах з трактуванням емоційного забарвлення, що було вкладено у фрази відомих серіалів, наприклад «Друзі» й «Теорія великого вибуху».
У The Guardian повідомляють, що дослідники з лабораторії Speech Tech Lab Гронінгенського університету планують додатково збільшити точність ШІ-аналізу. Для цього вони мають намір доповнити процес навчання підказками до розуміння міміки персонажів, як-от описи руху брів і типу усмішки. За словами вчених, цей алгоритм навряд чи зможе досягти 100-відсоткової ефективності, адже це не до снаги навіть людині. Крім того, вони відзначили складність визначення автентичності відповіді нейромоделі — вона теж може бути побудована на сарказмі.
То чи потрібен нам гумор на ШІ-основі?
Нейромережеві боти вже здатні генерувати меми, виявляти сарказм і зчитувати завуальовані жарти. Часом їм вдається розсмішити користувача. Незважаючи на закономірні невдалі спроби, додавання гумору до ШІ-функціонала робить чат-ботів більш привабливими для потенційних користувачів. Контент-мейкери, сценаристи й комедіанти отримали можливість звернутися до інструментарію ШІ-асистентів для генерації власних матеріалів.
Жарти залізного розуму різняться: роль відіграють як особливості алгоритму, так і специфіка масивів даних для їх навчання. У випадкової генерації багато потенційних мінусів — фраза може вийти расистською, сексистською, просто неетичною або взагалі позбавленою кумедності. Ключ до створення природного і по-справжньому смішного бота лежить тільки в руках людини з її тонким почуттям гумору та вмінням покращувати технодосягнення.
І все ж, попри недоліки чат-ботів, спостерігати за процесом їх навчання і за гуморними нейроспробами — заняття доволі захопливе. Віє «Термінатором» з Арнольдом Шварценеггером, де кіборг ніяково намагається відіграти усмішку на своєму беземоційному обличчі. Мабуть, саме наявність подібних невдалих спроб і робить синтетичних співрозмовників ще більш чарівними. Для тих, хто не знайомий з персонажем «Залізного Арні», і для охочих побачити його незрівнянну усмішку знову, пропонуємо YouTube-ролик нижче.