Алгоритмы юмора: можно ли обучить сарказму ИИ?

Фото - Алгоритмы юмора: можно ли обучить сарказму ИИ?
Общение с искусственным интеллектом приобретает все новые изюминки. Банальные и сухие строки остались в прошлом — чат-боты теперь способны дополнять ответы капельками юмора. Нейросети получили возможность анализировать тон пользователя и продуцировать остроумные реакции.
Но как глубоко машины способны осознавать сарказм? И есть ли у железного разума хватка, чтобы родить настоящую сногсшибательную шутку, которая заставит пользователя плакать от хохота?

В поисках ИИ-шутников: как GPT-4o, Grok и другие языковые модели генерируют юмор 

Обучение юмору — один из важных аспектов тренировок нейросетей, особенно для тех компаний, которые стремятся построить ботов, способных распознавать сарказм и шутки для более приятного пользовательского опыта. Для этого применяют обширные массивы данных, которые содержат текстовый и аудиоконтент. На различных примерах языковые модели учатся отличать эмоционально окрашенный контент от нейтрального и распознавать контексты взаимодействия в общении. 

На днях компания OpenAI представила свою новую мощнейшую языковую модель под названием GPT-4o. Буква «о» в названии расшифровывается как «всемогущий» (omnipotent — англ.). Модель способна обрабатывать пользовательские запросы в различных формах — ей можно скормить текст, изображения, аудио- и видеоматериалы. Однако языковые модели разнообразны, их возможности отличаются в зависимости от технической базы и особенностей структуры обучения. 

Среди основных преимуществ GPT-4o — более высокая скорость генерации ответов, повышение качества распознавания изображений и видео, расширенный диапазон доступных языков и способность шутить. В деморолике на просьбу сгенерировать шутку ChatGPT ответил в тоне, который многие пользователи сочли похожим на голос Скарлетт Йоханссон из фильма «Она». Ответ бота был довольно забавным, особенно последняя реплика: «Давайте уж приступим, чего тянуть-то». 
У GPT существуют конкуренты на юморном поприще, среди которых и Grok Илона Маска. За разработкой бота стоит компания xAI, а сама нейросеть принадлежит к классу генеративного ИИ. Впервые чат-бот увидел мир в ноябре 2023 года.
Grok разработан остроумно отвечать на вопросы, и в нем есть бунтарская жилка, поэтому если вы терпеть не можете юмор, не пользуйтесь моделью, пожалуйста!
— xAI.
Модель наделена доступом к материалам соцплатформы X (ранее Twitter) и получает данные в реальном времени. Благодаря этим механизмам Grok предоставляет пользователю актуальные сведения, но также может и пошутить на широкий спектр тем, среди которых политика, спорт и криптовалюты. Чтобы воспользоваться юмористическим потенциалом чат-бота, нужна подписка на X Premium. А примеры его колкостей можно найти в постах на просторах сети. Предлагаем вашему вниманию каламбур о BTC и холодных кошельках. 
У появления Grok богатая предыстория. Илон Маск, который вошел в состав сооснователей OpenAI в 2015 году, не признает современной ориентации техногиганта. Предприниматель убежден, что OpenAI перестроилась исключительно на генерацию прибыли, а закрытый исходный код ее творений не служит для повышения благосостояния человечества никоим образом. В марте текущего года Маск даже обратился в суд с иском против компании, которую когда-то помог основать. В глазах Маска OpenAI предала собственные изначальные стремления. 

xAI, напротив, придерживается другой стратегии развития. В марте компания выложила исходный код Grok в открытый доступ. Соответственно, любой желающий теперь способен проанализировать принципы работы бота и использовать эти наработки для создания новых приложений. И это если учесть, что ChatGPT предлагает своим пользователям и бесплатную модель, в то время как Grok заточен исключительно на платную подписку. 

Ситкомы пригодились: исследователи ИИ и их помощники в обучении алгоритмов  

Функции распознавания сарказма являются частью научных исследований и практических решений ИИ-индустрии с 2010-х годов — времени расцвета алгоритмов машинного обучения. 2024 несёт всё новые успехи в развитии этого аспекта нейромоделей. Нидерландские ученые построили алгоритм, способный распознать 75% саркастических фраз из ситкомов. Эту модель обучали на аудио- и текстовых материалах с трактовкой эмоциональной окраски, которая была вложена во фразы известных сериалов, к примеру «Друзья» и «Теория большого взрыва».

В The Guardian сообщают, что исследователи из лаборатории Speech Tech Lab Гронингенского университета планируют дополнительно нарастить точность ИИ-анализа. Для этого они собираются дополнить процесс обучения подсказками к пониманию мимики персонажей, например описания движения бровей и типа ухмылки. По словам ученых, этот алгоритм вряд ли сможет достичь 100-процентной эффективности, ведь это не под силу даже человеку. Кроме того, они отметили сложность определения подлинности ответа нейромодели — она тоже может быть построена на сарказме.

Так нужен ли нам юмор на ИИ-основе?

Нейросетевые боты уже способны генерировать мемы, проявлять сарказм и считывать завуалированные шутки. Временами им удается рассмешить пользователя. Несмотря на закономерные неудачные попытки, добавление юмора в ИИ-функционал делает ботов более привлекательными для потенциальных юзеров. Контент-мейкеры, сценаристы и комедианты получили возможность обратиться к инструментарию ИИ-ассистентов для генерации собственных материалов.

Шутки железного разума различаются: роль играют как особенности алгоритма, так и специфика массивов данных для их обучения. В случайной генерации много потенциальных минусов — фраза может получиться расистской, сексистской, попросту неэтичной или вообще несмешной. Ключ к созданию естественного и по-настоящему смешного бота лежит исключительно в руках человека с его тонким чувством юмора и умением улучшать технодостижения.
И все же, несмотря на недостатки чат-ботов, наблюдать за процессом их обучения и за юморными нейропопытками — занятие довольно увлекательное. Веет «Терминатором» с Арнольдом Шварценеггером, где киборг неловко пытается отыграть улыбку на своем безэмоциональном лице. По-видимому, именно наличие подобных неудачных попыток и делает синтетических собеседников еще более очаровательными. Для тех же, кто не знаком с персонажем «Железного Арни», и для желающих увидеть его бесподобную ухмылку снова — предлагаем YouTube-ролик ниже.

Web3-райтер и по совместительству крипто-HODLер. Отслеживает тенденции рынка, а также интересуется новейшими технологиями.