AI Showrunner: випусти «Південний парк» з собою у головній ролі
Компанія Fable, що працює над масштабним проєктом зі створення та розвитку ШІ-персонажів The Simulation, пропонує оригінальне рішення AI Showrunner для створення якісного епізодичного контенту, у тому числі телешоу або серіалів.
У розробці SHOW-1 дослідники поєднують великі мовні моделі, моделі поширення та мультиагентне моделювання для розвитку сюжету та управління поведінкою персонажів у певному контексті.
«Потужні мовні моделі, такі як GPT-4, були навчені на великому масиві даних телешоу, що дозволяє нам повірити, що за правильного керівництва користувачі зможуть переписувати цілі сезони», — упевнені у Fable.
Створити свій "Південний парк"? Чому б і ні! Джерело: https://fablestudio.github.io/
Як працює технологія AI Showrunner?
AI Showrunner призначений для створення якісних творчих робіт із контекстним керівництвом, особливо в межах наявної інтелектуальної власності. Він розрахований на довгостроковий процес, тоді як класичні ChatGPT та генератор зображень Stable Diffusion переважно націлені на вирішення загальних короткострокових завдань.
Якщо пояснити просто, то AI Showrunner допоможе користувачам створювати унікальний контент у стилі улюбленого телешоу чи серіалу. При цьому результат не тільки матиме максимально наближену до оригіналу картинку або музичний супровід, а й порадує відтворенням атмосфери, характерної поведінки персонажів та ін.
Запобігаючи появі будь-яких питань з боку фанатів «Південного парку», дослідники одразу роблять офіційну заяву: вони працюють над експериментальним некомерційним проєктом, який має на меті вивчити потенціал ШІ, синтез голосу та технології глибокого навчання для відтворення образу та голосів відомого шоу. AI Showrunner не пов’язаний з його творцями, продюсерами, правовласниками та іншими членами команди, а також не претендує на права інтелектуальної власності, товарні знаки та авторські права.
Розробники технології використовують для створення зображень та послідовних сцен, пов’язаних з вибраним світом, мультиагентну симуляцію і такі дані, як історія героя, його емоції та цілі, локації та події. Очікується, що AI Showrunner допоможе вирішити основні проблеми генеративних систем, серед яких:
- галюцинації ШІ, сприяють появі несподіваних сюжетних поворотів чи нехарактерної для персонажа поведінки;
- ефект ігрового автомата, що проявляється у генерації контенту з випадковими параметрами, не схожий на результат запланованого творчого процесу.
Для навчання користувацьких моделей розповсюдження дослідники використовували набір даних з 1200 одиночних символів і 600 фонових зображень з телешоу «Південний парк». Такого обсягу інформації виявилося достатньо для отримання вихідного матеріалу з упізнаваним стилем оригінального проєкту. Користувачі AI Showrunner можуть створювати героїв на базі власної зовнішності з клонованим голосом, які стануть повноправними автономними учасниками віртуального світу.
Кожен користувач може створити унікального персонажа, схожого на себе Джерело: https://fablestudio.github.io/
Автори AI Showrunner розглядають епізод телешоу як послідовність діалогів на різних локаціях, загальна тривалість яких становить 22 хвилини. Для отримання повноцінного епізоду «Південного парку» системі потрібно надати деталізовану ідею, а саме назву, короткий зміст серії та основні події, які мають відбутися протягом одного тижня симуляції (~три години ігрового часу).
Далі система в автоматичному режимі створює до 14 сцен, орієнтуючись на надані користувачем підказки. AI Showrunner контролює правильність підбору персонажів для них та відповідність сюжету. Кожна сцена отримує свою сюжетну літеру (A, B, C та ін.) і система об’єднує їх в епізод згідно з шаблоном сюжету, наприклад ABAВC. Голоси героїв клонуються заздалегідь, на етапі підготовки, а генерація голосових кліпів здійснюється в режимі реального часу відповідно до кожного нового рядка діалогу.
Схема створення епізоду «Південного парку» за допомогою AI Showrunner Джерело: https://fablestudio.github.io/
Розробники AI Showrunner планують удосконалювати технологію, підвищуючи якість контенту, що генерується, і розкриваючи творчий потенціал генеративних ШІ-систем:
«Наше припущення полягає в тому, що сприйнята цінність контенту, створеного ШІ, безумовно зросте. Новим цікавим підходом до відтворення цього може бути втілення творчих моделей ШІ, таких як SHOW-1, здатних створювати особистість поза своїм симульованим світом та будувати відносини зі своєю аудиторією через соціальні мережі чи події реального світу. Поки модель ШІ сприймається як чорна скринька: вона не ділиться своїм творчим процесом та міркуваннями по-людськи і доступно, як у випадку з живими письменниками та режисерами, і навряд чи їй приписують справжні творчі цінності. Однак це більше філософське питання в контексті AGI».
Оригінал цитат:
Powerful LLMs such as GPT-4 were trained on a large corpus of TV show data which lets us believe that with the right guidance users will be able to rewrite entire seasons.
Our assumption is that the perceived value of AI generated content would certainly increase. A new interesting approach to replicate this could be the embodiment of creative AI models such as SHOW-1 to allow them to build a persona outside their simulated world and build relationships via social media or real world events with their audience. As long as an AI model is perceived as a black box and does not share their creative process and reasoning in a human and accessible way, as is the case for living writers and directors, it's unlikely to get credit with real creative values. However, for now this is a more philosophical question in the context of AGI.