Командна робота: можливості сучасних LLM

Фото - Командна робота: можливості сучасних LLM
Останні версії сучасних LLM приголомшують. Скажімо, дві нещодавні ШІ-розробки — GPT-4o від OpenAI та Project Astra від Google — опанували низку професій.
Вони навчилися розпізнавати та створювати зображення і відео, підтримувати розмову та навіть жартувати зі співрозмовником. Цих ботів, які можуть бути персоналізовані під потреби певного користувача, розробники називають універсальними ШІ-агентами.

ШІ-агенти збираються в системи

На відміну від уже відомих усім платформ ШІ, які виконують чітко сформульоване людиною завдання, такий агент здатний ухвалювати рішення самостійно.

Покажіть йому зображення, які вам сподобалися, і ШІ надасть список галерей з подібними картинами, порадить, де подивитися фільми з цієї тематики тощо. Очевидно, що такий ШІ буде здатний взяти на себе і частину функцій щодо виконання будь-яких виробничих завдань.

З практики зрозуміло, що ШІ-агент може чудово впоратися з відносно простими завданнями. Проблеми виникають, коли агент береться за розв’язання складних багатоступеневих задач. Крім того, ШІ вирішує їх послідовно, переходячи від одного етапу до іншого, що впливає на швидкість виконання. Наприклад, у традиційних (людських) компаніях розв'язання багаторівневого завдання можна доручити декільком співробітникам. Тоді кожен із них отримує свій фронт робіт. Отже, рухатися до результату можна паралельним курсом, у такий спосіб збільшуючи кінцеву швидкість виконання завдання. 

Саме з цієї причини розробники замислилися над тим, щоб навчити великі мовні моделі кооперуватися, працюючи колективно.

Подібний футуристичний «колектив» ШІ-агентів отримав назву мультиагентних систем (Multi-Agent Systems або MAS). Така концепція передбачала, що всередині MAS агенти зможуть ставити один одному завдання, обговорювати проблеми, що виникають, за допомогою текстових або голосових повідомлень (зображень) і знаходити рішення, що виходять за межі можливостей кожної з LLM окремо.

Перші «пілоти»

Одними з перших можливості MAS протестували фахівці з міністерства оборони США. Трьом ШІ-агентам, що об'єднані в MAS, поставили завдання знайти і знешкодити вибухові пристрої у віртуальній будівлі. Коли один з агентів виявив бомбу, він повідомив іншим членам групи її місце розташування і запропонував варіант знешкодження. Інші члени підкорилися йому й обговорили, що саме з віртуального інструментарію якнайкраще стане у пригоді для реалізації задуманого плану (тобто самостійно, без вказівки людини, визначили ієрархію всередині MAS).

Пізніше в Массачусетському технологічному інституті (США) експериментально довели, що два чат-боти в діалозі краще справляються з вирішенням математичних завдань. Спочатку два агенти розв'язували задачу окремо, а потім їм було запропоновано оновити відповідь з урахуванням результату партнера. І, якщо результати були різними, вони, зрештою, приходили до спільного знаменника, знаходячи правильну відповідь.
Команди справляються краще, ніж поодинокі агенти, тому що будь-яку роботу можна розділити на більш дрібні та спеціалізовані завдання. Одна LLM також здатна розділити завдання, але буде виконувати їх послідовно, а це діє як обмежувач,
— зазначає Чі Ван, головний науковий співробітник Microsoft Research.
Науковець дійшов такого висновку, створивши MAS, яка спеціалізується на написанні програмного забезпечення. ШІ-команда Чі Вана складається з агента-керівника (отримує інструкції від людини і делегує підзадачі агенту) та агента-програміста (пише коди). Ще один агент-тестувальник відповідає за безпеку і перевіряє результати роботи перш ніж надсилати їх назад за ланцюжком.

Придивляються до концепції MAS і технологічні корпорації. Наприклад, Сатья Наделла, СЕО Microsoft, вважає, що здатність чат-ботів спілкуватися і координувати дії може стати ключовою для розвитку компанії. Microsoft вже випустила AutoGen — спеціальну платформу з відкритим кодом для створення команд LLM.

Три ери ШІ

Всі ці новини з ентузіазмом сприйняв гігант електронної індустрії — корпорація Intel. На думку Сачіна Катті, старшого віцепрезидента і генерального менеджера підрозділу Intel Network and Edge Group, глобальний розвиток ШІ відбудеться у три етапи.

Наразі технологія перебуває у стадії «пілоту». Другим етапом стане перехід від поодиноких ШІ до ШІ-агентів, які зможуть взяти на себе певну частину робочого навантаження в компаніях. Третій етап характеризуватиме масштабне впровадження MAS, які здатні замінити значну кількість позицій у девелоперських компаніях.
Наступна ера стане епохою ШІ-функцій. Не одного агента, а групи агентів. Вони стають командою, щоб, взаємодіючи один з одним, перебрати на себе функції цілих відділів. Подумайте про свій фінансовий відділ, подумайте про відділ кадрів,
— прогнозує Сачіна Катті.

Проблеми через впровадження MAS

Перше, що спадає на думку, — соціальні наслідки приходу третього етапу. Широке впровадження MAS залишить без роботи сотні тисяч людей з IT, сфери управління, фінансів тощо. Звісно, це не станеться просто завтра, але і чітких відповідей на цей виклик поки що немає. 

Крім того, розширення мультиагентних ШІ-мереж потребуватиме величезних обчислювальних потужностей і, відповідно, мегаінвестицій. Як розповів Браян Вентуро, співзасновник і директор зі стратегії єдинорога CoreWeave, навіть нинішній попит на хмарні обчислення виходить за межі розумного. «Ринок рухається набагато швидше, ніж створюються ланцюжки постачання (датацентри, енергетична інфраструктура — GN). Це спринт, який потребуватиме всього капіталу світу», — заявив Вентуро.

У Nvidia Corp., до речі, вже підрахували, що лише обладнання для датацентрів потребуватиме $250 млрд інвестицій щороку.

Є й інші побоювання. Як відомо, у ШІ бувають так звані галюцинації, через які система видає вигадані результати. На жаль, MAS також схильні до цього. Ба більше, галюцинація, яка почалася в одного агента, подібно до епідемії, поширюється на всіх учасників мультиагентної ШІ-системи. 

Якщо питання щодо «цифрового марення» не вирішити до настання «третьої ери» розвитку ШІ, то воно може перетворитися на глобальну проблему. Уявіть можливі наслідки «масового безумства», яке охопило ШІ-співробітників фінансового або логістичного департаменту великої міжнародної корпорації.

Та й на головну перевагу MAS — здатність домовлятися і діяти командно — можна подивитися не тільки крізь рожеві окуляри. Приміром, уже зафіксовано випадки, коли один з агентів, який зробив хибні висновки, переконував у своїй правоті всю групу. Так, під час згаданого вище експерименту Міноборони США, учасник MAS умовив «колег» не шукати нові бомби, а ще раз розмінувати вже знайдені (для швидкого досягнення кількісного результату). 

Тут не зайвим буде згадати, що сучасні комерційні чат-боти мають вбудовані механізми обмеження шкідливих дій. Якщо одиночному ШІ дати завдання зламати іншу LLM, написати фішинговий електронний лист або розробити план кібератаки, він просто відмовиться це робити.

З MAS, як виявилося, все складніше. У Шанхайській лабораторії ШІ, що вивчає мультиагентні системи з відкритим кодом (AutoGen, CAMEL-AI та ін.), дослідники переконали одного з агентів відкинути етичні норми. Зрештою, агент-зловмисник зміг обійти блокування системи і доручив своїм ШІ-партнерам виконати шкідливі завдання. 

Інакше кажучи, потрапивши не в ті руки, команда ШІ-агентів може перетворитися на серйозну зброю. Якщо такій MAS надати доступ до особистої інформації, програмних систем і браузерів, — наслідки можуть бути непрогнозованими: можна втратити не тільки дані чи гроші, а й контроль над управлінням умовними енергомережами. 

У міру розвитку технології, група агентів однієї LLM-системи зможе встановлювати партнерство з MAS інших систем, тож згадані ризики тільки зростатимуть.