AI допоможе перекладачам розшифрувати стародавні тексти
ШІ щодня вдосконалюється. Ось і в галузі перекладознавства нейромережі показують себе все краще і краще.
Давні тексти тепер також перебувають у базі знань залізного розуму. ШІ-перекладач здатний миттєво розшифровувати старовинні рукописи.
Наприклад, ідеться про стародавню аккадську. Це одна з найдавніших семітських мов, яка, на жаль, нині є мертвою. Її спадщина не збереглася в жодній з дочірніх мов.
Втім, людство має суттєві знання про стародавню аккадську. У лінгвістів світу є безліч документальних свідчень застосування цієї мови. До того ж, завдяки технологіям ці тексти доступні для громадськості.
Щоб не витрачати час на рутинний переклад, багатопрофільний колектив, до якого увійшли археологи та програмісти, розробив інструмент на основі штучного інтелекту. Завдяки новаторській технології переклад відбувається у найкоротші терміни. Таким чином, вчені тепер можуть миттєво отримувати доступ до історичних відомостей, що зберігаються у скрижалях 5000-річної давнини.
У базі знань ШІ міститься вибірка клинописних текстів із корпусу Oracc (Open Richly Annotated Cuneiform Corpus). Команда навчала модель перекладів, використовуючи дві методики. Спершу штучний інтелект навчався перекладати аккадську мову на основі прямої транслітерації оригінальних текстів та клинописних символів. Згодом за допомогою іншого інструменту, що трансформує зображення скрижалів у Юнікод, ШІ-модель змогла навчитися перекладати клинопис у кодування UTF.
Друга методика була дещо складнішою. Модель мала бути налаштована так, щоб вона навчилася розмежовувати, скажімо, художні твори та адміністративну кореспонденцію. До того ж, за тисячоліття використання аккадійцями клинопис зазнав певних змін, що також позначилося на алгоритмах навчання ШІ-моделі. Для її тестування було використано алгоритм bilingual evaluation understudy 4 (BLEU4). У такий спосіб творці оцінювали точність машинного перекладу, згенерованого їх дітищем.
"Практично в кожному випадку, незалежно від того, чи є [переклад] адекватним, жанр був ідентифікований безпомилково", — повідомляють дослідники, додаючи: "У перспективі [модель] могла б надавати користувачеві список джерел, на підставі яких і був згенерований переклад, що особливо корисно для дослідницьких потреб".
Результати експерименту були опубліковані в рецензованому журналі PNAS Nexus.
Про те, як штучний інтелект з Індії допомагає незаможним, ми в GNcrypto розповідали в окремій статті.