AI поможет переводчикам расшифровать древние тексты
ИИ совершенствуется с каждым днём. Вот и в отрасли переводоведения нейросети показывают себя всё лучше и лучше.
Древние тексты теперь тоже находятся в базе знаний железного разума. ИИ-переводчик способен расшифровывать старинные рукописи в мгновение ока.
К примеру, речь идет о древнем аккадском. Это один из древнейших семитских языков, который, к сожалению, в настоящее время является мертвым. Его наследие не сохранилось ни в одном из дочерних языков.
Впрочем, человечество обладает существенными знаниями о древнем аккадском. У лингвистов мира имеется множество документальных свидетельств применения этого языка. К тому же, благодаря технологиям собранные тексты доступны общественности.
Чтобы не тратить время на рутинный перевод, многопрофильным коллективом археологов и программистов был разработан инструмент на основе искусственного интеллекта. Благодаря новаторской технологии перевод производится в кратчайшие сроки. Таким образом, ученые теперь могут получать доступ к историческим сведениям, хранящимся в скрижалях 5000-летней давности, в мгновение ока.
В базе знаний ИИ содержится выборка клинописных текстов из корпуса Oracc (Open Richly Annotated Cuneiform Corpus). Команда обучала модель переводу, применяя две методики. Сперва искусственный интеллект учился переводить аккадский язык на основе прямой транслитерации оригинальных текстов и клинописных символов. После при помощи другого инструмента, что трансформирует изображения скрижалей в Юникод, ИИ-модель смогла научиться переводить клинопись в кодировку UTF.
Вторая методика была несколько сложнее. Модель предстояло настроить таким образом, чтобы она научилась разграничивать, скажем, художественные произведения и административную корреспонденцию. К тому же, за тысячелетия использования аккадийцами клинопись претерпела ряд изменений, что также не могло не отразиться на алгоритмах обучения ИИ-модели. Для её тестирования был использован алгоритм bilingual evaluation understudy 4 (BLEU4). Таким образом, создатели оценивали точность машинного перевода, сгенерированного их детищем.
Результаты показали, что модель способна воспроизводить жанровые особенности многих текстов корпуса, что ставит машину в один ряд с высококвалифицированными переводчиками.
"Практически в каждом случае, независимо от того, является ли [перевод] адекватным или нет, жанр был идентифицирован безошибочно", — сообщают исследователи, отмечая, что в перспективе [модель] могла бы предоставлять пользователю список источников, на основании которых и был сгенерирован перевод, что было бы особенно полезно для исследовательских нужд.
Результаты эксперимента были опубликованы в рецензируемом журнале PNAS Nexus.
О том, как искусственный интеллект из Индии помогает малоимущим, мы в GNcrypto рассказывали в отдельной статье.