Decrypt и AI взламывают коды зашифрованных текстов прошлого

icon SCRT
icon FOR
Фото - Decrypt и AI взламывают коды зашифрованных текстов прошлого
Decrypt — проект, который занялся расшифровкой самых таинственных исторических рукописей с помощью AI. Поле для деятельности энтузиастов огромно — в библиотеках и архивах десятилетиями и столетиями пылятся отчеты шпионов, переписка дипломатов и документы тайных обществ.
В конце XVI века королева Шотландии Мария (широко известная как Мария Стюарт) отправила десятки зашифрованных посланий с просьбой о помощи. Шотландка была заключена под арест двоюродной сестрой — королевой Англии Елизаветой I. Марию обвинили в заговоре и попытке захвата власти.
 
Считалось, что письма содержали не только мольбы о помощи и жалобы на условия заключения, но и планы государственного переворота за счет нового союза Англии и Франции. Но в том-то и дело, что до недавнего времени это были лишь предположения. Пока «на сцене» не появились исследователи проекта Decrypt, заявившие, что шифр успешно взломан. 

Первым успехом Decrypt Project была расшифровка кодекса Copiale в 2011 году. Рукопись была написана в 1700-х годах немецкими оккультистами. Среди обрядов посвящения в тайное общество было, например, прочтение шифрованных записей, нанесенных водяными знаками (т. е. требовалось еще и умение «проявлять» такие знаки на бумаге).

Долгое время ученые не могли понять, на каком языке написан текст — немецком или на латыни. И только поняв, что запись сделана на немецком языке, им удалось продвинуться. Латинскими символами, как оказалось, просто обозначали интервалы между словами и знаки препинания.

Успех Decrypt обеспечили компьютерные алгоритмы, разработанные для обнаружения закономерностей и машинного анализа изображений, а также интуиция исследователей. Эта комбинация представляет собой мощный инструмент для расшифровки трехсотлетнего шифра и перевода его в современную форму языка.

Средневековая Европа была бурлящим котлом заговоров, тайных союзов и, конечно, целых собраний шифрованных документов. Но кодексы (т. е. шифры) появились гораздо раньше и существуют до сих пор. И дешифровщики ожидают, что использование искусственного интеллекта решит проблему их прочтения.

В долгосрочной перспективе Decrypt хочет создать аналог простого в использовании инструмента, подобного Google Translate. С его помощью отсканированные документы, независимо от происхождения и используемого варианта шифра, можно будет переводить на современный английский язык.
Для исторических текстов у нас не так много единообразных данных, потому что люди писали по-разному, используя разные системы письма и разный почерк. Мы разработали модели AI для расшифровки этих систем, и это может сделать работу более эффективной
, — поясняет Беата Мегиеси, руководитель проекта Decrypt и профессор компьютерной лингвистики в Упсальском университете Швеции.
Впрочем, никакие сложности не помешали группе математиков, в которую входили и исследователи Decrypt, взломать код знаменитого и загадочного серийного убийцы Зодиака. В письмах, которые преступник отправлял в полицию в конце 60-х годов прошлого столетия, использовалась сложнейшая методология замены. 
Копии зашифрованных писем Зодиака. Источник: Eric Risberg/AP Photo

Копии зашифрованных писем Зодиака. Источник: Eric Risberg/AP Photo

Каждой букве соответствовали несколько символов одновременно, и убийца произвольно менял их при написании. Ученым удалось разработать отдельную программу, которая в интеграции с AI «заметила», что в одном из писем шифр повторяется циклически и в регулярном порядке. Почему Зодиак допустил эту «детскую» ошибку — неизвестно. Но, как рассказывает Кевин Найт, профессор компьютерных наук в Университете Южной Калифорнии, именно она позволила взломать код убийцы. В 2020 году группа прочитала первое расшифрованное послание Зодиака, подтвержденное ФБР: «Надеюсь, вы веселитесь, пытаясь меня поймать». Кто именно был Зодиаком — ни полиции, ни ФБР так и не удалось установить. К 2020 году, предположительно, Зодиак уже был мертв, но расшифровка его посланий продолжается до сих пор.

Профессор Найт отметил, что эволюция методов взлома кода дает историкам возможность раскрыть давно хранимые секреты. 
Историческое значение велико. С древних времен продолжается настоящая гонка вооружений между создателями кодов и взломщиками
, — говорит он.
А теперь вернемся к началу рассказа и письмам королевы Марии Стюарт. Десятки ученых пытались взломать код, но шифрование было очень сложным. Сообщники использовали сложнейший омофонический шифр, в котором буквы заменяются на символы. Для его взлома Decrypt потребовалась новая отдельная компьютерная программа с привлечением AI, и теперь переписка королевы доступна для прочтения. Наверное, этот кодекс стал рекордсменом — ведь на его расшифровку потребовалось 436 лет!