24 Май 2018
  • :
  • :

Не иврит, не священнику, не хозяину, не людям

На прошлой неделе ряд российских СМИ, в частности, РИА Новости рассказали о сенсации, произошедшей в деле расшифровки загадочного манускрипта Войнича. Канадские специалисты по искусственному интеллекту заявили, что им удалось определить язык, на котором в зашифрованном виде написана загадочная рукопись, –​ иврит –​ и расшифровать его первое предложение: “Она дала рекомендации священнику, хозяину дома, и мне, и людям”. На самом деле, произошло это еще два года назад, гипотеза канадских исследователей давно признана несостоятельной, а с тех пор уже появился новый претендент на расшифровку рукописи –​ и ему вновь никто не верит.

Статья Гжегожа Кондрака и Брэдли Хауэра из университета Альберты вышла в журнале Transactions of the Association for Computational Linguistics в 2016 году: авторы описывали компьютерную систему, предназначенную для автоматического определения языка текста, зашифрованного с помощью подстановки букв. Система, которую лишь с большой натяжкой можно назвать искусственным интеллектом, на самом деле основана на статистических методах – например, оценке частотности повторения в тексте тех или иных букв, которая сравнивается с характерными для разных языков. Авторы описали сразу же три метода, которые в совокупности давали хороший результат на тестовой выборке – переведенной на 380 языков Декларации прав человека. В 97 процентах случаев алгоритм верно угадывал язык, на котором написана данная версия документа, а в 93 процентах – успешно справлялся с подстановочным шифром (когда одни буквы однозначным образом заменяются на другие). Более того, алгоритм Кондрака и Хауэра умеет справляться с текстом, в котором не только произведена подстановка, но и опущены гласные, а некоторые буквы в словах произвольно переставлены.

Подписывайтесь на нас в telegram

Канадские ученые применили свою программу к тексту рукописи Войнича, и система показала, что он написан, вероятнее всего, на иврите. Первая фраза манускрипта, которая в одной из традиционных записей выглядит как VAS92 9FAE AR APAM ZOE ZOR9 QOR92 9 FOR ZOE89 (для удобства расшифровки манускрипта, символам языка, на котором он написан, сопоставляют буквы латинского алфавита и цифры), по версии алгоритма может быть переведена на иврит как המצות ועשה לה הכהן איש אליו לביתו ו עלי אנשיו. Впрочем, этот набор символов не является осмысленной фразой, что отметили в статье и сами авторы. Недолго думая, они ввели его в Google.Translate – систему автоматического перевода, действительно основанную на искусственном интеллекте и поэтому способную исправлять в тексте неточности и описки, и получили тот самый результат: She made recommendations to the priest, man of the house and me and people. Кстати, переводчик Google.Translate постоянно самообучается, и поэтому сегодня переводит этот же набор букв иврита иначе. Предлагаются два варианта: And the priest made a man for him to his house, and to his men, – не совсем корректная для английского языка фраза, которую дословно можно перевести как “И священник сделал человека для него к его дому, и для его людей” или Unleavened bread and made her the priest, and one which leaves his home, то есть “Пресный хлеб и сделал ее священником, и тем, кто покидает его дом”.

Анализ пергамента, чернил и особенностей некоторых иллюстраций позволяет предположить, что рукопись написана в 15–16-м веке

Манускрипт Войнича – рукопись, состоящая из двух сотен страниц текста и иллюстраций на тонком пергаменте. Написан он на неизвестном языке с помощью примерно 20 символов, не относящихся ни к одному из известных языков. Анализ пергамента, чернил и особенностей некоторых иллюстраций позволяет предположить, что рукопись написана в 15–16-м веке. Предполагается, что в 17-м веке книга принадлежала императору Священной Римской империи Рудольфу II, затем (и это известно наверняка) пражскому алхимику Йиржи Барешу, после ректору Пражского университета Иоганну Марци. От Марци манускрипт попал к монаху ордена иезуитов Афанасию Кирхеру, а из его собрания почти два века спустя, в 1912 году, к польско-литовскому антиквару Вилфриду Войничу, от имени которого и получил свое нынешнее название. Сегодня рукопись Войнича хранится в библиотеке редких книг Бейнеке Йельского университета.

Активные и безуспешные попытки расшифровать манускрипт предпринимались как минимум с 17-го века – один из предполагаемых владельцев книги Кирхер был известен как человек, сумевший прочитать египетские иероглифы (как выяснилось позже – неправильно). В 20-м веке за перевод этого таинственного текста брались лучшие криптографы, например, американец Уильям Фридман, взломавший код японской шифровальной машины PURPLE во время Второй мировой, но и ему рукопись не поддалась.

Не раз высказывалось предположение, что текст манускрипта –абракадабра, произвольный набор символов, не имеющий смысла

Существуют самые разнообразные гипотезы и об авторстве манускрипта – от Роджера Бэкона до самого Войнича, и о языке, на котором она написана перед шифровкой – от полностью искусственного, выдуманного языка до одного из диалектов китайского до даже украинского, и о шифре. Не раз высказывалось предположение, что текст манускрипта – абракадабра, произвольный набор символов, не имеющий смысла, но это, скорее всего, не так. Лингвистический анализ конца 1970-х и середины 2010-х показал, что рукопись имеет внутреннюю структуру и смысл и подчиняется определенным лингвистическим законам, характерным для естественного языка, например, закону Ципфа, характеризующему распределение частоты использования слов.

Словом, манускрипт, скорее всего, действительно текст, написанный в 15–16 веке на одном из естественных языков и позже зашифрованный неизвестным шифром. Заявления о его прочтении или как минимум “разгадке тайны манускрипта” появляются с завидной регулярностью – раз в несколько лет. Последнее на сегодняшний день сделали на самом деле даже не канадские программисты, а историк-любитель и телевизионный сценарист Николас Гиббс, который опубликовал свои выводы в литературном журнале The times Literary supplement осенью 2017 года. Гиббс заявил, что оригинальный язык рукописи – латынь, а речь в ней идет о различных аспектах женского здоровья. Позже рассуждения Гиббса подверглись критике и со стороны историков и лингвистов, а его выводы были признаны бездоказательными.

Итак, манускрипт Войнича до сих пор не расшифрован и ждет человека, который раскроет его тайну – может быть, читателя этих строк. Еще одна загадка, которая вряд ли когда-либо будет разгадана: почему канадское новостное агентство The Canadian press распространило заметку об успехах в работе над рукописью ученых из Альберты только через два года после публикации их работы и почему на это без проверки фактов отреагировало так много изданий во всем мире, настолько живо, что соответствующие записи даже попали в русскоязычную и англоязычную версии статьи Википедии о манускрипте Войнича.