Hitech logo

Искусственный интеллект

Алгоритм установил, кто писал вместо Шекспира

TODO:
Александр Носков25 ноября 2019 г., 11:30

Сторонники теорий заговора о том, что Уильям Шекспир писал не сам или, по крайней мере, не всегда сам, получили новый метод исследования его пьес — машинное обучение и сравнение словарных паттернов. Подход уже принес первые плоды.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Сторонники теорий заговора (так называемый Шекспировский вопрос) подозревают, что приписываемые великому британскому драматургу произведения писал кто-то другой, например, коллектив авторов во главе с философом Фрэнсисом Бэконом. О первых результатах исследования пьесы «Генрих VIII» с помощью машинного обучения рассказывает MIT Tech Revew.

«Генрих» — поздняя пьеса, официально написанная Шекспиром в соавторстве с Джоном Флетчером. Шекспир умер в 1616 году, Флетчер, в архиве которого она хранилась, — в 1625. И лишь десятилетие спустя драма была впервые опубликована, причем имя Флетчера шло на первом месте в списке авторов.

Среди исследователей творчества Шекспира шли долгие споры о том, насколько велик был вклад Флетчера в текст и сюжет.

Несомненно было, что он существенен — но только алгоритму машинного обучения удалось разобраться буквально с точностью до строчки в том, когда Уильям передавал перо Джону и наоборот.

Как отмечает MIT, для Флетчера были характерны определенные особенности письменной речи, которых избегал Шекспир: например, Флетчер часто употребляет «ye» вместо «you» и «’em» вместо «them». Он любит компенсировать недостающий строке слог с помощью слов «sir», «still» или «next». Литературовед Георг Брандес указывал также на необычные для Шекспира характеры и слабый сюжет драмы.

Разобраться, сколько в этой пьесе Шекспира, с помощью современных методов решил исследователь из Чехии Петр Плешак. Анализ текста и выявление его особенностей — одна из привычных задач для машинного обучения. В этом случае лишь область приложения усилий была очень необычной. Плешак скормил модели поздние пьесы Шекспира, а также произведения Флетчера. А затем строка за строкой проанализировал текст «Генриха VIII».

В интервью MIT он указывает, что анализ в целом оказался близок к разбиению, которое в классической работе 1850 года предложил литературовед Джеймс Спеддинг. Флетчер, подтверждает Плешак, написал сцены, составляющие почти половину пьесы. Однако был и ряд сюрпризов.

Алгоритм показал, что авторство иногда менялось прямо во время развития действия, а не только между сценами. Например во второй сцене третьего акта модель предложила смешанное авторство после строки 2081.

Помимо этого, Плешак проверил и еще одну версию об авторстве этой пьесы — иногда его приписывали также драматургу Филиппу Мессинджеру. «Маловероятно», чтобы он был вовлечен в работу над «Генрихом», счел алгоритм анализа.

В публикации не сказано, планирует ли чешский ученый исследовать аналогичным образом другие тексты Шекспира в поисках следов других авторов.

MIT считает, что следующим логичным шагом для подобных алгоритмов было бы преобразование текста в стилистику Шекспира или хотя бы Флетчера. Однако сделать это значительно сложнее, чем обработать фото в стиле известного художника.

Впрочем, в OpenAI уже научили ИИ писать подчас неотличимые от настоящих фейковые новости. Так что, возможно, проблему решит накопление и обработка большего массива данных.