Hitech logo

Обучение машин

Скажи «дипфейк»: нейросеть научили имитировать любой голос

TODO:
Александр Носков28 февраля 2019 г., 09:25

Эра дипфейков настает не только для изображений: создан ИИ, который на заказ сделает голос моложе или «сменит пол» спикера. Работает нейросеть в реальном времени, и с каждой фразой все лучше.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Нейросеть, созданную стартапом из Массачусетса Modulate.ai, проверяли в работе журналисты MIT Tech Review. Обозреватель Уилл Найт прочитал стихотворение Уильяма Блейка «Тигр», а нейросеть превратила его голос в женский.

«Акцент, ударения, интонации — все это мое. Но почему-то звучу я, словно девушка с высоким голосом», — констатирует он.

На сайте Modulate можно послушать, как технологию рекламирует «Барак Обама», но там не ощущается одного из главных достижений: нейросеть преобразует звуковые волны в реальном времени.

Испытав работу алгоритма в звукоизолированной комнате, Найт констатирует, что каждый новый голос был несколько «щебечущим». Но чем больше он говорил — то есть давал информацию алгоритму на базе генеративной состязательной нейросети (GAN) — тем лучше был результат.

CEO компании Майк Паппас утверждает, что вовсе не ставит целью подделывать голоса знаменитостей — как это нередко происходит с видео. По его мнению, технология должна стать популярной прежде всего в многопользовательских компьютерных играх. Там «новый голос» станет частью имиджа игрока и добавит атмосферы. А детей или чувствительных девушек, вполне возможно, убережет от грубых нападок.

Профессор Чарльз Сэйф, который изучает распространение дезинформации, констатировал, что технология Modulate гораздо более реалистична, чем другие современные решения по изменению голоса.

По его мнению, ИИ вскоре фундаментально изменит саму суть информации: «Нам стоит задуматься о том, что есть реальность».

Паппас, напротив, уверен, что технические и юридические инструменты позволят удержать использование технологии в рамках. Например, Modulate обещает встраивать в генерируемые звуковые дорожки своеобразные «водяные знаки», которые укажут на их искусственный характер.

Огромный резонанс — в том числе из-за потенциала неправомерного использования — породил созданный в лаборатории OpenAI алгоритм для создания фейковых текстов на заказ. Он может генерировать новости или отзывы на любой товар, неотличимые от реальных.