«Голосовое управление — это троянский конь будущего»
Фото: EAST NEWS
Умные вещи

«Голосовое управление — это троянский конь будущего»

Все электронные устройства в будущем будут управляться голосом, а они сами станут управлять нашей жизнью. Корпорации, наконец, нашли достаточно удобный интерфейс, чтобы проникнуть в каждую комнату каждого дома.

Google и Amazon сражались между собой за право поместить виртуального помощника в ваш телевизор, автомобиль и спальню. Их противостояние дошло до апогея на прошлой неделе, когда количество продуктов с голосовым управлением выявило амбиции обеих компаний. Возможно, наличие голосового интерфейса в унитазе кажется кому-то доказательством абсурдности консьюмеризма, но в большей мере оно говорит о вездесущности новой технологии, пишет MIT Technology Review.

Новое явление связано с феноменом, который ведущий эксперт в области искусственного интеллекта Ли Кайфу назвал «OMO» — слияние онлайновых и офлайновых технологий.

Он описывает его как соединение цифрового и материального миров таким образом, что каждый объект становится точкой взаимодействия с интернетом — а также сенсором, собирающим данные о нашей жизни.

OMO ляжет в основу так называемой «третьей волны» ИИ: алгоритмы, наконец собрав полную картину данных о поведении людей, смогут довести уникальность предоставляемых услуг до максимума.

Однако этот вариант будущего требует, чтобы все устройства оказались подключенными. Даже те, что раньше обходились без мозгов. Ведь ваша продуктовая тележка должна знать, что у вас в холодильнике и кто придет к вам на ужин, чтобы порекомендовать оптимальный список покупок. А входная дверь должна быть в курсе, ждете ли вы разносчика пиццы или доставку из Amazon, чтобы открыть им.

Здесь и вступают в дело голосовые интерфейсы — внедрение Алексы или другого помощника в холодильник, зеркало или автомобиль связывает их в единую подключенную экосистему.

Схема очень простая и элегантная — продавая удобный способ управления приборами посредством голоса, Google и Amazon медленно проникают в наши дома и занимают положение центральной платформы, агрегирующей все данные.

При этом эффективность общения с помощниками зависит от того, насколько он хорошо вас понимает. А значит впрямую связана собираемыми данными. На этом фоне для многих вопросы приватности отходят на второй план. А на первый выходит развитие технологий распознавания и генерации естественного языка, которые отстают в сравнении с другими популярными приложениями ИИ.

Однако все может измениться. В прошлом году несколько исследовательских групп применили методы машинного обучения и совершили прорыв в распознавании речи. В июне OpenAI разработала технологию обучения на основе неструктурированного текста, которая серьезно снижает затраты на подготовку ИИ. Через несколько месяцев после Google выпустила еще более совершенный алгоритм: он может закончить за вас начатую фразу не хуже, чем это сделал бы человек. Другой алгоритм Google AI отлично справляется с диаризацией звукового потока — то есть может с точностью до 92% узнать голос говорящего в толпе.