Hitech logo

искусственный интеллект

Как работают китайские фабрики данных, где тренируют ИИ

TODO:
Андрей Смирнов26 ноября 2018 г., 11:09

Китай пытается обогнать запад в ИИ-гонке. И для этого у него есть только один ресурс — масса дешевой рабочей силы. Бывшие промышленные рабочие переквалифицируются в тренеров алгоритмов, а фабрики данных одна за другой открываются в китайской глубинке.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

На самом деле системы искусственного интеллекта сами по себе не способны отличить, например, кошку от светофора. Передовая технология основана на труде сотен тысяч тренеров ИИ. Они вручную размечают изображения, чтобы затем крупные корпорации использовали эти обработанные данные для создания ИИ-систем управления робомобилями или алгоритмами распознавания лиц, отмечает в своем репортаже New York Times.

Мировая фабрика данных

Китай по-прежнему остается фабрикой по производству товаров массового спроса. Только сегодня это уже далеко не только кроссовки или телевизоры.

Китай в индустрии искусственного интеллекта занимает самую нижнюю нишу: он поставляет огромные массивы данных, а также проводит их первичную обработку.

Зарплаты в промышленности КНР расти перестали, поскольку в производстве ширпотреба велика конкуренция со стороны других стран Юго-Восточной Азии. Китайские рабочие покидают конвейеры и устраиваются разметчиками изображений на фабрики данных, число которых стремительно увеличивается.

Машинное обучение на бывшем цементном заводе

Посреди двора ранее заброшенного цементного завода в небольшом городе в провинции Хэбэй до сих пор стоит промышленная бетономешалка. Однако в наскоро отремонтированном цеху вместо станков теперь парты, за которыми сидят несколько десятков молодых людей и помечают картинки: вот дорожный знак ограничения скорости, вот идущий человек…

Фабрикой управляет Хоу Сямэн. В свои 24 года она успела поработать разметчиком изображений в пекинском стартапе Megvii. Эта компания, разрабатывающая системы распознавания лиц, сегодня оценивается в $2 млрд, а ее главный продукт — ИТ-платформа Face++, известном по всему миру. Умные камеры в китайских городах до сих пор сначала узнают Хоу, когда она идет по улице с друзьями — ее лицо одним из первых было внесено в размеченную вручную базу данных, которым пользуется ИИ Face++.

Хоу не боится слежки. «Камеры на улицах дают мне чувство безопасности», — говорит она. И заверяет: «Мы пока еще контролируем машины».

В действительности люди не просто контролируют ИИ. Без труда сотрудников компании Хоу, которую она основала на исторической родине, уехав из Пекина, и сотен таких же фабрик данных по всей стране, никакие алгоритмы работать не могут.

«Раньше я думал, что ИИ-алгоритмы гениальны, — говорит Хоу. — Теперь я знаю, что мы, люди, обеспечиваем их интеллектом».

Китайские стартапы обеспечили треть мирового рынка систем компьютерного зрения в 2017 году, обогнав по этому показателю США. Правительство Китая заявило, что к 2030 году страна станет мировым лидером в области искусственного интеллекта. Однако эксперты не уверены в том, что ручной труд на таких ИИ-фабриках, как в провинции Хэбэй сможет обеспечить Китаю технологическое превосходство в сфере ИИ.

Люди, которые работают на фабриках данных в Китае, как правило, вообще не разбираются в машинном обучении, выполняют низкооплачиваемую монотонную работу, которая ничем не отличается от работы у конвейера. Плодами же первично обработанного информационного сырья, которое они производят, пользуются крупные корпорации — прежде всего, американские.

Фундамент ИИ-индустрии — ручной труд людей

С этим согласен, например, И Якэ, соучредитель фабрики маркировки данных в провинции Хэнань. «Мы как строители в цифровом мире. Наша задача — закладывать один кирпич за другим, а большие корпорации на этой основе уже построят ИИ-небоскребы», — говорит он.

Компания И Якэ Ruijin (в переводе название означает «умное золото») помогает тренировать ИИ совсем за небольшие деньги.

Например, контракт на маркировку 20 000 изображений стоил всего пару тысяч долларов. Рабочие в Ruijin получают $400-500 в месяц.

Для китайской провинции это очень неплохо. Однако не идет ни в какое сравнение с зарплатами и прибылями в западных ИТ-компаниях, разрабатывающих ИИ.

Китай по-прежнему остается мировой фабрикой за счет дешевого низкоквалифицированного труда. Только теперь все больше китайцев покидают промышленные предприятия ради работы на фабриках данных. Эта ситуация не изменится, пока в разработке ИИ не будет совершен прорыв, и алгоритмы не смогут обучаться самостоятельно.

«Пока же весь искусственный интеллект построен на человеческом труде. Машины недостаточно умны, чтобы обучаться самостоятельно», — говорит управляющий пекинской ИИ-компаний AInnovation Лян Жуй.

Обучение ИИ становится очень популярной работой и в странах менее развитых, чем Китай. Например, 5000 беженцев в Уганде участвуют в пилотном проекте маркировки данных для обучения алгоритмов. Они зарабатывают $3-4 в день, что в несколько раз больше среднедневного заработка беженца в этой африканской стране.