Hitech logo
TODO:
9 июня 2021 г., 14:17

Data Fusion и персональные данные: как в России используют большие данные

За последний год использование концепции Data Fusion стало одним из самых обсуждаемых вопросов в области машинного обучения. Уже сегодня она помогает достигать высоких результатов, дает импульс к разработке новых продуктов и вызывает интерес крупнейших российских и международных корпораций. Однако объединение данных предполагает масштабный сбор информации о пользователях, что приводит к законодательным ограничениям. Как компании используют технологии Data Fusion в России с учетом принятых норм регулирования в области больших данных Хайтек+ рассказала Мария Замолоцких, юрист «Европейской Юридической Службы», резидент «Фонда Сколково».

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Концепция Data Fusion в последние годы стала неотъемлемой частью деятельности многих компаний. Благодаря сквозному объединению данных, организации расширяют свои возможности и на основе более точной аналитики предлагают клиентам персонифицированные предложения, совершенствование продуктов или оптимизацию внутренних процессов.

При этом, ввиду стремительного развития рынка цифровых технологий, возникает необходимость строгого законодательного контроля за соблюдением прав и законных интересов пользователей рунета.

Так, федеральный проект «Нормативное регулирование цифровой среды» предполагает упрощение работы с согласием на обработку данных, введение понятия «обезличенных данных», возможность сбора и обработки общедоступных данных и обезличенных данных, относящихся к тайне (медицинские, геолокационные). Этот тренд прослеживается даже в странах Европейского Союза, который традиционно ставил в приоритет защиту граждан.  В России же обращение с персональными данными регулируется ФЗ «О  персональных данных».

Проблема работы с большими данными тесно связана с вопросами конфиденциальности и законодательными ограничениями, которые не позволяют агрегаторам распространять фактические данные о клиентах. Передовая технология,  которая дает возможность получать необходимые знания, при этом не нарушая конфиденциальности — аналитика на основе обезличенной геометрии графа и его раскраске. Она обогащает первичную информацию о взаимосвязях контрагентов без нарушения законодательства о персональных данных. Подобная технология легла в основу нового продукта банка ВТБ — Geo-embeddings. Это своего рода «полуфабрикаты» данных, которые содержат релевантную обезличенную информацию для решения конкретной задачи в выразительной векторной форме.

Пример конкретной бизнес-задачи, решенной с помощью эмбеддинга — открытие новых торговых точек. Бизнес располагает внутренними данными о трафике и среднем чеке. Они обогащаются обезличенными геоданными и на основе алгоритмов система дает прогноз, в каком месте будет наибольшее количество потенциальных платежеспособных клиентов.

«Данные часто называют новой нефтью — как и недра, работа с данными тоже может приносить пользу всему населению страны», — рассказывает Антон Пронин, директор по корпоративным инновациям «Фонда Сколково». Однако консервативная политика затормаживает экономический рост и тот положительный эффект для населения, который может дать работа с большими данными в отсутствие жестких законодательных ограничений.

Так, на сегодняшний день законодательство в области больших данных только ужесточается и последняя редакция профильного закона отменила многие ранее разрешенные способы работы.

Компаниям приходится обосновывать для какой конкретной цели ведется сбор данных, а также внимательно подходить к их обработке и анализировать сопоставим ли сбор и обработка персональной информации с целями. Помимо этого, при рассмотрении вопроса об обработке персональных данных гражданина важную роль имеет и его письменное согласие. В связи с этим организациям надо детально прорабатывать схемы при использовании персональных данных и получение согласия на обработку. Если обработка происходит без согласия, то за это предусмотрен штраф от 30 до 150 тысяч рублей.

На сегодняшний день у бизнеса нет четкого понимания и единой стратегии действий в условиях растущего объема ограничений, а переход в цифровую экономику очевидно затормаживается. Одной из немногих возможностей остается механизм экспериментальных правовых режимов, который может помочь продемонстрировать безопасность использования данных для населения.

Точка зрения автора колонки может не совпадать с мнением редакции.