Вестник цифровой трансформации

Big Data в МТС: в поисках Клондайка
Big Data в МТС: в поисках Клондайка

«Мы получили полную операционную свободу, чего никогда не было раньше. Но вместе со свободой появилась и ответственность»


17:17 14.02.2019 (обновлено: 09:52 04.09.2019)  |  Николай Смирнов | 14249 просмотров



Ситуация на рынке сотовой связи далеко не безоблачная: некоторые направления перестали расти, некоторые — стагнируют, и классический телеком расти уже не будет. Компаниям приходится инвестировать в большие данные, пытаясь искать свои ниши в финтехе, цифровой рекламе и создании контента. Леонид Ткаченко, директор по Big Data МТС и претендент на премию CDO Award, — о том, куда идет и за что борется телеком, о развитии департамента Big Data и поиске «золотой жилы».

Раньше телеком-операторы были теми немногими компаниями, где бизнес строился на данных. В последние годы, когда предприниматели массово осознали ценность Big Data, телеком делает на это направление стратегическую ставку, инвестиции операторов в работу с данными растут.

Проекту Big Data в МТС недавно исполнилось три года. Команда выросла с двух десятков сотрудников до 250 экспертов. Чистый экономический эффект от работы с большими данными в компании оценивают в 3,5 млрд руб. О пути своего подразделения и достигнутых результатах рассказывает Леонид Ткаченко, директор по Big Data МТС и претендент на премию CDO Award. Его выступление станет одним из гвоздей программы форума BIG DATA, который состоится 27 марта.

Термин Big Data появился уже довольно давно. Что изменилось в последние годы? И связаны ли произошедшие изменения с шумихой, начавшейся вокруг больших данных?

Математическая основа того, что сейчас делается, была известна с середины XX века. Но компьютеры того времени стоили миллионы долларов, и даже простую нейросеть пришлось бы обсчитывать месяцами. Лишь недавно вычислительная мощь компьютеров выросла настолько, что математику нейросетей и алгоритмы машинного обучения можно экономически эффективно использовать.

 Леонид Ткаченко
Леонид Ткаченко: «Работа с большими данными — это как поиск в незнакомой темной комнате. И наша задача — искать максимально быстро»

Big Data — свежий маркетинговый бренд, раскрученный производителями оборудования. Под этим брендом вендоры стали продавать возможность скоростной обработки и дешевого хранения огромных массивов данных. Некоторое время у них ушло на то, чтобы представить миру эти технологии, и теперь не использовать их уже невозможно — сразу станешь аутсайдером. Это группа технологий, которая действительно несет ценность бизнесу.

Сейчас продукты на основе больших данных внедрены во все функциональные направления МТС. Маркетинг и продажи, розничная сеть, техника, закупки, финансы и даже HR.

HR — не самая очевидная область для применения технологий больших данных...

Что касается HR, то, например, мы предсказываем отток сотрудников: руководители видят, какова вероятность увольнения конкретного сотрудника в ближайшие два месяца. Я пока не слышал про аналогичные проекты, хотя знаю, что подобные работы кое-где ведутся. У нас сначала получилась модель, которая надежно предсказывала увольнение за пару недель. Но столь короткого периода мало, чтобы принять решение о том, нужно ли бороться за сотрудника. Нам удалось найти более тонкие ранние предикторы. У нас была отличная обучающая выборка — огромная накопленная история уволившихся сотрудников.

Удержать сотрудника — важно для любого руководителя, особенно работающего с дефицитными и высокооплачиваемыми специалистами. Наши менеджеры активно пользуются этим инструментом: если вероятность увольнения ценного сотрудника начинает расти, возникает повод поговорить с ним, да и самому подумать о том, что идет не так.

 

 

27 марта — форум BIG DATA 2019

Центральное событие года для общения с экспертами индустрии больших данных и интеллектуальной аналитики!

 

Другие модели позволяют среди десятков тысяч сотрудников МТС выявить самых перспективных: талантливых, пусть пока и незаметных. В крупной организации не все работники на виду, можно упустить людей с выдающимися способностями. А что, если они не просто уволятся, а уйдут к конкурентам и там раскроют свой потенциал? Big Data позволяет избегать таких рисков. Эти модели в области HR не приносят, казалось бы, прямого, поддающегося подсчету экономического эффекта, но в нашем бизнесе, находящемся на острие технологического прогресса, основной актив — это лучшие профессионалы.

Три года назад в МТС появился департамент Big Data. Что это значило для компании?

В тот момент компания решила инвестировать в это направление и поискать дополнительную ценность в данных. Что очень важно, изначально это подразделение организовали иначе, чем все остальные в компании. Обозначили финансовую цель, бюджет — и позволили самим выбирать, как инвестировать средства, в каких направлениях работать. Мы получили полную операционную свободу, чего никогда не было раньше. Но вместе со свободой появилась и ответственность.

Такой формат работы очень хорошо себя показал. Сейчас, по прошествии трех лет, он считается хорошим примером мотивации и организации работ, и на него многие ориентируются. Наработанный опыт мы стараемся распространить на другие продуктовые направления — в частности, на работу с мобильными приложениями.

А что назначение главой департамента Big Data значило для вас как для человека, прежде занимавшегося стратегическим маркетингом? Какие изменения произошли в ваших подходах к работе?

Изменения очень серьезные. Это уже не первый раз, когда мне пришлось заниматься чем-то принципиально для себя новым, в чем раньше немногое понимал. Большие данные находятся на стыке ИТ, математической статистики и бизнеса. За эти три года я, безусловно, подтянул свои знания в ИТ.

Сейчас мне приходится управлять значительно большей командой. Раньше мой коллектив состоял из 30 человек, а теперь в нем 250. В небольшой команде ты каждого хорошо знаешь, можешь лично с каждым пообщаться и хорошо видишь их работу. Когда подчиненных несколько сотен, характер управления сильно меняется: ты не управляешь непосредственно людьми (тем более на микроуровне), а создаешь условия для их работы.

Как вы понимаете роль CDO в современной, «умной» компании? Одни подразумевают скорее техническую, а другие — более бизнес-ориентированную роль…

Я однозначно «заточен» на бизнес. Внутри нашего подразделения есть четыре отдела: два продуктовых и два инфраструктурных. Один из инфраструктурных отвечает за ИТ-платформу, а другой — за инфраструктурные продукты. Руководитель последнего и есть в моем понимании «чистый» директор по данным. Наращивание объема знаний о наших абонентах — это то, с чем он засыпает и просыпается.

Какая стратегия работы с большими данными принята у вас?

Стратегия уже три года неизменна, в ней три ключевых элемента. Первый — постоянное увеличение знаний об абонентах. Любые данные, способствующие этому, сразу же оказываются в нашем data lake. Неважно, знаем мы, как потом будем их использовать, или нет, есть ли у нас какие-то бизнес-идеи или их еще предстоит придумать.

Вторая задача — обеспечение доступа к этим данным для сотрудников компании, разумеется в соответствии с их обязанностями. На рабочий стол каждого специалиста надо положить максимальное количество нужных ему данных. В очень многих наших подразделениях бизнес-анализ является частью работы. Сотрудники действительно принимают решения на основе данных.

Третья составляющая стратегии — построить на базе собранных данных новый бизнес. Продукты, создаваемые сейчас, новым бизнесом не являются — мы просто помогаем работать нашим подразделениям. Новым бизнесом мог бы быть, например, сервис по подбору пар — идеальных семей на основе глубокого знания о людях.

Конечно же, эта третья часть скорее перспективная. Мы не ставим никаких сроков, а просто копаемся в данных, строим модели и проверяем гипотезы.

Несколько лет назад прогремело слово «уберизация», заставившее многих пересмотреть свои взгляды на конкурентов и направления развития бизнеса. Сделали ли какой-то вывод из этого в МТС? Как изменились потребности в данных?

Надо сказать, что телеком эта тенденция затронула несильно. Другое дело, что телеком-компании действительно исчерпывают возможности развития внутри своих отраслей и начинают шире смотреть вокруг. Когда стае львов перестает хватать еды на своей территории, они начинают поглядывать на чужую, и будет серьезная схватка.

Ничто не вечно — это так. Положение в отрасли, кажущееся незыблемым, может в одночасье развалиться с появлением какой-то новой технологии. У нас есть только один естественный барьер — лицензии на передачу сигнала. Однако ситуация не безоблачная: некоторые направления перестали расти, некоторые — стагнируют. Классический телеком расти уже не будет, и именно поэтому мы инвестируем в большие данные, пытаемся искать свои ниши в финтехе, цифровой рекламе и создании контента.

Какими инфраструктурными решениями поддерживается работа с данными?

У нас используются три технологии. Первая — Hadoop, дешевая с точки зрения хранения и обработки единицы данных, но сложная. Чтобы с ней работать, нужно знать специфические языки программирования. Таких специалистов мало, и стоят они дорого. Вторая технология — massive parallel processing, MPP. У нас ее поставщиком является Teradata. Хранение и обработка с ее помощью обходятся в разы дороже, но при этом используется распространенный язык SQL. И наконец, есть еще более дорогие системы реального времени, используемые для решения специфических задач. От этих систем требуется мгновенная обработка данных.

Все имеющиеся данные мы разбиваем на три класса в зависимости от того, что с ними собираемся делать. Конечно же, основная часть данных хранится в Hadoop — «холодном» хранилище. Его дешевизна позволяет складировать туда все подряд, не разбираясь, понадобятся ли эти данные в будущем. «Теплые» данные, с которыми ведется активная работа, обрабатываются в Teradata, и минимум «горячих» данных, используемых для маркетинга в реальном времени, находятся в самых дорогих системах. К тому же реализовано гетерогенное хранилище: часть «теплых» данных мы загрузили в Hadoop таким образом, что доступ к ним остался через Teradata. Тем самым сочетаются удобство доступа и дешевизна хранения, и все больше данных в целях экономии мы будем организовывать именно так.

Чем сейчас мобильный оператор может выделиться из конкурентов в условиях примерного равенства цен и качества связи?

Все телеком-компании мира бьются над этой проблемой. Мы намерены сделать следующее: создать вокруг нашей абонентской базы экосистему, в которой классический телеком будет только одной из составляющих. Главное, что там должно появиться, — финтех-сервисы для наших абонентов, решающие их ежедневные потребности в финансовом обслуживании. Помимо финтеха, в нашу экосистему мы будем добавлять как можно больше развлекательных активностей человека.

Где большие данные в реальном времени — там машинное обучение и искусственный интеллект. Банки уже заявляют, что существенная часть их продаж происходит с участием ИИ. А что видите вы?

Мы не ставим цель использовать искусственный интеллект для решения любой задачи. Где-то эти модели работают, где-то — нет. Как правило, они хорошо работают там, где есть большая обучающая выборка — много фактуры, чтобы построить нейросеть и обучить ее. Иногда задачи лучше решаются более простыми методами. Но перспективы действительно внушительные, ведь искусственный интеллект прогрессирует гораздо быстрее человеческого.

Расскажите о нескольких ключевых недавних проектах.

Один из проектов реализован на основе системы Workforce Management для нашей розничной сети, состоящей из 5 тыс. салонов, и касается управления рабочим временем продавцов. Раньше директор каждого салона, исходя из своих соображений, сам решал, когда и кому работать. Он не был мотивирован экономить: в салонах всегда был избыток персонала, и мы были вынуждены переплачивать. При этом все равно периодически возникали очереди, поскольку внезапный наплыв покупателей предсказать никто был не в состоянии. И вот мы построили модель, которая на основе анализа транзакций магазинов за прошлый год прогнозирует на месяц вперед, сколько будет клиентов в данном магазине в каждый час в течение дня. Модель работает с достаточной точностью, чтобы было возможно построить обоснованное расписание работы сотрудников и получить значимый экономический эффект. Повысилась загрузка сотрудников, и сократились очереди.

Кроме того, мы можем спрогнозировать, когда клиенты хотят сменить свой телефонный аппарат, пытаемся понять, на какой именно, и обращаемся к ним с персональными предложениями. У нас огромная розничная сеть, и очень важно имеющимися знаниями помогать ей работать эффективнее. Наши абоненты должны покупать телефоны именно у нас, мы стараемся оказаться первыми, кто сделает им заманчивое предложение. Пока у нас огромный потенциал для роста.

Часто приходится слышать про этику больших данных. Где та граница, за которую нельзя заступать?

Понятно, что мы обязаны действовать в рамках законов. Этика — совершенно другой разрез. Важно понимать, что наша жизнь неизбежно становится все более прозрачной. Уже сейчас любой человек оставляет мощный цифровой след. До глубокой обработки большинства этих данных еще не дошли руки, но это произойдет буквально завтра. Поэтому нас в будущем ожидает одно из двух: либо мы перестанем стесняться чего-либо и смиримся с прозрачностью (и тогда жизнь людей сильно изменится), либо люди, зная, что всё становится известным, начнут жить жизнью праведников. Мне кажется, что более вероятен первый вариант.

Куда движутся большие данные в МТС? Какую роль они будут играть, как могут изменить бизнес компании?

Я думаю, что рано или поздно в ходе работы с данными мы найдем Клондайк: наткнемся на ту самую золотую жилу, позволяющую создать новый бизнес — что-то совершенно новое. Мы стараемся действовать как конвейер по проверке гипотез. Надо пропахать имеющиеся данные вдоль и поперек. В этом смысле работа с большими данными — как поиск в незнакомой темной комнате. И наша задача — искать максимально быстро. С помощью множества экспериментов надо «перещупать» как можно больше возможностей, стараясь ни обо что сильно не удариться. Если в этой комнате что-то есть, оно обязательно найдется.

Теги: МТС Большие данные Директор по данным CDO Award BIG DATA 2019

На ту же тему: