Вестник цифровой трансформации

«Утконос»: без озера, но с продвинутой математикой
«Утконос»: без озера, но с продвинутой математикой

Данила Наумов: «Один из главных пользователей наших сервисов — генеральный директор. В среднем 16 раз в день он заходит в дэшборд, отображающий динамику заказов и их изменение в реальном времени»


13:34 06.12.2019 (обновлено: 17:27 06.12.2019)  |  Николай Смирнов | 14340 просмотров



Данила Наумов, директор по данным компании «Утконос Онлайн» и претендент на премию CDO Award, — о создании централизованного подразделения по работе с данными и о первых результатах его работы.

В марте 2019 года в компании «Утконос Онлайн» произошло знаковое событие — был создан централизованный офис данных, во главе которого встал CDO (Chief Data Officer). Новое подразделение не только объединило усилия действующего аналитического отдела и экспертов бизнес-функций, но и усилило их, добавив отделы хранения и обработки данных и data science. О том, как данные помогают бизнесу развиваться, о первых реализованных проектах и зависимости числа заказов от температуры и осадков рассказывает Данила Наумов, директор по данным компании «Утконос Онлайн» и претендент на премию CDO Award 2020.

- Расскажите об истории появления в «Утконосе» офиса данных. Почему это произошло и какие задачи были перед ним поставлены?

Компания прошла долгий путь и получала на протяжении многих лет бесценный опыт, который постепенно повышал ее зрелость.

 

 

Идет прием заявок на получение премии для директоров по данным  CDO (Chief Data Officer) - CDO Award 2020!

Мы ждем представителей профессии CDO (и им сочувствующих), готовых поделиться с бизнес-сообществом своими успехами. Прием заявок открыт до 31 января 2020.

Подать заявку 

 

До определенного момента в Утконосе только зарождалась культура обработки данных, не существовало единой платформы и системных процессов. Летом 2018 года мы начали формировать аналитический центр, который занимался обработкой имеющейся в разрозненных системах информации. Например, BI-платформа QlikView была приобретена ранее для нужд финансового департамента и использовалась для выгрузки данных из систем. Бизнес-пользователи знали об этом довольно удобном инструменте и все больше ориентировались на него при реализации своих потребностей. Закончилось это тем, что модуль BI-отчетности стал использоваться как хранилище данных, хотя для этого не предназначен. Данные из него было невозможно использовать где-то еще.

Параллельно появлялось все больше новых задач, для решения которых требовались самые различные данные. Началось все с построения системы автозаказа и прогнозирования спроса, вместе с этим развивались направления ценообразования и целевого маркетинга. Было необходимо определить необходимый набор данных и инструментарий для их обработки.

Кроме того, зачастую в бизнес-командах компании могли присутствовать отдельные люди, которые занимались аналитикой только для конкретного подразделения. И как следствие, аналитическая работа велась разрозненно. Зачастую, каждый менеджер пользовался только собственными отчетами, на которые уходило достаточно много ресурсов. Поэтому было принято решение о создании единого аналитического центра, чтобы объединить аналитиков из всех бизнес-подразделений компании, избежать дублирования отчетов, договориться об определениях, метриках, источниках данных и отслеживаемых показателях. В дальнейшем стало ясно, что существовавшей BI недостаточно: необходимо создание платформы данных, способной стать основой для продвинутой математики. Это вылилось в создание в рамках ИТ-департамента офиса данных, который на текущий момент состоит из трех отделов: аналитического центра, отдела хранения и обработки данных и отдела data science. Сейчас в моей команде работают 24 человека.

- Почему подразделение находится внутри ИТ?

Мы решаем задачи для многих бизнес-подразделений, и, если бы вошли в состав какого-либо из них, наблюдалось бы определенное нарушение баланса и конфликты интересов. Создание офиса данных требовало серьезных инвестиций: закупки лицензий, создания инфраструктуры, привлечения консалтинга. Все это находится в ведении ИТ, поэтому структурно офис данных гармонично вошел в состав ИТ-департамента. Параллельно шла трансформация службы ИТ, и создание data-офиса уложилось в ее стратегию.

Для более быстрого внедрения продвинутой аналитики и ее встраивания в бизнес-процессы было принято решение о курировании всего направления непосредственно первым лицом компании — генеральным директором.

- Почему создание централизованного подразделения было важно для компании?

Накапливается все больше данных. Мы, как крупнейший онлайн-магазин продуктов, обладаем большим количеством данных о клиентах, и необходимо их использовать максимально эффективно — и для персонализации подходов, и для оптимизации внутренних процессов. Есть множество рутинных задач, реализуемых бизнес-подразделениями, и при этом бизнес даже не представляет, что можно жить по-другому, что какие-то действия могут выполняться автоматически. Мы берем рутину на себя и предоставляем бизнесу возможности для «творчества»: генерировать бизнес-гипотезы, проверять их и пытаться улучшить показатели компании.

Появление централизованного подразделения по работе с данными в такой относительно небольшой компании, как Утконос, важно для централизации экспертизы, устранения дублирования функций и выстраивания сообщества, которое будет являться сервисным подразделением для других направлений.

- Вы пришли в компанию в начале нынешнего года. Чего удалось добиться за это время?

Согласования ключевых инвестиций — в СУБД, обновление BI-инструмента, приобретение инструмента интеграции данных и консалтинг по различным направлениям.

Произошла ротация кадров внутри аналитического центра, и в команде появилось семь новых должностей. В первую очередь потребовалось усилить направление инженеров данных и исследователей данных — эти функции практически отсутствовали. Часть сотрудников пришли из других отделов — например, те, кто хотел сфокусироваться на обработке данных, а не на операционных задачах. Надо отметить, что многие из них уже сделали огромный шаг в профессиональном развитии.

Поставили на поток работу с бизнес-гипотезами — за полгода мы проверили более 500 гипотез, пришедших из бизнеса. Сформировано более 50 интерактивных дэшбордов, каждый из которых ориентирован на определенную задачу — работа склада, выручка в режиме реального времени и т. п.

Очень приятно видеть активность пользователей в работе с нашими сервисами. Они действительно востребованы. Один из главных пользователей — генеральный директор. В среднем 16 раз в день он заходит в дэшборд, отображающий динамику заказов и их изменение в реальном времени. Статистика посещений показывает, что и у менеджеров утро начинается не с чашки кофе, а с анализа отчетов по своим бизнес-задачам. Проходя мимо переговорных, регулярно вижу на совещаниях нашу аналитику. Это серьезное изменение в бизнес-культуре, огромный шаг к реализации подхода data-driven в управлении компанией — переход от исключительно экспертных решений к действиям, основанным на объективных данных.

Сейчас мы планируем сделать такие отчеты доступными не только для заинтересованных специалистов, но и для всех сотрудников офиса. Например, разместить на стенах офиса мониторы и отображать на них ключевые показатели работы компании.

- С какими проблемами столкнулись?

Во время первого знакомства с бизнес-подразделениями компании стало понятно, что нужно будет решить огромное количество задач, предложить инструменты, отвечающие потребностям коллег. Для каждого подразделения был согласован план работ и выделены ресурсы. Еженедельно мы встречались и демонстрировали результаты. Поначалу с теми инструментами, которые имелись в наличии, — это было нелегко. Но с появлением новых инструментов наш показатель time to market существенно улучшился.

- Какие данные используются для решения аналитических задач?

Основным источником данных о клиентах является история его покупок. Это ERP, CRM, веб-сайт и мобильное приложение, системы управления складом и логистикой. Кроме того, мы собираем данные об активности пользователей на сайте и в приложении: переходы между этапами, скорость пролистывания страниц. Это дает много информации о потребностях клиентов и способах повышения удобства наших приложений.

Недавно мы проводили пилотный проект по использованию данных соцсетей. Один известный интегратор утверждал, что сможет обогатить клиентские данные информацией из Facebook. К сожалению, результат оказался нулевым, и это направление работ пока заморожено. Мы будем повышать эффективность использования собственных данных.

Сейчас все данные аккумулируются в хранилище. Мы задумывались о создании озера данных, но поняли, что при наших объемах и темпах накопления данных озеро не нужно, тем более, что его администрирование требует ресурсов. Наша база данных Oracle в обозримом будущем будет способна «переваривать» наши данные. Чтобы создание озера данных стало актуальным, должны появиться новые источники данных, причем объемы должны на порядки превышать нынешние.

- Какими техническими средствами поддерживается накопление данных и работа с ними?

В качестве базы данных для хранилища выбирали между несколькими вариантами. Очень быстро выяснилось, что на наших объемах колоночные СУБД (Teradata и Vertica) не нужны; кроме того, они достаточно дороги, а, например, возможности Greenplum также избыточны.

Из реляционных СУБД выбрали Oracle. PostgreSQL оказалась не такой уж и бесплатной: для стабильной ее работы все равно пришлось бы покупать коммерческую сборку. А в трудоемкости работы администратора PostgreSQL заметно проигрывает Oracle. Наши администраторы тратят на эту работу лишь 30% времени, а в остальное время выступают в роли инженеров данных.

У BI-платформы было три сценария развития: доработка существующей платформы QlikView, внедрение абсолютно новой современной платформы (например, Tableau или Power BI) или миграция на Qlik Sense. Был выбран третий вариант, так как эта система работает с теми же моделями данных, а при масштабировании она оказалась более экономичной.

В качестве инструмента интеграции данных и платформы продвинутой аналитики используются решения SAS. Их явным преимуществом является ориентация на бизнес-пользователей, незнакомых с программированием. Кроме того, по сравнению с инструментами open source они позволяет в полтора-два раза быстрее решать аналитические задачи и выводить их в эксплуатацию.

- Какие наиболее значимые или интересные проекты вы можете выделить?

В первую очередь следует отметить оптимизацию целевого маркетинга — кластеризацию клиентов, понимание их профилей и по поведенческим признакам, и по продуктовым корзинам.

Второе важное направление — анализ эластичности спроса по цене. Мы очистили продажи от влияния трендов и сезонности, а также периодов отсутствия товаров и рассчитали эластичность. Будем проводить A/B-тестирование по ее использованию в процессе ценообразования.

Третий проект — оптимизация кампаний по предотвращению оттока клиентов. Раньше у нас был единый промокод, который рассылался всем клиентам. Мы решили действовать более аккуратно. Теперь у нас есть более глубокие скидки, но с условием более высокого чека. Мы поняли, что для каких-то клиентов это работает, и сейчас уже провели пилотный проект, показавший хорошие результаты.

Еще одно важное направление, изначально находившееся в сфере наших интересов, — прогнозирование спроса. В промышленной эксплуатации находятся модели примерно для половины нашего ассортимента. Ежедневно мы выдаем специалистам по товародвижению прогноз на две недели вперед с учетом как прошлых продаж, так и периодов отсутствия товара, изменения цен, наличия скидок и промоакций, а также в зависимости от температуры и количества осадков.

Кроме того, мы построили модель прогнозирования числа заказов, которая используется в операционном планировании ресурсов склада и курьеров-экспедиторов. В компании все прекрасно понимали, что осадки и температура влияют на наши продажи, но не было конкретных цифр. Мы выяснили, что каждый выпавший миллиметр осадков в этот день дает нам дополнительно 18 заказов, а отклонение температуры вниз на один градус от нормы — 7 заказов. Поэтому с уверенностью можно отметить, что в дождливые и прохладные дни покупателей больше, возрастает трафик и количество заказов.

- Каких результатов удалось достичь?

Например, по прогнозированию спроса на самых прибыльных позициях (мы измеряли эффект на 1% товаров, приносящих нам 7% выручки) ошибка прогнозов снизилась с 25% до 17%. Еще один пример: оценивая оптимизацию целевого маркетинга и работы с оттоком клиентов, мы поняли, что можем увеличить выручку примерно на 40 руб. с каждого покупателя.

- Что вы считаете своим главным достижением за время работы в компании?

Формирование и развитие команды, а также вывод в промышленную эксплуатацию задач по продвинутой аналитике. Как известно, можно относительно быстро и легко сделать прототип продукта, но есть огромная пропасть между ним и полноценным бизнес-решением.

И еще одно из ключевых достижений, на мой взгляд, — то, что с данными работают не только аналитики и инженеры данных, но и бизнес-пользователи. Они самостоятельно разрабатывают конвейеры по обработке данных, при этом никто из них до этого в использовании ИТ дальше Excel не заходил. Сейчас этот инструментарий изучает, например, коммерческий директор, чтобы также иметь возможность самостоятельной работы с данными.

- Как вы видите свою роль и роль своего подразделения в развитии бизнеса компании?

Важно выстроить свою работу таким образом, чтобы она была направлена на достижение основной миссии Утконоса — выполнение принципов: «всё на каждый день», «свежесть и качество», «выгода», «WOW-удобно» и «доверие». Этот подход компании к работе с клиентами вполне актуален и для CDO: предоставление бизнесу всего необходимого на каждый день, свежие и качественные данные, выгода от взаимодействия с нами через встраивание аналитики в бизнес-процессы, предоставление действительно удобных сервисов, работать с которыми нравится бизнесу. И конечно, формирование доверия к нашим сервисам.

- Обязательно ли пытаться встроиться в миссию компании?

Да. Как вариант, участвовать в ее формировании и изменении. Многие компании собирают данные, но не очень представляют, что с ними можно делать, каких результатов можно добиться. Директор по данным должен выполнить функцию консультанта-аудитора — понять, какие данные и где можно использовать, какие процессы следует изменить. При изменении процессов может поменяться и миссия компании.

- Какие возможности для своего профессионального развития вы видите?

Когда основные задачи «встанут на поток», необходимо будет больше заниматься процессами внутри офиса данных. Я бы хотел сфокусироваться на управленческих вопросах и перестать участвовать в решении операционных задач. Это будет означать, что участники команды обладают необходимой и технической, и бизнес-экспертизой. Мне останется фокусироваться на стратегии и мотивации.

- В каком направлении будет развиваться ваше подразделение в дальнейшем?

Будем увеличивать и количество, и глубину решаемых задач, охватывать все большее число направлений.

Бизнес-аналитикам очень интересно развиваться в сторону data science, «прокачивать» у себя математические навыки. Они могут развиваться и в сторону бизнеса, но пока я вижу больше возможностей и практической пользы в более сложных математических задачах. Для исследователей данных очень важно качество решаемых задач, чтобы результат их работы был востребован и реально полезен бизнесу. Реализуя такой подход, Утконос всегда будет привлекательным работодателем.

Теги: Big Data Директор по данным CDO Award

На ту же тему: