Простые решения для аналитики Больших Данных

Роман Раевский: «Аналитики должны быть умными, и никакая нейросеть их не заменит»


14:17 27.02.2017  (обновлено: 09:10 02.03.2017)   |   3959 |  Дмитрий Волков |  «Открытые системы»

Рубрика Индустрия



Компания «Полиматика Рус» предлагает рынку масштабируемую аналитическую платформу для обработки больших объемов данных.

Текущая версия аналитической платформы «Полиматика 5.0», разработанной отечественной компанией «Полиматика Рус», включает в себя понятные и эффективные инструменты анализа, интерактивные ситуационные панели и средства прогнозирования. Генеральный директор компании Роман Раевский (его доклад услышат участники форума BIG DATA 2017, который издательство «Открытые системы» проведет 29 марта. — Прим. ред.) рассказал Computerworld Россия о том, как системе удается завоевывать симпатии пользователей.

– Как с течением времени меняется отношение к Большим Данным?

Изначально термин «Большие Данные» был весьма размыт и имел сильный налет маркетинга, а сейчас происходит его уточнение. Если речь идет о множестве разнообразных простых данных, то говорят об «озерах»; если имеют в виду много слабосвязанных источников данных, то это Hadoop и т. п. Однако как ни структурируй, техническая задача по сбору и обработке данных не исчезнет, как не исчезнет главная проблема – необходимость осознания того, что же можно извлечь из огромных массивов сведений, оценки их непротиворечивости. И здесь, вопреки некоторым утверждениям, человек незаменим как на входе, так и на выходе аналитической системы.

Сегодня на волне эйфории от огромных вычислительных мощностей и практически неограниченной памяти много надежд связывают с искусственным интеллектом и машинным обучением. В 1994 году я учился в аспирантуре под руководством профессора, получившего Госпремию за разработку системы наведения, отличавшей настоящий танк от, например, его макета. Система работала на многослойных нейросетях и ей достаточно было 64 Кбайт памяти для точности распознавания образа в 85%. Современные системы распознавания на базе дорогих графических процессоров недалеко ушли от этого показателя, а порой оказываются глупее отечественной системы почти тридцатилетней давности, хотя их оперативная память измеряется терабайтами. Искусственный интеллект полезен для ограниченного количества конкретных, четко формализованных задач, которые человеку решать лень: распознавание лиц из их бесчисленного множества, реагирование на изменение телеметрии от датчиков Интернета вещей, беспилотные автомобили и пр.

– Каким должен быть идеальный инструмент аналитика?

Простым — несмотря на то, что все заказчики считают себя носителями уникальных и самых сложных задач. «Полиматика 5.0» пришла на смену нашему предыдущему продукту, С.М.А.Р.Т, в котором было три типа нейросетей, генетические алгоритмы, нечеткая логика и другие умные навороты; однако оказалось, что многие функции оставались невостребованными – большинству пользователей вполне хватает средств работы с кубами (по транзакциям, статьям расходов и пр.) или с кластерами, срезов по данным и инструментов визуализации. У идеальной системы должна быть одна кнопка, вся математика скрыта, а пользователям достаточно лишь выбрать нужный режим обработки. Благодаря простоте и отсутствию громоздких настроек можно будет не тратить время на освоение многочисленных функций, а быстро проверять свои гипотезы по анализу данных.

– Каковы главные особенности платформы, отличающие ее от других решений бизнес-аналитики?

«Полиматика 5.0» гарантирует пользователям полное аналитическое самообслуживание, не ограничивая их творчество, а предоставляя максимум свободы при проверке своих идей, поиске скрытых закономерностей, неэффективностей или мошеннических схем. Настоящий аналитик постоянно задает новые вопросы, ищет, как на одном объекте получить несколько уточняющих срезов. Имея в своем распоряжении инструмент оперативной работы, а не классическую умную систему бизнес-аналитики, курсы по настройке которой занимают недели, он обретает свободу. Часы работы аналитика превращаются в минуты, это оказывает и психологическое влияние – благодаря возможности проверить сразу множество гипотез и рабочих версий можно увидеть картину в целом. Главное — сформулировать, что именно интересует аналитика. Ведь от сотрудников банка требуется приносить прибыль путем предоставления новых продуктов, услуг, мгновенного решения вопроса о выдаче кредита. Если же заниматься настройками системы бизнес-аналитики, то тогда надо говорить не о банкирах, а о настройщиках, например, продуктов от SAS, SAP или Teradata. Конечно, в западных продуктах, в которые вложены миллиарды, больше прикладной функциональности, но концептуально «Полиматика» за счет скорости проверки нескольких вариантов по упрощенной схеме позволяет решать аналогичные задачи.

Изначально в систему заложено, что уровень образования пользователей меняется, и не в лучшую сторону, по сравнению с классическим научным образованием периода СССР, поэтому в большинстве случаев нет необходимости ставить пользователя перед выбором, например, метода кластеризации динамических объектов. Благодаря отсутствию избыточных шагов и непрерывной аналитической обработке больших массивов данных осуществляется постоянная поддержка процессов принятия решений.

– «Полиматика» справляется с аналитической обработкой данных разных предприятий: от региональной розничной сети до промышленного предприятия федерального значения. Как достигается масштабирование?

В один сервер стандартной архитектуры сегодня есть возможность установить до 1 Тбайт оперативной памяти, куда помещается куб из 5 млрд записей; их на этом сервере можно просчитывать за один проход. Большое число пользователей можно обслужить, разместив копии куба на дополнительных серверах. До уровня 5 млрд записей в оперативной аналитике наши клиенты еще только начали дотягиваться, но в случае, если куб не умещается на одном сервере, мы предлагаем технологию распределенного куба, когда происходит его разбивка по разным элементам одной размерности, например помесячно. Кстати, эта технология позволила нам предложить решение для Ассоциации независимых аптек: прежняя система Microsoft SQL Server Analysis Services уже не справлялась с объемами данных, и подключение дополнительных физических ресурсов не помогало.

- Среди ваших клиентов такие разные организации, как Пенсионный фонд, «Эконика», Mary Kay, «Бинбанк», «Славнефть», ФНС и другие. Как удается поддерживать свои решения, учитывая очень небольшую численность сотрудников компании?

Кроме перечисленных, среди наших клиентов есть и федеральные ведомства, отвечающие в том числе и за национальную безопасность, занимающиеся аналитикой с целью прогнозирования и предотвращения нерегулярных явлений в жизни общества путем обработки разнообразных источников данных, включая содержимое сайтов, интернет-изданий, оперативные сводки и пр. Конечно, ресурсов на поддержку, разработку и другую деятельность, например сертификацию пятой версии системы во ФСТЭК, не всегда хватает. Однако новых сотрудников мы нанимаем только тогда, когда другие варианты, скажем мотивирование имеющихся работников, уже не помогают. Как правило, новому сотруднику требуется примерно девять месяцев на вхождение в курс дела, к тому же в это время он отвлекает разработчиков от основной работы, и тогда замедляются бизнес-процессы. Для организации поддержки у нас имеются более десяти партнеров первой линии, они выполняют работы по запросам клиентов, используя API к системе «Полиматика», а есть прямые, референсные клиенты, которых мы курируем сами, решая их задачи в первую очередь.

– Какие из проектов вам запомнились больше всего?

В каждой организации всегда есть проблемы с обработкой данных, например когда из-за особенностей внутренней отчетности нельзя увидеть партии товаров на складе или когда имеются бизнес-процессы, не попадающие в поле зрения руководства. Учитывая, что в «Полиматике» нет жестких настроек, а вся аналитика выполняется на исходном массиве данных, появляется реальная возможность найти то, что раньше терялось. Интересны проекты, связанные с решением либо организационных, либо психологических задач. Например, в «Славнефти» к «Полиматике 4.0» сразу подключились все пользователи, 150 человек, и они же оказались первопроходцами следующей версии системы, что прошло не совсем безболезненно. В ПФР, где прежде основным инструментом была система Cognos, преобладали психологические проблемы: «непривычный интерфейс», «цвета не те» и т. п., которые, впрочем, на фоне предоставленной в «Полиматике 5.0» возможности работы с кубами почти неограниченного размера сами собой исчезли. В «Бинбанке» в результате множества приобретений других банков образовался зоопарк аналитических систем — почти полный спектр ПО данного класса, и, когда подразделения, работающие на «Полиматике», приносят наибольшую прибыль, руководство начинает задумываться о целесообразности применения прочих систем.


Теги: Большие данные Бизнес-аналитика Полиматика Рус
На ту же тему: