Нейросеть для Сбербанка
Нейросеть для Сбербанка

Дмитрий Бабаев: «Хочу рассказать о проблемах, которые мы обнаружили при применении нейросетей, об их ограничениях и о том, как можно эти ограничения обходить»


09:03 21.09.2018  (обновлено: 17:04 27.09.2018)   |  Дмитрий Гапотченко |  Computerworld Россия

Рубрика Предприятие |   2018 прочтений



Методы глубинного обучения позволили искусственному интеллекту сделать огромный шаг вперед. Теперь дело за наличием данных и средствами автоматизации процесса создания сетей.

 

Нейросетям доверяют все более сложные и ответственные задачи — от определения надежности заемщиков до выявления новообразований на рентгеновских снимках. В каких-то случаях они лишь подсказывают человеку наиболее вероятное правильное решение, в каких-то — принимают решение единолично. О том, как происходит обучение, какие у нейросетей есть ограничения и как автоматизировать процессы их создания и обучения на практической конференции «Технологии машинного обучения 2018» расскажет Дмитрий Бабаев, исследователь в Лаборатории искусственного интеллекта Сбербанка России.

- Чем занимается ваша лаборатория?

Исследованиями в области машинного обучения в применении к нейросетям. Например, мы можем решать типичную задачу для финансовой сферы — создать нейронную сеть, способную прогнозировать, исходя из имеющихся данных, будет ли данный клиент возвращать кредит. По его кредитной истории, истории покупок, даже по тому, как он пользуется мобильной связью — если он дал согласие нам на использование этих его данных для получения кредита.

У нас есть массивы данных о людях, которые выплатили кредит, и о тех, которые не выплатили. Нейросеть учится на этих данных. У нее есть правильные ответы и она пытается построить такую модель, которая лучшим образом им соответствует. И на основе модели выдает рекомендации.

- Как она это делает?

Нейросеть как черный ящик — на входе «правильные» данные, на выходе — рекомендации.

Можно только догадываться, почему нейросеть принимает те или иные решения. Например, она может учитывать, что человек имеет склонность потратить всю зарплату в первую неделю после получки, а потом использует кредитную карточку, и большую часть новой зарплаты использует для погашения кредита. А оставшееся, опять же, спускает за неделю. То есть его поведение на грани дефолта, он не умеет тратить деньги правильно.

Но порой данные неоднозначны. Если, к примеру, человек в рабочие дни ночью в барах тратит деньги, то он ведет опасный с точки зрения кредитора образ жизни. Но зато, может быть, это означает, что у него много друзей, и он кредит выплатит, заняв у них. Или вообще у него работа такая…

Эти данные не устаревают? Допустим, в одной экономической ситуации какое-то поведение было нормальным, прогулял зарплату — новую дадут, а в нынешних условиях ее могут задержать и кредит вернуть не удастся...

Теоретически проблема есть, но практически обычно модели получаются довольно устойчивыми к устареванию, потому что они используют большие промежутки времени наблюдения за людьми, причем из разных областей деятельности.

Окончательного ответа на этот вопрос нет, но в каждом конкретном случае мы можем измерить величину ошибки. Возьмем данные людей, скажем, до 2014 года и построим модель на них. А потом возьмем данные 2017 года и построим модель на них. И посмотрим, насколько точно модель угадывает в том и другом случае. Это позволит понять, насколько устаревание данных, изменение экономической ситуации влияет на точность модели.

У нас на конференциях всегда выступают и скептики. Я разговаривал с одним из них, и он сказал, что большая проблема в том, что искусственный интеллект можно обмануть, если приблизительно знаешь, как работают алгоритмы. Вы не сталкивались с тем, что люди выстраивают формально идеальную кредитную историю?

В принципе такое было возможно, но лишь в тех случаях, когда в банках использовались недостаточно интеллектуальные модели. Их действительно можно было обмануть, распространенный способ — при отсутствии кредитной истории брать небольшой кредит, «на чайник», быстро его погасить, и так много раз.

Но с этим давно научились бороться: и модели стали сложнее, и кроме того, поведенческие факторы практически нельзя подделать. Надо менять образ жизни. Например, перестать пить в барах. С другой стороны, если человек приучил себя поступать настолько правильно, что с точки зрения машины он является хорошим заемщиком, то, может, он и стал другим человеком.

- Благостная картинка. Неужели нет проблем?

Есть, конечно. Для использования сложных алгоритмов нужно много данных. Если мы, например, захотим сделать систему определения надежности юридических лиц, то у нас остро встанет проблема их нехватки — юрлиц меньше, чем физических, кредитов они берут меньше, и дефолтов по кредитам у них меньше. Особенно остра нехватка данных по средним и крупным предприятиям. Создать нейросеть не удастся, но можно использовать другие подходы машинного обучения.

Есть проблема и с кадрами, с людьми, которые умеют работать с нейросетями.

- С чем связан дефицит кадров? Нейросетям не один десяток лет...

Да, занимаются ими довольно давно, но долгое время результатов не было. Из-за этого в 1990-х и начале 2000-х интерес к ним упал. Но в 2010-х появилось глубинное обучение и удалось показать полное превосходство нейросетей в задачах распознавания изображений. И после этого интерес к ним вернулся. Но это были уже другие нейросети, и они требовали других специалистов.

- Современные нейросети – это только подсказчики, или им уже можно доверить принимать решения самостоятельно?

В зависимости от ситуации. Если нейросеть распознает рентгеновские снимки, то это скорее подсказчик, потому что решение о том, болен человек или нет — очень ответственное. И в данном случае нужен врач, который возьмет на себя окончательное решение, ответственность за диагноз.

Но если брать относительно недорогие в плане последствий случаи, где речь не идет о жизни и смерти, например — выдачу массовых кредитов, которых в одном Сбербанке выдается несколько тысяч в день, то волей-неволей приходится доверять машине. Как минимум там, где она достаточно уверена в принятии решения. Иначе придется для обработки данных для решений в сопоставимом объеме держать огромный штат сотрудников. Да и ошибаются сети на отлаженных задачах реже, чем люди.

- Что вы хотите рассказать на конференции и что хотите услышать от других?

Мне интересны все исследования в этой области, а также работающие кейсы в плане применения нейросетей в разных отраслях. А сам хочу рассказать как раз о проблемах, которые мы обнаружили при применении нейросетей, об их ограничениях и о том, как можно эти ограничения обходить. В частности — о том, как бороться с нехваткой специалистов в области создания нейросетей. Ведь при проектировании нейросети нужно принять много решений о том, как она будет устроена. И этот процесс тоже можно частично автоматизировать.

- Следующий шаг — нейросети, которые сами проектируют другие нейросети?

Такие проекты есть. И про них я тоже расскажу.


Теги: Нейронные сети Искусственный интеллект Сбербанк Машинное обучение AI2018
На ту же тему: