Старт эпохи голосовых ассистентов

По словам Даниила Колесникова, голосовыми интерфейсами пользуется все больше людей, но для этого тоже требуются определенные навыки


15:21 22.11.2018  (обновлено: 10:36 26.11.2018)   |   4015 |  Дмитрий Волков |  «Открытые системы»

Рубрика Технологии



Компания Just AI провела в Москве конференцию Conversations’18, посвященную голосовым ассистентам, чат-ботам и разговорным интерфейсам.

Что может быть общего между автомобильным регистратором и «говорящей» плюшевой игрушкой? То, что они работают на платформе интеллектуальных виртуальных ассистентов. На конференции Conversations’18 два отечественных стартапа, NotAnotherOne и Mishka AI, представили свои разработки: умный видеорегистратор Linza со встроенным голосовым ассистентом и умную плюшевую игрушку mishka.cloud.

Кирилл Петров, управляющий директор компании Just AI, занимающейся исследованиями, разработкой и внедрением технологий разговорного искусственного интеллекта, сделал обзор нового сегмента интеллектуальных технологий, оценив его как следующий шаг к человеко-машинному взаимодействию. До недавнего времени не существовало средств адекватной автоматизации основного способа нашего общения — человеческого языка. Сегодня с распространением новых каналов взаимодействия (мессенджеры, веб-чаты, голосовые ассистенты и т. п.) и на фоне успехов технологий распознавания речи (Automatic Speech Recognition), перевода текста в речь (Text To Speech), понимания естественного языка (Natural Language Understanding), использующих, в частности, машинное обучение, ситуация изменилась.

Рынок интеллектуальных ассистентов и устройств на их основе динамично растет. Так, темпы продаж умных колонок сейчас выше, чем в свое время были для смартфонов: в 2017 году во всем мире использовалось 50 млн умных колонок, годом позже — 100 млн, а в 2021-м, по оценкам Just AI, во всем мире будет уже 500 млн умных колонок. Лидеры здесь недолго почивают на лаврах – если в 2014 году на рынке господствовала Amazon Alexa, то в 2017 году у Google было 20% рынка, а затем произошло коренное изменение – 36% у Google и 27% у Amazon, да и выбор резко расширился: Apple Homepod, Samsung Bixby, Xiaomi Mi AI, «Яндекс Алиса», ну и разработки множества азиатских игроков помельче.

Сегодня 32% домохозяйств в США уже применяют умные колонки, 50% из них используются для заказа товаров. Среди причин популярности умных устройств — возможность заниматься одновременно другими делами, оперативность получения ответов, освобождение от рутинных действий, а выдержка и доброжелательность виртуальных ассистентов приводит к тому, что у людей появляется привычка общаться именно с ними.

Для широкого распространения умных устройств критически важна экосистема, отметил Андрей Липатцев из Google, отвечающий за развитие партнерского сообщества. В сфере разговорного искусственного интеллекта и соответствующих интерфейсов сегодня открывается большой простор для исследований, особенное если учесть, что речь идет не о голосовых, а именно о разговорных интерфейсах. Здесь важны не только распознавание или генерация голоса, но и грамотная комбинация всех деталей, присущих осмысленному диалогу: качество и стиль подачи информации, ее объем, тональность, форма разговора – лаконичность, доброжелательность, доверительность, в сумме формирующих персону общения. Очевидно, что паттерны ведения диалога зависят от национального менталитета, возраста, самочувствия собеседника и других факторов. При этом, как отметил Липатцев, работа ассистента определяется не кодом программы, а именно сценарием, и здесь, как и у грандов ИТ-индустрии, так и у стартапов, имеется обширное поле деятельности по созданию устройств, обеспечивающих иллюзию общения с живым собеседником и способных не только отвечать на четкие вопросы, но и самостоятельно инициировать и вести осмысленный диалог.

«Одноклассницы» Siri все больше завоевывают симпатии масс. Даниил Колесников, руководитель маркетинга проекта «Яндекс.Алиса», отметил, что с «Алисой» общается 33 млн человек в месяц (треть всего Рунета), а в поисковом приложении «Яндекса» 20% запросов формулируются голосом. Однако, как это было раньше, например, с мышью, для работы с голосовыми интерфейсами от людей требуются определенные навыки.

О том, как создавалась мультимедийная система «Яндекс.Станция» с «Алисой» внутри, рассказала Вера Козырь, руководитель компании NotAnotherOne, принимавшей участие в проектировании этой умной разработки, уже ставшей популярной у отечественных пользователей. Нужно было ответить на массу вопросов: сколько должно быть микрофонов, где их разместить, как обеспечить охлаждение станции, каким должен быть ее уникальный, еще никем доселе не запатентованный дизайн.

«Алиса» «живет» не только в смарфонах и в «Яндекс.Станции». Козырь представила умный видеорегистратор Linza, который появится на прилавках уже в декабре 2018 года. Он имеет лишь две кнопки, управляется через приложение на смартфоне, взаимодействует с облаком и другими устройствами – можно посмотреть, что видит другой водитель, оценить обстановку на дороге, узнать погоду и пр. Кроме обычных для устройств такого типа функций, в Linza имеются: поддержка Wi-Fi с режимом хот-спот; встроенные сенсоры — гироскоп и акселерометр, способные, например, «почувствовать» момент эвакуации машины, вовремя предупредить водителя и сохранить видео в облаке; интерфейсы с бортовыми системами автомобиля; интеллектуальный голосовой помощник, способный общаться на любые темы и выполнять команды по управлению инфраструктурой автомобиля.

Умный мишка разговаривает с ребенком, выполняет его просьбы, заполняя возможный дефицит общения с часто занятыми, уставшими после работы родителями

Кульминацией конференции можно назвать выступление Андрея Тесленко, основателя и операционного директора компании Mishka AI, работающей на ниве виртуальных ассистентов для детей. Как показывают опросы, шесть из десяти родителей сегодня выступают против гаджетов и разного рода экранов для детей, опасаясь формирования первой в их жизни зависимости. Общаться ребенку предпочтительно с физическим, а не виртуальным объектом, однако до сих пор ИТ-индустрия предлагала очень мало интеллектуальных устройств, спроектированных именно для детей. Технологии искусственного разговорного интеллекта позволяют сделать «умной» практически любую традиционную детскую игрушку, встроив в нее чип и обеспечив связь с облаком. Умный мишка разговаривает с ребенком, выполняет его просьбы: может спеть песенку, рассказать сказку на ночь и т. п., в какой-то степени реализуя функции воспитания и обучения, заполняя возможный дефицит общения со стороны часто занятых, уставших после работы родителей. Подписка на контент (см. www.mishka.cloud) дает возможность настраиваться практически на любое содержание, а расширение функционала в будущем может быть достигнуто, например, путем смены «одежды» игрушки. Эта полностью российская разработка одновременно с выходом на местный рынок запускается и в США.


Теги: Google Распознавание речи Искусственный интеллект Siri Чат-боты Алиса Яндекс.Станция
На ту же тему: