Новости Форума All-over-IP

От Siri к Алисе: давай поговорим

Алексей Коржебин, редактор рубрики "Цифровая трансформация: AI, IoT, умный город", технический директор ООО "Эмбеддед Системс Рус". 

korjebin

10 июля 2018 г. поступила в продажу умная колонка "Яндекс.Станция", а 30 июля вышел Google Assistant на русском языке. Эти события – хороший повод поговорить о голосовых помощниках и человеко-машинных интерфейсах в целом.

Голосовые помощники появились несколько лет назад. Первой была компания Apple, которая представила всем теперь известную Siri. В 2015 г. компания Amazon создала специальное устройство для помощника – колонку Amazon Echo. Она получила такую популярность, что именно с колонками стали ассоциироваться голосовые помощники. Далее появились Google Assistant и Microsoft Cortana. В конце 2017 г. на российском рынке Яндекс представил свою Алису.

Стремление к диалогу

Попытки сделать интерфейс более интуитивным предпринимались все время, с увеличением сложности машин от кнопок и выключателей на стене к перфокартам, вводу текста посредством командной строки, мыши и оконным интерфейсам операционных систем. Управлять голосом пытались в 1980–1990 гг., но к более-менее к рабочему виду удалось прийти только к началу 2010-х гг. Однако здесь пользователи столкнулись с проблемой, что им некомфортно говорить в пустоту, тем более не понимая обратную реакцию машины.

jpg

Потребовалась возможность вести именно диалог – как с человеком, который не просто тебе отвечает, не требует формулировать полные команды, а понимает информацию из контекста. По своему опыту скажу, что когда мы пытались внедрить голосовое управление умными домами, все уперлось в то, что пользователю было некомфортно говорить фразу типа "Включи свет в большой комнате на первом этаже", а сразу за ней "Увеличь яркость света в большой комнате на первом этаже на 20%". Если бы пользователь обращался к человеку, то ему не нужно было бы повторять вторую фразу полностью – из контекста понятно, что речь идет о светильнике, который упоминался в первой фразе.

Аватар человека в цифровом мире

Сегодня главным в понятии "голосовые помощники" становится именно второе слово – помощник, ассистент, интеллектуальная самообучающаяся система, которая может имитировать полноценного собеседника, выражает реакции и понимает контекст. И это было блестяще продемонстрировано в мае 2018 г. на презентации Google, когда Google Assistant смог по телефону позвонить в ресторан и самостоятельно забронировать столик на основе предпочтений своего владельца, ведя диалог с человеком.

То есть помощник становится нашим аватаром в цифровом мире, который может брать на себя решение все более сложных рутинных задач, от включения света и проигрывания музыки до заказа продуктов в интернет-магазинах. Сейчас он ведет себя пассивно, ожидая команды пользователя, но в скором будущем будет сам предлагать определенные действия, основываясь на предыдущем опыте. Можно представить, например, ситуацию, когда с утра ваш ассистент сообщит: "Сегодня приезжает музыкальная группа, которую ты постоянно слушаешь, а у тебя вечером свободное время, поэтому я уже предварительно заказал билеты на концерт, ты ведь не против? Но если против, я могу снять бронь". И самое главное – вы, скорее всего, будете не против.

Экосистема приложений

В настоящее время термин "голосовой помощник" трансформируется в персональную информационную платформу, которая работает не только в колонке, но и на любом смарт-устройстве: мобильном телефоне, смарт-часах, бытовой технике или автомобиле. Ни один производитель не смог бы решить все задачи, которые ставит пользователь перед персональным помощником. Поэтому все персональные помощники по своей сути представляют собой экосистему, которая связывает пользователя с ресурсами и поставщиками наиболее естественным образом. Поставщики пишут для них приложения, которые выполняют именно их задачу, это, например, техподдержка банка, служба заказа пиццы или билетов и многое другое. Сейчас к таким платформам уже написаны тысячи подобных приложений.

Новая арена борьбы

ИТ-компании всегда боролись за то, чтобы их продукты были интерфейсом пользователя, достаточно вспомнить войны операционных систем в 1990-е г г. и браузеров в нулевые. Сейчас персональные помощники становятся новой ареной борьбы, которая может сильно изменить дальнейшее состояние рынка и вывести на него новых игроков. Интересная особенность персональных помощников, которая может стать важным фактором, – это самообучаемость и адаптация под конкретного пользователя с течением времени. То есть переход на другого помощника для пользователя будет означать потерю всего опыта и знаний, которые получил ассистент.

Следующий виток

В связи с тем, что раньше основные помощники не поддерживали русский язык (если не считать достаточно слабую реализацию в Siri), то российский рынок был в стороне от этих тенденций. Поэтому выход Алисы и русскоязычной версии Google Assistant – это важный этап для всего ИТ-сегмента. Как появление iPhone создало рынок разработчиков мобильных приложений, так и появление русскоязычных ассистентов создаст рынок приложений для них.

Сюжеты: IoT Умный город Цифровая трансформация AI