РБК
Совместный проект
Гаджеты

Будущее голосовых помощников:
тенденции и прогнозы

Во многие гаджеты сегодня уже «поселили» умных голосовых помощников. В будущем именно голос человека станет основой интерфейса большинства приложений.

Десятилетиями человечество мечтало об описанном в научной фантастике голосовом интерфейсе, с помощью которого герои будущего управляют своими космическими кораблями. В XXI веке выдуманные технологии стали реальностью и в прямом смысле вошли в каждый дом и карман: по прошлогодним данным Pew Research, 46% американцев используют голосовых помощников (причем 42% из них — на смартфонах). 62% британцев пользуются услугами голосовых помощников для шопинга, проигрывания музыки и поиска в сети.

В прошлом году крупнейшие ИТ-компании, разрабатывающие виртуальных помощников, вступили в «гонку вооружений», и в этом году битва, несомненно, продолжится. Победители получат невероятный массив информации о потребителях — неиссякаемый источник конкурентных преимуществ и доходов. Не исключено, что фавориты определятся уже в этом году. Впрочем, пока что идеального ассистента не представили даже крупнейшие игроки рынка. Рассмотрим основные тенденции развития отрасли на ближайшее время.

Очеловечивание роботов

С каждым годом интерфейсы голосовых помощников становятся всё более «человеческими». Много внимания уделяется голосу: каждый из разработчиков пытается сделать его неотличимым от живого, хотя это довольно сложно. В реальной речи столько нюансов — акцент, междометия, слова-паразиты, сленг, идиомы, — что эта задача выглядит непосильной. Однако напомним наделавшую шуму демонстрацию новых возможностей Google Assistant, когда виртуальный ассистент записал свою «хозяйку» на стрижку; при этом администратор салона, судя по всему, не поняла, что общается с роботом. В будущем роботы будут использовать нейросети, машинное обучение и обработку голоса, чтобы говорить как люди.

От текста к речи

Чат-боты — ассистенты, работающие с помощью текстовых сообщений, — начнут понимать речь. Если сейчас вы просто общаетесь с ботом в чате (к примеру, записываетесь на занятие в фитнес-клуб или на ту же стрижку), то вскоре в программы добавят дополнительный «голосовой слой»: компьютер будет обрабатывать речь и превращать ее в текст, а затем выполнять поступившее задание. С точки зрения маркетинга подобный союз голосового помощника и чат-бота довольно привлекателен и значительно расширяет аудиторию пользователей.

Гибридный подход

В прошлом году Facebook провел «полевые» испытания своего чат-бота. Когда ассистент не мог ответить на запрос пользователя, ему на помощь приходил человек. Это хорошо работало для обеих сторон: клиенты были довольны, а бот становился умнее благодаря шаблонам ответов, которые оставлял живой ассистент. Хотя проект пришлось свернуть, так как ассистентов не хватало на все запросы, для более скромных масштабов такой гибридный подход кажется идеальным решением.

Кастомизация помощника

Любого голосового помощника можно будет индивидуализировать, подстроить под вкус потребителя. Так, Alexa уже умеет различать голос своего хозяина среди многих других: для этого человек зачитывает десять фраз, и помощник создает голосовой профиль. Производители обещают со временем улучшить и расширить эту функцию.

Кастомизация также распространяется на выбор места хранения данных и на так называемые горячие команды (по аналогии с горячими клавишами). Например, пользователь сможет придумать свое слово для активации вместо надоевших «окей, Гугл» или «привет, Сири» и дать своему помощнику новое имя (как насчет Иннокентия?). Персонализировать помощника также можно, наделив его голосом какой-нибудь знаменитости. Google Assistant, например, недавно добавил в свою коллекцию несколько новых голосов, включая голос звезды R’n’B Джона Ледженда.

Выход за пределы

В скором времени виртуальные помощники перестанут быть ограничены рамками смартфона или колонки. Крупнейшие разработчики постепенно переводят своих ассистентов на приборную доску автомобиля. Также специально «заточенные» под бизнес-задачи и продуктивность сотрудников помощники должны появиться в офисах. Они облегчат проведение аудио- и видеоконференций, планирование и выполнение различных действий.

Один из последних трендов — интеграция помощников в «умный» дом: свои ассистенты появятся у видеокамер безопасности, термостатов и даже бытовой техники в рамках «интернета вещей», к которому, по приблизительным оценкам, в 2020 году будут подключены уже 34 млрд приборов.

Виртуальные помощники могут «жить» в «умной» колонке, смартфоне или компьютере. Уже в этом году они также «поселятся» в интерактивных смарт-дисплеях, снабженных, к примеру, встроенным будильником или даже выходом в YouTube. Эксперты, впрочем, видят здесь проблему: подобные дисплеи значительно дороже колонок, и пока неясно, захотят ли потребители больше платить примерно за тот же функционал.

Один девайс — несколько помощников

У каждого виртуального ассистента свои преимущества и недостатки. Неудивительно, что некоторые компании (Sonos и Essential) объявили о поддержке своими «умными» колонками сразу нескольких помощников. Это весьма удобно: виртуальный шопинг, к примеру, можно поручить Alexa, поиск в сети, что логично, Google Assistant, а управление фонотекой — «Алисе». Это стало возможно благодаря технологии мультизадачности, внедренной в прошлом году в ПО некоторых ассистентов. Только представьте себе будущее, когда голосовые помощники смогут «жить» буквально в каждом приборе, от утюга до холодильника. И нет, это не утопия!

Один из последних трендов — интеграция голосовых помощников в «умный» дом: свои ассистенты появятся у видеокамер безопасности, термостатов и даже бытовой техники.

Монетизация программного обеспечения

Виртуальным помощникам постоянно требуются новые программы, и на их написании можно заработать. Так, на Alexa работают многие независимые программисты и маркетинговые компании. 47-летний американец Джоэл Уилсон, к примеру, создал для нее такие «фичи», как «Три вопроса» (своего рода интеллектуальный турнир: помощник задает три вопроса из различных сфер, включая науку, поп-культуру, и начисляет баллы за каждый правильный ответ) или «Вопрос дня» (построен по тому же принципу). Как утверждают создатели, вопросительные навыки Alexa — лучший способ проверить и улучшить свою эрудицию.


Программа по выплате денег разработчикам ПО стартовала в мае прошлого года, и уже к началу 2018 года Alexa могла похвастаться наличием около 30 тысяч различных функций в своем репертуаре.

Впрочем, даже в этой отрасли имеется альтернатива крупнейшим игрокам с их засекреченными технологиями и строгими правилами игры. В прошлом году компания Mycroft AI выпустила первого в истории голосового помощника с открытым кодом. «Майкрофта» можно скачать бесплатно, и уже около тысячи программистов приняли участие в его улучшении на добровольных началах.

Несмотря на некоторые пугающие тенденции (так, недавно Alexa была поймана на «шпионаже»: она записала разговор и отправила его случайному контакту из телефонной книжки, но разработчики уверяют, что такое больше не повторится), будущее голосовых помощников в целом выглядит светлым и внушает оптимизм.

Не только компании-производители, но и сами пользователи всё больше заботятся о своей безопасности в виртуальном мире, поэтому основное внимание будет уделяться именно этому. В частности, при голосовых покупках станет удобнее определять личность говорящего, а его личные данные будут охраняться еще более тщательно.

Именно голос человека станет основой интерфейса подавляющего большинства приложений, то есть будущее за голосовыми помощниками. Сейчас это выглядит несколько странно, но вспомните, как лет десять назад вы впервые взяли в руки смартфон. То, что сперва кажется экзотичным и революционным, в наше время быстро становится новой нормой.

Тестируем новую технологию