Среди футуристических технологий, придуманных фантастами прошлого, голосовое управление различными устройствами занимает одно из самых важных мест. Капитаны космических крейсеров отдавали своим кораблям приказ выдвинуться в ближайшую планетарную систему, чтобы уничтожить притаившийся там флот противника, персонажи множества фильмов и книг с помощью небрежно брошенных фраз управляли бытовой техникой, а о пространных и задушевных беседах с роботами и говорить нечего – такие сцены встречаются в каждом втором произведении подобного жанра.
И вот фантастика стала реальностью: в сентябре этого года в ходе визита Владимира Путина в офис компании «Яндекс» президенту Российской Федерации продемонстрировали интеллектуального голосового помощника по имени Алиса, заметно превосходящего по своим возможностям зарубежные аналоги. Так что же представляют собой современные технологии голосового управления и зачем они нужны? Давайте разбираться.
История «голосовых помощников» – программ, помогающих управлять компьютерами и мобильными устройствами при помощи произнесенных вслух команд – началась еще задолго до массового распространения планшетов и смартфонов. Первые попытки научить машину понимать человеческую речь предпринимались еще в середине 90-х. Однако технологии того времени были очень несовершенны, и результатом их внедрения стало не открытие новых научно-технических горизонтов, а появление анекдотов о программистах, которых отправляли в сумасшедший дом за то, что они пытались разговаривать с компьютером.
Настоящий расцвет голосовых помощников пришелся на второе десятилетие XXI века, когда на рынке появились компактные смартфоны, не уступающие по своим возможностям современным персональным компьютерам. Пионером, как всегда, стала корпорация Apple, внедрившая в пятую версию своей мобильной операционной системы «виртуальную девушку» с красивыми именем Siri. Вообще-то, изначально Siri разрабатывалась независимой компанией, которая планировала выпустить голосового помощника для мобильных телефонов сразу нескольких производителей, но корпорация Apple вовремя купила эту фирму вместе со всеми ее разработками, и Siri сделалась неотъемлемой частью смартфонов и планшетов с логотипом в виде надкусанного яблока на корпусе. А начиная с версии macOS 10.13 «High Sierra» она поселилась на ноутбуках и в персональных компьютерах Apple.
Основной принцип работы Siri заключается в распознавании ключевых слов в человеческой речи и поиске наиболее подходящего ответа в огромной распределенной базе данных, хранящейся на серверах Apple. Именно поэтому виртуальному помощнику требуется непрерывное подключение к Интернету. Достаточно нажать и удерживать в течение секунды кнопку Home на iPhone или iPad, чтобы Siri перешла в режим ожидания ваших команд. Важно отметить, что Siri – программа обучаемая: поскольку она тесно взаимодействует с операционной системой, «электронная девушка» может определить, например, ваш регулярный маршрут движения из дома в офис и обратно с помощью встроенной в телефон системы GPS, и по запросу подсказать дорожную обстановку конкретно по этому пути следования. Она запоминает ваши привычки и предпочтения, и с радостью подскажет, до которого часа открыт ваш любимый магазин, или по какому адресу расположена ближайшая автозаправка. Siri понимает обычную речь, поэтому пользователю не нужно учить какой-либо специальный набор команд: достаточно сформулировать вопрос так, как вы привыкли задавать его живому человеку. С помощью голосового помощника можно узнать погоду или время, поискать в Интернете интересующую информацию, открыть нужный сайт, набрать телефонный номер из адресной книги или воспроизвести вашу любимую музыкальную композицию. Голосовой ассистент различает команды «позвони» и «позвони на мобильный», если в адресной книге для одного абонента имеется сразу несколько контактных номеров, может сообщить количество пропущенных вызовов и набрать последний номер, прочитать СМС-сообщение и включить будильник. Это очень удобно, если у вас заняты руки, вы управляете автомобилем или яркое летнее солнце светит в экран смартфона так, что разобрать на нем что-либо становится решительно невозможно. Однако есть у Siri и определенные недостатки. Во-первых, каким бы «интеллектуальным» ни считался голосовой ассистент, это всего лишь умная программа, которая отвечает на вопросы пользователя заранее подготовленными шаблонными фразами. Конечно, у Siri можно поинтересоваться о смысле жизни, попытаться уточнить дату конца света или попросить рассказать свежий анекдот, но это развлечение вам наверняка очень быстро наскучит – с определенного момента Siri начинает повторяться. Во-вторых, основная база знаний для Siri изначально была создана на английском языке, а русскоязычный вариант – это всего лишь локализация. Поэтому на языке Шекспира Siri может цитировать популярные американские киноленты, шутить и повторять крылатые фразы за известными комиками. «Русская Сиря» по сравнению с англоязычным аналогом выглядит несколько скромнее и чуть-чуть глупее.
Голос англоязычной Siri подарила американская певица, актриса театра и кино Сьюзан Беннетт. В одном из своих интервью она вспоминала, что согласно контракту ежедневно в течение месяца по четыре долгих часа надиктовывала в микрофон бессвязные фразы, ставшие впоследствии интеллектуальным арсеналом Siri. Пользователи часто спрашивают голосовую помощницу от Apple о ее возрасте, и Siri всегда кокетливо уклоняется от ответа. Возможно, «виртуальная девушка» и вправду молода, а вот озвучивавшей ее актрисе недавно исполнилось 68.
Год спустя, в 2011-м, конкурентов из Apple догнала корпорация Google, внедрив в свою мобильную платформу Android голосового ассистента «Google Now». Этот проект не запомнился пользователям ничем, кроме сделавшейся расхожей фразы «Окей, Гугл». Фактически, «Google Now» – это даже не полноценный голосовой помощник, а персонализированный поисковый механизм, оснащенный голосовым управлением и связанный с гугловским сайтом. Он ищет информацию в определенных категориях, таких как «валюта», «новости», «мероприятия», «авиарейсы», «погода», и заметно отстает интеллектом от Siri. По крайней мере, о любви с ним не поболтаешь.
В 2014 году о создании собственного голосового помощника с именем Кортана объявила компания Microsoft. Название разработчики выбрали в честь героини серии компьютерных игр Halo, которую, как, собственно, и голосового ассистента, озвучивала американская актриса Джейн Тейлор. С учетом того, что в 2017 году Microsoft полностью отказалась от дальнейшего развития линейки операционных систем для смартфонов Windows Phone, перспективы Кортаны на рынке мобильных устройств весьма туманны. Вместе с тем, Microsoft планирует включить Кортану в состав Windows 10, которая, как известно, работает не только на настольных компьютерах и ноутбуках, но и на некоторых планшетах. Вот только нужен ли голосовой помощник непривычным к таким инструментам пользователям Windows?
Наконец, 10 октября 2017 года одна из крупнейших российских IT-компаний – «Яндекс» – представила собственного интеллектуального ассистента по имени Алиса. Ходят упорные слухи, что этот виртуальный персонаж был назван в честь героини популярных фантастических произведений Кира Булычева Алисы Селезневой, но на сегодняшний день никто достоверно не подтвердил это предположение.
Основным отличием Алисы от предшественниц является то, что ее ответы не ограничиваются заранее созданным набором стандартных фраз, а строятся автоматически с использованием самообучающейся «нейронной сети», которой разработчики предварительно «скормили» огромный массив литературных текстов и сетевых диалогов. Поэтому поведение Алисы иногда бывает непредсказуемым: она может отказаться отвечать на какой-нибудь вопрос, а кроме того, умеет передавать интонациями различные эмоции — радоваться, грустить, и даже дерзить. На сегодняшний день Алиса выпущена для мобильных устройсвт под управлением Apple iOS и Android.
Алиса общается с пользователями голосом российской актрисы театра и кино Татьяны Шитовой, принявшей участие в озвучивании более 300 фильмов. В разное время она озвучила на русском языке таких популярных актрис, как Натали Портман, Эмма Стоун, Скарлетт Йохансон, Линдсей Лохан и Кэмерон Диас.
Основное предназначение Алисы – работа виртуальным помощником по сервисам Яндекса: Яндекс.Картам, Яндекс.Почте, Яндекс.Музыке, и, конечно же, поиску. Вы можете попросить Алису проложить маршрут, найти в Сети какую-нибудь информацию, проверить почту, рассказать о погоде. Словом, она умеет практически все то же, что и Siri, за исключением возможности работать с некоторыми приложениями. Но не только это. Алиса прекрасно понимает живую человеческую речь, но ее «искусственный интеллект» позволяет ей поддерживать беседы на отвлеченные темы. Голосовой ассистент от «Яндекса» способен шутить, спорить, развлекать собеседника, может с иронией отвечать на вопросы и вести вполне осмысленные диалоги. Отличный способ сохранять себя в тонусе, чтобы не уснуть за рулем во время длинных путешествий! Пользователи, регулярно публикующие в Интернете записи своего общения с Алисой, отмечают нехарактерное для «искусственного разума» чувство юмора и умение поддерживать беседу. Конечно, электронный голосовой ассистент никогда не заменит настоящего живого общения, но кто знает, что ждет нас в будущем? По крайней мере, уже сейчас частичка этого будущего стала реальностью.