13 ноября 2014 06.09Общество

Преимущества голоса

Преимущества голоса

Компания «Яндекс» в 2014 году представила новые разработки в области речевых технологий: голосовую активацию, выделение смысловых объектов из текста и синтез речи. Все три функции доступны в виде библиотеки SpeechKit Mobile SDK и облачной платформы SpeechKit Cloud. Эти технологии не только позволят клиентам взаимодействовать с мобильными приложениями компании, но и существенно расширят возможности продуктов для сторонних разработчиков программ и мобильных приложений.

Речевые технологии можно использовать в широком спектре продуктов от игр до навигационных систем. Они применимы в медицине (для протоколирования операций) и телефонии (для автоматизации работы колл-центров). Платформу можно внедрить в бытовые приборы, автомобили, «умные дома» и т. д.

В «Яндексе» много экспериментируют с голосовыми сервисами и разработали новое демонстрационное приложение — «Яндекс. Диктовка». В ней сочетаются все новые технологии работы с голосом.

Массовое внедрение

Напомним, что российская компания «Яндекс» представила технологию распознавания речи еще в 2013 году. Она понимает запросы на русском и турецком языках. Сейчас ее используют 500 мобильных приложений от многих разработчиков, а также устройства 600 компаний. Качество распознавания зависит от тематики запроса. Для географических названий оно составляет 95%, для коротких фраз — 88%, для текстов вроде заметок и СМС — 82%.

«При проектировании голосовых интерфейсов хорошей аналогией является разговор двух людей. Для начала нужно обратить на себя внимание и позвать человека по имени. А значит, первым важным свойством интерфейсов можно считать умение активироваться с помощью голоса. Чтобы разговор состоялся, собеседник должен говорить с нами на одном языке и понимать нашу речь. Поэтому второе свойство заключается в том, что сервисы должны уметь распознавать речь и отвечать на наши сообщения, а также понимать смысл сказанного», — говорит Денис Филиппов, занимающийся в компании развитием речевых технологий и продуктов.

Эксперт объясняет, что уровень голосовых технологий уже достаточен для развития интерфейсов в массовых приложениях и сервисах. А в будущем такое взаимодействие будет максимально похожим на общение с людьми, что сделает его максимально простым.

«Самое сложное — обеспечить высокий уровень качества. Для этого нам пришлось провести длительное обучение наших систем распознавания голоса. Акустическую модель мы обучали на прослушивании 500 часов размеченной вручную речи, а языковую — на поисковых запросах и текстах из интернета. Суммарный объем текстового корпуса — 4 млрд слов. Это в 22 тысячи раз больше, чем слов в романе «Война и мир», — рассказывает Филиппов.

Мобильное приложение «Яндекс. Диктовка» позволяет наговаривать устройству текст и редактировать его с помощью голоса. Приложение умеет активировать голосовой ввод по команде «Яндекс, записывай», а для редактирования текстов есть стандартный набор голосовых команд, благодаря которым приложение может справиться не только с расстановкой знаков препинания, но даже поставить в нужном месте веселый смайл. После написания текста пользователь может скомандовать прочитать сообщение или отправить его по почте, в виде СМС и сохранить как заметку.

«Наша задача — в будущем перевести спонтанную речь в текст. Это может иметь широкое применение в различных сферах жизни. Например, все мы проводим деловые встречи, и было бы здорово по их окончании получить текстовый протокол переговоров. Но эта задача не решена еще никем в мире, мы только движемся к ее решению», — подчеркнул Денис Филиппов.

Замена ручного управления

Крупнейшие компании разработчиков по всему миру стараются решить схожие задачи. Активнее всего мобильные вендоры внедряют голосовой поиск и занимаются разработкой и обучением голосовых помощников, которые взаимодействуют с пользователем, отвечают на его вопросы и поисковые запросы. Потребительская популярность таких продуктов позволяет компаниям-разработчикам ожидать увеличения продаж своих устройств, поэтому они уделяют все большее внимание улучшению подобных сервисов.

Самым известным ассистентом можно считать Siri, реализованный компанией Apple в iOS начиная с пятой версии. Аналогами лидера являются андроидовский Google Now, который активируется в последней версии прошивки командой Ok, Google, и ассистент Cortana, созданный корпорацией Microsoft для платформы Windows Phone.

До конца года собственную аналогичную программу готовит к выпуску и BlackBerry. По данным разработчиков, сервис будет глубоко интегрирован с интерфейсом устройства и сможет запускать голосом стандартные приложения: включать фонарик, добавлять события в органайзер, выполнять поисковые команды и активировать вызов абонента.

При этом крупнейшие игроки рынка, к которым можно отнести и российский «Яндекс», не скрывают, что появление массовых сервисов — лишь дополнительная возможность обучать не идеальные на данный момент речевые технологии. Постоянное тестирование услуги позволит развить их до того уровня, когда количество ошибок в распознавании речи будет сведено к арифметической погрешности. Пока это не произошло, трудно говорить о том, что речевое управление сможет обогнать по популярности ручное. А это критическая необходимость для так называемых носимых устройств — технологичных очков и часов.

Активнее всего крупнейшие компании разработчиков по всему миру внедряют голосовой поиск и занимаются разработкой

и обучением голосовых помощников, которые взаимодействуют
с пользователем.

Александр Набатов

Текст опубликован в газете «Деловой Омск» №43 (047) 11 ноября

Добавить комментарий
Олимпийская чемпионка Вера Бирюкова: «Чащина и Канаева — великие, но у меня другой кумир»

Олимпийская чемпионка Вера Бирюкова: «Чащина и Канаева — великие, но у меня другой кумир»

Омская спортсменка вспомнила, как пришла в художественную гимнастику и рассказала о своих талисманах.

Нобель навека: что вы знаете о самой престижной международной премии?

Нобель навека: что вы знаете о самой престижной международной премии?

Завтра, 10 декабря, состоится церемония вручения Нобелевской премии, присуждаемой, согласно завещанию основателя, за выдающиеся достижения в области физики и химии, физиологии и медицины, литературы, экономики, а ...

Режиссер, снявший «28 панфиловцев»: «Как так, что человек из Омска будет снимать большое кино. Это возможно?»

Режиссер, снявший «28 панфиловцев»: «Как так, что человек из Омска будет снимать большое кино. Это возможно?»

Сегодня в прокат выходит новый фильм о войне. Режиссером кинокартины стал омич Ким Дружинин (совместно с Андреем Шальопа). Премьера на больших экранах совпала с 32-м днем рождения кинематографиста-земляка, но сам ...

Будь мужиком!

Будь мужиком!

Тот, кто считает ноябрь самым скучным месяцем, просто не читал нашего проекта. В честь Всемирного дня мужчин мы запускаем «Брутальный сезон» и делимся горячими спецпредложениями от известных омских ...

5 фактов о блогерах, сколотивших состояние на YouTubeВидео

5 фактов о блогерах, сколотивших состояние на YouTube

«Новый Омск» выяснил, про что нужно снимать видеоролики, чтобы стать долларовым миллионером.

Омичи, которые смогли: топ-10 «засветившихся» на телеэкране

Омичи, которые смогли: топ-10 «засветившихся» на телеэкране

Вспоминаем самые яркие выступления наших земляков, которые попали в эфир федеральных каналов и добавили к образу любимого города несколько незабываемых штрихов.

Где омичам погулять в Новый год: карта праздничных мероприятий

Где омичам погулять в Новый год: карта праздничных мероприятий

«Новый Омск» выяснил, где горожанам можно отметить главный праздник.

Художница-портретист Катерина Балинская: «Вдохновение всегда в людях, смотрю на их лица и слушаю их голоса»

Художница-портретист Катерина Балинская: «Вдохновение всегда в людях, смотрю на их лица и слушаю их голоса»

Создатель паблика СTHRN и художница-портретист Катерина Балинская рассказала «Классу» о своем творчестве и отношении к современному искусству.

Киркоров, Леннон, Кобейн и другие известные плагиатчики

Киркоров, Леннон, Кобейн и другие известные плагиатчики

Пять фактов о неосознанном музыкальном плагиате, вошедших в историю.

Артем Клименко, бас-гитарист «АлоэВера»: «В личку Вере шлют гениталии. А все, что помимо, — может быть использовано для песни»

Артем Клименко, бас-гитарист «АлоэВера»: «В личку Вере шлют гениталии. А все, что помимо, — может быть использовано для песни»

Музыканты группы «АлоэВера» рассказали «Классу» о ценителях винила, самой популярной песне и ненависти к собственным клипам.

По примеру премьера: Топ-10 зеркал для фото в Омске

По примеру премьера: Топ-10 зеркал для фото в Омске

«Класс» пробежался по инстаграмам омичей и выяснил, какое оно — омское зазеркалье.

Ноябрьнуло: в Омске прошел III фестиваль современного искусства

Ноябрьнуло: в Омске прошел III фестиваль современного искусства

Лофт, самокаты и баблы. О том, каким был ежегодный фестиваль «НОЯБРЬ», — в нашем репортаже.

Ой, мамочки: женщины, давшие жизнь известным омичам (ФОТО)Фото

Ой, мамочки: женщины, давшие жизнь известным омичам (ФОТО)

По случаю Дня матери мы узнали, о чем грустят и смеются мамы губернатора Виктора Назарова, предпринимательницы Екатерины Вахрушевой, дизайнера Анны Долганевой, ресторатора Юрия Чащина и других успешных людей.

Маме привет от «Нового Омска» (фото)Фото

Маме привет от «Нового Омска» (фото)

Раз в году, в День матери, корреспонденты «Нового Омска» воспользовались служебным положением и передали привет своим мамам через сайт. Ведь в погоне за лидерством мы не всегда уделяем им должное ...

Чем бы дяди ни тешились: новогодние корпоративы в Госдуме (ВИДЕО) Видео

Чем бы дяди ни тешились: новогодние корпоративы в Госдуме (ВИДЕО)

«Новый Омск» посмотрел, как проходили капустники в зале заседаний, и оценил таланты депутатов Госдумы РФ.