13 ноября 2014 06.09

Преимущества голоса

Компания «Яндекс» в 2014 году представила новые разработки в области речевых технологий: голосовую активацию, выделение смысловых объектов из текста и синтез речи. Все три функции доступны в виде библиотеки SpeechKit Mobile SDK и облачной платформы SpeechKit Cloud. Эти технологии не только позволят клиентам взаимодействовать с мобильными приложениями компании, но и существенно расширят возможности продуктов для сторонних разработчиков программ и мобильных приложений.

Речевые технологии можно использовать в широком спектре продуктов от игр до навигационных систем. Они применимы в медицине (для протоколирования операций) и телефонии (для автоматизации работы колл-центров). Платформу можно внедрить в бытовые приборы, автомобили, «умные дома» и т. д.

В «Яндексе» много экспериментируют с голосовыми сервисами и разработали новое демонстрационное приложение — «Яндекс. Диктовка». В ней сочетаются все новые технологии работы с голосом.

Массовое внедрение

Напомним, что российская компания «Яндекс» представила технологию распознавания речи еще в 2013 году. Она понимает запросы на русском и турецком языках. Сейчас ее используют 500 мобильных приложений от многих разработчиков, а также устройства 600 компаний. Качество распознавания зависит от тематики запроса. Для географических названий оно составляет 95%, для коротких фраз — 88%, для текстов вроде заметок и СМС — 82%.

«При проектировании голосовых интерфейсов хорошей аналогией является разговор двух людей. Для начала нужно обратить на себя внимание и позвать человека по имени. А значит, первым важным свойством интерфейсов можно считать умение активироваться с помощью голоса. Чтобы разговор состоялся, собеседник должен говорить с нами на одном языке и понимать нашу речь. Поэтому второе свойство заключается в том, что сервисы должны уметь распознавать речь и отвечать на наши сообщения, а также понимать смысл сказанного», — говорит Денис Филиппов, занимающийся в компании развитием речевых технологий и продуктов.

Эксперт объясняет, что уровень голосовых технологий уже достаточен для развития интерфейсов в массовых приложениях и сервисах. А в будущем такое взаимодействие будет максимально похожим на общение с людьми, что сделает его максимально простым.

«Самое сложное — обеспечить высокий уровень качества. Для этого нам пришлось провести длительное обучение наших систем распознавания голоса. Акустическую модель мы обучали на прослушивании 500 часов размеченной вручную речи, а языковую — на поисковых запросах и текстах из интернета. Суммарный объем текстового корпуса — 4 млрд слов. Это в 22 тысячи раз больше, чем слов в романе «Война и мир», — рассказывает Филиппов.

Мобильное приложение «Яндекс. Диктовка» позволяет наговаривать устройству текст и редактировать его с помощью голоса. Приложение умеет активировать голосовой ввод по команде «Яндекс, записывай», а для редактирования текстов есть стандартный набор голосовых команд, благодаря которым приложение может справиться не только с расстановкой знаков препинания, но даже поставить в нужном месте веселый смайл. После написания текста пользователь может скомандовать прочитать сообщение или отправить его по почте, в виде СМС и сохранить как заметку.

«Наша задача — в будущем перевести спонтанную речь в текст. Это может иметь широкое применение в различных сферах жизни. Например, все мы проводим деловые встречи, и было бы здорово по их окончании получить текстовый протокол переговоров. Но эта задача не решена еще никем в мире, мы только движемся к ее решению», — подчеркнул Денис Филиппов.

Замена ручного управления

Крупнейшие компании разработчиков по всему миру стараются решить схожие задачи. Активнее всего мобильные вендоры внедряют голосовой поиск и занимаются разработкой и обучением голосовых помощников, которые взаимодействуют с пользователем, отвечают на его вопросы и поисковые запросы. Потребительская популярность таких продуктов позволяет компаниям-разработчикам ожидать увеличения продаж своих устройств, поэтому они уделяют все большее внимание улучшению подобных сервисов.

Самым известным ассистентом можно считать Siri, реализованный компанией Apple в iOS начиная с пятой версии. Аналогами лидера являются андроидовский Google Now, который активируется в последней версии прошивки командой Ok, Google, и ассистент Cortana, созданный корпорацией Microsoft для платформы Windows Phone.

До конца года собственную аналогичную программу готовит к выпуску и BlackBerry. По данным разработчиков, сервис будет глубоко интегрирован с интерфейсом устройства и сможет запускать голосом стандартные приложения: включать фонарик, добавлять события в органайзер, выполнять поисковые команды и активировать вызов абонента.

При этом крупнейшие игроки рынка, к которым можно отнести и российский «Яндекс», не скрывают, что появление массовых сервисов — лишь дополнительная возможность обучать не идеальные на данный момент речевые технологии. Постоянное тестирование услуги позволит развить их до того уровня, когда количество ошибок в распознавании речи будет сведено к арифметической погрешности. Пока это не произошло, трудно говорить о том, что речевое управление сможет обогнать по популярности ручное. А это критическая необходимость для так называемых носимых устройств — технологичных очков и часов.

Активнее всего крупнейшие компании разработчиков по всему миру внедряют голосовой поиск и занимаются разработкой

и обучением голосовых помощников, которые взаимодействуют
с пользователем.

Александр Набатов

Текст опубликован в газете «Деловой Омск» №43 (047) 11 ноября

Самое актуальное в рубрике: Общество

Больше интересного в жанре: Новости

Нашли опечатку? Выделите ее и нажмите Ctrl+Enter

Теги: Интернет , Голосовой сервис

Просмотры: 2520

Самое читаемое

«Любая сумма будет важна»: омичей просят поддержать семью погибшего мальчика

Трагедия на Иртыше: в Омском районе утонул 48‑летний мужчина

Омск вошел в топ городов по динамике запуска жилых проектов

Новости от партнеров

87151

Опубликован график отключения горячей воды в Омске: найдите в нем свой дом

Отключения продлятся с 19 мая по 24 августа.

707

Режиссер Сергей Члиянц: «Люди объелись картонного кино, но продолжают его смотреть»

Продюсер культовых фильмов «Бумер», «Живой», «Как я провел этим летом» Сергей Члиянц о государственных деньгах в кино, сценарном кризисе, режиссерах-самозванцах и подаренном ...

Wiki Омск

Сегодня
день рождения
отмечают

Поздравить

Губин Михаил Владимирович

Поздравить

Симаков Константин Николаевич

еще именинники

1595

«Коллеги»: студенты, тайга и первая любовь: как случайная книга привела к черно-белому открытию

Ведущая рубрики «КиНостальгия» Лидия Чесакова в День медика вспоминает фильм, который показывает врачей не в белых халатах, а в пути – сомневающихся, влюбленных, совершающих ошибки и совершающих ...

1673

Летнее солнцестояние - больше, чем просто длинный день: любопытные подробности

В этом году летнее солнцестояние наступит 21 июня. Нас ждет самый длинный день и самая короткая ночь.

2571

Герои Пушкина и новая этика. Все ли в порядке с Онегиным, Татьяной и другими персонажами? Мнение психолога

Консультирующий психолог, арт-терапевт Ирина Руденко рассмотрела героев пушкинских произведений с точки зрения современности.

2711

Дело «романтического стрелка»: что Евгению Онегину грозит в 2026 году за убийство Ленского

Что общего у выстрела на снегу и Уголовного кодекса 2026? Сколько получил бы Евгений Онегин, и принял бы суд во внимание в качестве меры смягчения «русскую хандру»? О вердикте и УДО — в ...

-->

2965

От «Сказки о рыбаке и рыбке» до «Конька горбунка»: завкафедрой русского языка и лингводидактики ОмГПУ Евгений Виданов - о загадках пушкинского наследия

Как Пушкин собирал материал для «Капитанской дочки» в Оренбурге? Почему его тексты понятны даже сегодня? И мог ли он написать «Конька‑горбунка»? Ответы филолога - в нашем материале.

2464

Пушкин на карте Омска: все улицы, переулки и учреждения в честь поэта

Имя Александра Сергеевича увековечено в Омске сразу в нескольких форматах: от крупной городской улицы и ведущих библиотек до мемориальных досок и тематических заведений. Рассказываем, какие объекты в Омске носят ...

3247

Тест: Пушкин — это не только «Онегин». 10 вопросов средней сложности для тех, кто читал хотя бы краткое содержание

Пройдемся по произведениям из школьной программы.

26271

«Желудок просвещенного человека»: кулинарный мир Пушкина от страсбургского пирога до печеной картошки

Александр Сергеевич Пушкин — это не только «солнце русской поэзии», но и, как выясняется, тонкий ценитель хорошей кухни.

27471

А почему он «наше все»? Тема недели - Пушкин

6 июня 1799 года родился Александр Пушкин. Если бы ученые изобрели лекарство от старения, а рыцари не изобрели бы «дворянскую честь» - «нашему всему» на этой неделе исполнилось бы 227 лет. ...

2630

Озеро Абрау, Малая Земля, шато Пино: куда сходить в Новороссийске? Проект с Двухметровым гидом

Бывший омич, а теперь лучший гид России Константин Аверин (известный как Двухметровый гид) в нашем проекте беседует с экскурсоводами из разных городов, которые рассказывают, что там стоит увидеть туристам.

49735

Анатомия экономики Омской области-2025: спецпроект о цифрах, за которыми стоят люди

А что если представить сложную региональную экономическую систему через более понятную нам анатомию человеческого тела? Тут же скучные бюрократические канцеляризмы начинают оживать, а груда сложных цифр ...