13 ноября 2014 06.09Общество

Преимущества голоса

Преимущества голоса

Компания «Яндекс» в 2014 году представила новые разработки в области речевых технологий: голосовую активацию, выделение смысловых объектов из текста и синтез речи. Все три функции доступны в виде библиотеки SpeechKit Mobile SDK и облачной платформы SpeechKit Cloud. Эти технологии не только позволят клиентам взаимодействовать с мобильными приложениями компании, но и существенно расширят возможности продуктов для сторонних разработчиков программ и мобильных приложений.

Речевые технологии можно использовать в широком спектре продуктов от игр до навигационных систем. Они применимы в медицине (для протоколирования операций) и телефонии (для автоматизации работы колл-центров). Платформу можно внедрить в бытовые приборы, автомобили, «умные дома» и т. д.

В «Яндексе» много экспериментируют с голосовыми сервисами и разработали новое демонстрационное приложение — «Яндекс. Диктовка». В ней сочетаются все новые технологии работы с голосом.

Массовое внедрение

Напомним, что российская компания «Яндекс» представила технологию распознавания речи еще в 2013 году. Она понимает запросы на русском и турецком языках. Сейчас ее используют 500 мобильных приложений от многих разработчиков, а также устройства 600 компаний. Качество распознавания зависит от тематики запроса. Для географических названий оно составляет 95%, для коротких фраз — 88%, для текстов вроде заметок и СМС — 82%.

«При проектировании голосовых интерфейсов хорошей аналогией является разговор двух людей. Для начала нужно обратить на себя внимание и позвать человека по имени. А значит, первым важным свойством интерфейсов можно считать умение активироваться с помощью голоса. Чтобы разговор состоялся, собеседник должен говорить с нами на одном языке и понимать нашу речь. Поэтому второе свойство заключается в том, что сервисы должны уметь распознавать речь и отвечать на наши сообщения, а также понимать смысл сказанного», — говорит Денис Филиппов, занимающийся в компании развитием речевых технологий и продуктов.

Эксперт объясняет, что уровень голосовых технологий уже достаточен для развития интерфейсов в массовых приложениях и сервисах. А в будущем такое взаимодействие будет максимально похожим на общение с людьми, что сделает его максимально простым.

«Самое сложное — обеспечить высокий уровень качества. Для этого нам пришлось провести длительное обучение наших систем распознавания голоса. Акустическую модель мы обучали на прослушивании 500 часов размеченной вручную речи, а языковую — на поисковых запросах и текстах из интернета. Суммарный объем текстового корпуса — 4 млрд слов. Это в 22 тысячи раз больше, чем слов в романе «Война и мир», — рассказывает Филиппов.

Мобильное приложение «Яндекс. Диктовка» позволяет наговаривать устройству текст и редактировать его с помощью голоса. Приложение умеет активировать голосовой ввод по команде «Яндекс, записывай», а для редактирования текстов есть стандартный набор голосовых команд, благодаря которым приложение может справиться не только с расстановкой знаков препинания, но даже поставить в нужном месте веселый смайл. После написания текста пользователь может скомандовать прочитать сообщение или отправить его по почте, в виде СМС и сохранить как заметку.

«Наша задача — в будущем перевести спонтанную речь в текст. Это может иметь широкое применение в различных сферах жизни. Например, все мы проводим деловые встречи, и было бы здорово по их окончании получить текстовый протокол переговоров. Но эта задача не решена еще никем в мире, мы только движемся к ее решению», — подчеркнул Денис Филиппов.

Замена ручного управления

Крупнейшие компании разработчиков по всему миру стараются решить схожие задачи. Активнее всего мобильные вендоры внедряют голосовой поиск и занимаются разработкой и обучением голосовых помощников, которые взаимодействуют с пользователем, отвечают на его вопросы и поисковые запросы. Потребительская популярность таких продуктов позволяет компаниям-разработчикам ожидать увеличения продаж своих устройств, поэтому они уделяют все большее внимание улучшению подобных сервисов.

Самым известным ассистентом можно считать Siri, реализованный компанией Apple в iOS начиная с пятой версии. Аналогами лидера являются андроидовский Google Now, который активируется в последней версии прошивки командой Ok, Google, и ассистент Cortana, созданный корпорацией Microsoft для платформы Windows Phone.

До конца года собственную аналогичную программу готовит к выпуску и BlackBerry. По данным разработчиков, сервис будет глубоко интегрирован с интерфейсом устройства и сможет запускать голосом стандартные приложения: включать фонарик, добавлять события в органайзер, выполнять поисковые команды и активировать вызов абонента.

При этом крупнейшие игроки рынка, к которым можно отнести и российский «Яндекс», не скрывают, что появление массовых сервисов — лишь дополнительная возможность обучать не идеальные на данный момент речевые технологии. Постоянное тестирование услуги позволит развить их до того уровня, когда количество ошибок в распознавании речи будет сведено к арифметической погрешности. Пока это не произошло, трудно говорить о том, что речевое управление сможет обогнать по популярности ручное. А это критическая необходимость для так называемых носимых устройств — технологичных очков и часов.

Активнее всего крупнейшие компании разработчиков по всему миру внедряют голосовой поиск и занимаются разработкой

и обучением голосовых помощников, которые взаимодействуют
с пользователем.

Александр Набатов

Текст опубликован в газете «Деловой Омск» №43 (047) 11 ноября

Добавить комментарий
6 дней, 19 театров, 14 стран: В Омске открыт V фестиваль «В гостях у Арлекина»

6 дней, 19 театров, 14 стран: В Омске открыт V фестиваль «В гостях у Арлекина»

Театры из из России и Беларуси, Армении и Болгарии, Ирана и Израиля, Казахстана, Китая, Польши, Словении, Финляндии, Франции и Японии прибыли в Омск. Фестиваль открылся традиционным шествием.

Андрей Заберти, «Свидание»: «Пометьте, у гитариста девушки нет. А этим туром еще и денежек заработаем...»

Андрей Заберти, «Свидание»: «Пометьте, у гитариста девушки нет. А этим туром еще и денежек заработаем...»

Трогательная, романтичная молодая группа «Свидание» рассказала «Классу» о повзрослевшей публике, стихах Макгрегора и глупостях.

Нелюбовный треугольник: велотур по ПДД

Нелюбовный треугольник: велотур по ПДД

Тест для автолюбителей, велосипедистов и пешеходов, крайне недолюбливающих друг друга.

Преображение: на сколько Андрей Маслов и Марина Хариби похудели за десять дней?

Преображение: на сколько Андрей Маслов и Марина Хариби похудели за десять дней?

Рассказываем, как ставились личные рекорды: главный врач не зря гарантировал результат.

Алексей Степочкин-Тищенков: «Вожатые омской школы получают до 24 тысяч в месяц»

Алексей Степочкин-Тищенков: «Вожатые омской школы получают до 24 тысяч в месяц»

О мире детей и вожатых, саморазвитии и немного о деньгах — в нашем интервью с создателем школы вожатых в Омске.

Двадцать дорог: первый экскурсионный флешмоб в Омске

Двадцать дорог: первый экскурсионный флешмоб в Омске

24 сентября в Омске пройдет экскурсионный флешмоб, в рамках которого омичи смогут посетить более двадцати экскурсий. Все они будут бесплатные.

Омичи будут отдыхать треть следующего года (КАЛЕНДАРЬ)Инфографика

Омичи будут отдыхать треть следующего года (КАЛЕНДАРЬ)

Из 365 дней 118 будут выходными, в том числе 27 — праздничными.

Красота без жертвФото

Красота без жертв

Участники проекта «За подарками» отправились исследовать салон красоты «Нимфа».

Энтеровирусная инфекция в Омске: как не заболеть и не заразить другихИнфографика

Энтеровирусная инфекция в Омске: как не заболеть и не заразить других

«Новый Омск» приводит рекомендации министра здравоохранения, врача и специалиста Роспотребнадзора.

Начало по-французски в омском ТЮЗе

Начало по-французски в омском ТЮЗе

Новый сезон театр откроет премьерой спектакля по мотивам пьесы Жана Батиста Мольера.

Преображение: Марина Хариби и Андрей Маслов на пути к идеалу

Преображение: Марина Хариби и Андрей Маслов на пути к идеалу

Один месяц, два героя, четыре этапа, один победитель. Вашему вниманию — очередной преобразующий проект «Нового Омска». Поехали!

Тысячи омичей вместе с LВидео

Тысячи омичей вместе с L'ONE танцевали локтями под первым снегом (ВИДЕО)

Несмотря на дождь и, по сообщениям очевидцев, даже снег, — омичи дождались артиста и отстояли концерт. Как это было — в нашей подборке.

Говорит и показывает: на три дня омские улицы станут площадкой для арт-экспериментов

Говорит и показывает: на три дня омские улицы станут площадкой для арт-экспериментов

С 8 по 10 сентября в рамках фестиваля современного искусства «Экспериментальные выходные» омичей приглашают на программы «Смотри!», «Говори!» и «Слушай!»

Александр Могилев, хореограф: «Мы оторвали у «запорожца» аккумулятор, раскидали ДВП у кинотеатра и стали танцевать на шапку»

Александр Могилев, хореограф: «Мы оторвали у «запорожца» аккумулятор, раскидали ДВП у кинотеатра и стали танцевать на шапку»

Топовый хореограф России рассказал «Классу» о столичных провинциалах и закулисье шоу «Танцы».