13 ноября 2014 06.09Общество

Преимущества голоса

Преимущества голоса

Компания «Яндекс» в 2014 году представила новые разработки в области речевых технологий: голосовую активацию, выделение смысловых объектов из текста и синтез речи. Все три функции доступны в виде библиотеки SpeechKit Mobile SDK и облачной платформы SpeechKit Cloud. Эти технологии не только позволят клиентам взаимодействовать с мобильными приложениями компании, но и существенно расширят возможности продуктов для сторонних разработчиков программ и мобильных приложений.

Речевые технологии можно использовать в широком спектре продуктов от игр до навигационных систем. Они применимы в медицине (для протоколирования операций) и телефонии (для автоматизации работы колл-центров). Платформу можно внедрить в бытовые приборы, автомобили, «умные дома» и т. д.

В «Яндексе» много экспериментируют с голосовыми сервисами и разработали новое демонстрационное приложение — «Яндекс. Диктовка». В ней сочетаются все новые технологии работы с голосом.

Массовое внедрение

Напомним, что российская компания «Яндекс» представила технологию распознавания речи еще в 2013 году. Она понимает запросы на русском и турецком языках. Сейчас ее используют 500 мобильных приложений от многих разработчиков, а также устройства 600 компаний. Качество распознавания зависит от тематики запроса. Для географических названий оно составляет 95%, для коротких фраз — 88%, для текстов вроде заметок и СМС — 82%.

«При проектировании голосовых интерфейсов хорошей аналогией является разговор двух людей. Для начала нужно обратить на себя внимание и позвать человека по имени. А значит, первым важным свойством интерфейсов можно считать умение активироваться с помощью голоса. Чтобы разговор состоялся, собеседник должен говорить с нами на одном языке и понимать нашу речь. Поэтому второе свойство заключается в том, что сервисы должны уметь распознавать речь и отвечать на наши сообщения, а также понимать смысл сказанного», — говорит Денис Филиппов, занимающийся в компании развитием речевых технологий и продуктов.

Эксперт объясняет, что уровень голосовых технологий уже достаточен для развития интерфейсов в массовых приложениях и сервисах. А в будущем такое взаимодействие будет максимально похожим на общение с людьми, что сделает его максимально простым.

«Самое сложное — обеспечить высокий уровень качества. Для этого нам пришлось провести длительное обучение наших систем распознавания голоса. Акустическую модель мы обучали на прослушивании 500 часов размеченной вручную речи, а языковую — на поисковых запросах и текстах из интернета. Суммарный объем текстового корпуса — 4 млрд слов. Это в 22 тысячи раз больше, чем слов в романе «Война и мир», — рассказывает Филиппов.

Мобильное приложение «Яндекс. Диктовка» позволяет наговаривать устройству текст и редактировать его с помощью голоса. Приложение умеет активировать голосовой ввод по команде «Яндекс, записывай», а для редактирования текстов есть стандартный набор голосовых команд, благодаря которым приложение может справиться не только с расстановкой знаков препинания, но даже поставить в нужном месте веселый смайл. После написания текста пользователь может скомандовать прочитать сообщение или отправить его по почте, в виде СМС и сохранить как заметку.

«Наша задача — в будущем перевести спонтанную речь в текст. Это может иметь широкое применение в различных сферах жизни. Например, все мы проводим деловые встречи, и было бы здорово по их окончании получить текстовый протокол переговоров. Но эта задача не решена еще никем в мире, мы только движемся к ее решению», — подчеркнул Денис Филиппов.

Замена ручного управления

Крупнейшие компании разработчиков по всему миру стараются решить схожие задачи. Активнее всего мобильные вендоры внедряют голосовой поиск и занимаются разработкой и обучением голосовых помощников, которые взаимодействуют с пользователем, отвечают на его вопросы и поисковые запросы. Потребительская популярность таких продуктов позволяет компаниям-разработчикам ожидать увеличения продаж своих устройств, поэтому они уделяют все большее внимание улучшению подобных сервисов.

Самым известным ассистентом можно считать Siri, реализованный компанией Apple в iOS начиная с пятой версии. Аналогами лидера являются андроидовский Google Now, который активируется в последней версии прошивки командой Ok, Google, и ассистент Cortana, созданный корпорацией Microsoft для платформы Windows Phone.

До конца года собственную аналогичную программу готовит к выпуску и BlackBerry. По данным разработчиков, сервис будет глубоко интегрирован с интерфейсом устройства и сможет запускать голосом стандартные приложения: включать фонарик, добавлять события в органайзер, выполнять поисковые команды и активировать вызов абонента.

При этом крупнейшие игроки рынка, к которым можно отнести и российский «Яндекс», не скрывают, что появление массовых сервисов — лишь дополнительная возможность обучать не идеальные на данный момент речевые технологии. Постоянное тестирование услуги позволит развить их до того уровня, когда количество ошибок в распознавании речи будет сведено к арифметической погрешности. Пока это не произошло, трудно говорить о том, что речевое управление сможет обогнать по популярности ручное. А это критическая необходимость для так называемых носимых устройств — технологичных очков и часов.

Активнее всего крупнейшие компании разработчиков по всему миру внедряют голосовой поиск и занимаются разработкой

и обучением голосовых помощников, которые взаимодействуют
с пользователем.

Александр Набатов

Текст опубликован в газете «Деловой Омск» №43 (047) 11 ноября

Добавить комментарий
Во славу антихайпа: Гнойный в ОмскеВидео

Во славу антихайпа: Гнойный в Омске

Репортаж с первого концерта Славы Машнова в Омске. Публику послал, хорька приласкал, очки не снял.

Преображение 2.0: симфония красоты

Преображение 2.0: симфония красоты

О тенденциях сезона осень-зима'17-18 в косметологии, стрижках, окрашивании, маникюре и визаже. Много важных советов и результат налицо — от специалистов студии «Монро» и мобильной имидж-студии ...

Шедевры Эрмитажа в Омске

Шедевры Эрмитажа в Омске

Рассказываем, какие предметы можно увидеть на выставке в музее им. Врубеля.

Преображение 2.0: как реанимировать кожу за час

Преображение 2.0: как реанимировать кожу за час

Как Николай Рябов и Ольга Алексеева в гости к «Мадам Ву» ходили. О пилингах, масках и чудесах.

Что покажут и расскажут омичам в парке «Россия — моя история»Видео

Что покажут и расскажут омичам в парке «Россия — моя история»

«Новый Омск» приводит любопытные экспонаты и мифы, которые в музее стремятся развенчать.

Владимир Котляров, «Порнофильмы»: «Цой мотивировал, я тоже стараюсь это делать. А Бродский ныл»

Владимир Котляров, «Порнофильмы»: «Цой мотивировал, я тоже стараюсь это делать. А Бродский ныл»

Фронтмен панк-группы рассказал «Классу» о классиках и их местах на корабле современности, протестах против системы и экстремизме.

Преображение 2.0: как Ольга Алексеева и Николай Рябов от рук отбивались

Преображение 2.0: как Ольга Алексеева и Николай Рябов от рук отбивались

Впечатляющие результаты героев, выдержавших одну из самых эффективных процедур текущего сезона.

Как за 15 минут сделать зубы белее?

Как за 15 минут сделать зубы белее?

Об улыбках Николая Рябова и Ольги Алексеевой — со всех сторон.

Какими судьбами: Степан Бонковский приехал в семью «Народного героя» Антона Кудрявцева

Какими судьбами: Степан Бонковский приехал в семью «Народного героя» Антона Кудрявцева

Депутат поздравил самую известную в Омске многодетную семью с прибавлением. Месяц назад у Антона и Людмилы Кудрявцевых родился десятый ребенок.

Гуша Катушкин, музыкант: «Я — бабушка, продающая пирожки. Представитель очень малого шоу-бизнеса»Видео

Гуша Катушкин, музыкант: «Я — бабушка, продающая пирожки. Представитель очень малого шоу-бизнеса»

Автор и исполнитель вирусных хитов приехал в Омск и в преддверии концерта провел неформальную встречу.

Стать звездой: советы от кастинг-директора для тех, кто желает оказаться по ту сторону экрана

Стать звездой: советы от кастинг-директора для тех, кто желает оказаться по ту сторону экрана

Экс-омичка Елизавета Николаева провела мастер-класс в родном городе.

Тест: что вы знаете о революции 1917 года

Тест: что вы знаете о революции 1917 года

Ура, товарищи! Свершилось! Сегодня отмечается 100 лет со дня Великой Октябрьской революции. Еще 30 лет назад в нашей стране любой от мала до велика знал о тех событиях практически все. «Новый Омск» ...

Не на «Жизнь», а на смерть, или Примерит ли Омск «Золотую маску» в двенадцатый раз?

Не на «Жизнь», а на смерть, или Примерит ли Омск «Золотую маску» в двенадцатый раз?

В 2018 году за престижную премию поборется спектакль «Жизнь» театра драмы. Наудачу вспоминаем всех обладателей «Золотой маски» в Омске.

Артем Шаров, фронтмен GoodTimes: «И как мы только ни выступали: и в трусах, и без трусов, и по потолку лазали»

Артем Шаров, фронтмен GoodTimes: «И как мы только ни выступали: и в трусах, и без трусов, и по потолку лазали»

Об отношениях в группе, новых клипах, фанатах и лифчиках на сцене — в нашем интервью с вокалистом эпатажной костромской группы.