13 ноября 2014 06.09Общество

Преимущества голоса

Преимущества голоса

Компания «Яндекс» в 2014 году представила новые разработки в области речевых технологий: голосовую активацию, выделение смысловых объектов из текста и синтез речи. Все три функции доступны в виде библиотеки SpeechKit Mobile SDK и облачной платформы SpeechKit Cloud. Эти технологии не только позволят клиентам взаимодействовать с мобильными приложениями компании, но и существенно расширят возможности продуктов для сторонних разработчиков программ и мобильных приложений.

Речевые технологии можно использовать в широком спектре продуктов от игр до навигационных систем. Они применимы в медицине (для протоколирования операций) и телефонии (для автоматизации работы колл-центров). Платформу можно внедрить в бытовые приборы, автомобили, «умные дома» и т. д.

В «Яндексе» много экспериментируют с голосовыми сервисами и разработали новое демонстрационное приложение — «Яндекс. Диктовка». В ней сочетаются все новые технологии работы с голосом.

Массовое внедрение

Напомним, что российская компания «Яндекс» представила технологию распознавания речи еще в 2013 году. Она понимает запросы на русском и турецком языках. Сейчас ее используют 500 мобильных приложений от многих разработчиков, а также устройства 600 компаний. Качество распознавания зависит от тематики запроса. Для географических названий оно составляет 95%, для коротких фраз — 88%, для текстов вроде заметок и СМС — 82%.

«При проектировании голосовых интерфейсов хорошей аналогией является разговор двух людей. Для начала нужно обратить на себя внимание и позвать человека по имени. А значит, первым важным свойством интерфейсов можно считать умение активироваться с помощью голоса. Чтобы разговор состоялся, собеседник должен говорить с нами на одном языке и понимать нашу речь. Поэтому второе свойство заключается в том, что сервисы должны уметь распознавать речь и отвечать на наши сообщения, а также понимать смысл сказанного», — говорит Денис Филиппов, занимающийся в компании развитием речевых технологий и продуктов.

Эксперт объясняет, что уровень голосовых технологий уже достаточен для развития интерфейсов в массовых приложениях и сервисах. А в будущем такое взаимодействие будет максимально похожим на общение с людьми, что сделает его максимально простым.

«Самое сложное — обеспечить высокий уровень качества. Для этого нам пришлось провести длительное обучение наших систем распознавания голоса. Акустическую модель мы обучали на прослушивании 500 часов размеченной вручную речи, а языковую — на поисковых запросах и текстах из интернета. Суммарный объем текстового корпуса — 4 млрд слов. Это в 22 тысячи раз больше, чем слов в романе «Война и мир», — рассказывает Филиппов.

Мобильное приложение «Яндекс. Диктовка» позволяет наговаривать устройству текст и редактировать его с помощью голоса. Приложение умеет активировать голосовой ввод по команде «Яндекс, записывай», а для редактирования текстов есть стандартный набор голосовых команд, благодаря которым приложение может справиться не только с расстановкой знаков препинания, но даже поставить в нужном месте веселый смайл. После написания текста пользователь может скомандовать прочитать сообщение или отправить его по почте, в виде СМС и сохранить как заметку.

«Наша задача — в будущем перевести спонтанную речь в текст. Это может иметь широкое применение в различных сферах жизни. Например, все мы проводим деловые встречи, и было бы здорово по их окончании получить текстовый протокол переговоров. Но эта задача не решена еще никем в мире, мы только движемся к ее решению», — подчеркнул Денис Филиппов.

Замена ручного управления

Крупнейшие компании разработчиков по всему миру стараются решить схожие задачи. Активнее всего мобильные вендоры внедряют голосовой поиск и занимаются разработкой и обучением голосовых помощников, которые взаимодействуют с пользователем, отвечают на его вопросы и поисковые запросы. Потребительская популярность таких продуктов позволяет компаниям-разработчикам ожидать увеличения продаж своих устройств, поэтому они уделяют все большее внимание улучшению подобных сервисов.

Самым известным ассистентом можно считать Siri, реализованный компанией Apple в iOS начиная с пятой версии. Аналогами лидера являются андроидовский Google Now, который активируется в последней версии прошивки командой Ok, Google, и ассистент Cortana, созданный корпорацией Microsoft для платформы Windows Phone.

До конца года собственную аналогичную программу готовит к выпуску и BlackBerry. По данным разработчиков, сервис будет глубоко интегрирован с интерфейсом устройства и сможет запускать голосом стандартные приложения: включать фонарик, добавлять события в органайзер, выполнять поисковые команды и активировать вызов абонента.

При этом крупнейшие игроки рынка, к которым можно отнести и российский «Яндекс», не скрывают, что появление массовых сервисов — лишь дополнительная возможность обучать не идеальные на данный момент речевые технологии. Постоянное тестирование услуги позволит развить их до того уровня, когда количество ошибок в распознавании речи будет сведено к арифметической погрешности. Пока это не произошло, трудно говорить о том, что речевое управление сможет обогнать по популярности ручное. А это критическая необходимость для так называемых носимых устройств — технологичных очков и часов.

Активнее всего крупнейшие компании разработчиков по всему миру внедряют голосовой поиск и занимаются разработкой

и обучением голосовых помощников, которые взаимодействуют
с пользователем.

Александр Набатов

Текст опубликован в газете «Деловой Омск» №43 (047) 11 ноября

Добавить комментарий
Почти чеховская история: в «Галерке» прошла премьера спектакля «В поисках радости»

Почти чеховская история: в «Галерке» прошла премьера спектакля «В поисках радости»

Ее поставил главный режиссер и художественный руководитель театра Владимир Витько.

Арсений Попов, актер шоу «Импровизация»: «Уезжать из Омска было тяжело. Но иначе вы бы не брали у меня интервью»

Арсений Попов, актер шоу «Импровизация»: «Уезжать из Омска было тяжело. Но иначе вы бы не брали у меня интервью»

Участник популярного шоу на ТНТ рассказал «Классу» об омской театральной школе, хейтерах и шутках под разрядом тока.

Оля Слово, основатель школы стилистов Self Made Studio: «Мода современна — стиль вечен»Фото

Оля Слово, основатель школы стилистов Self Made Studio: «Мода современна — стиль вечен»

Оля побывала в Омске в рамках образовательного проекта GTOUR-2017 и рассказала, как создала школу стилистов и персональных шоперов, а затем запустила альтернативное печатное издание о моде и культуре.

Вес_имеем: Дневники худеющих

Вес_имеем: Дневники худеющих

О мотивации, правильных привычках и о том, каково это — ходить в гости к Шлеменко по утрам.

Георгий Яшин, создатель бренда Ziq & Yoni и первой сникер-химчистки: «Мы не хотели работать на дядь, мы сами стали дядями»

Георгий Яшин, создатель бренда Ziq & Yoni и первой сникер-химчистки: «Мы не хотели работать на дядь, мы сами стали дядями»

Москвич без высшего образования, но с двумя работающими бизнес-проектами рассказал, как искать, находить и реализовывать идеи для организации и раскрутки своего дела.

Тест:  Вы гопник или нет?

Тест: Вы гопник или нет?

Приближается весна, которая выведет на улицы Омска не только женщин в миниюбках и любителей субботников, но и истосковавшихся за зиму по свежему воздуху представителей гоп-культуры.

Бикини по весне: в Омске прошел кубок по бодибилдингу и фитнесу

Бикини по весне: в Омске прошел кубок по бодибилдингу и фитнесу

18 марта в «Химике» состоялись соревнования по бодибилдингу, бодифитнесу, фитнесу и фитнес-бикини. Жители Омска, Новосибирска, Екатеринбурга, Тюмени, Красноярска выступили в 13 номинациях, а ...

«Обрехтить» Ремарка: «Три товарища» на омской сцене

«Обрехтить» Ремарка: «Три товарища» на омской сцене

В омском драмтеатре состоялась премьера спектакля по культовому произведению Эриха Марии Ремарка.

Из Америки в Омск: Велоtrip 19 века

Из Америки в Омск: Велоtrip 19 века

Какой увидел Сибирь путешественник Томас Ален.

Омские реликвии: 10 самых дорогих коллекционных вещей на продажу

Омские реликвии: 10 самых дорогих коллекционных вещей на продажу

«Класс» узнал, что и за какие деньги выставляют местные коллекционеры.

Кристина Соловьева, модельер: «Магазин одежды для кукол имел оглушительный успех»

Кристина Соловьева, модельер: «Магазин одежды для кукол имел оглушительный успех»

О коллекционных моделях, модных коллекциях и хобби, переросшем в бизнес - в нашем интервью.

#ВЕС_ИМЕЕМ: Grandиозный Fitness

#ВЕС_ИМЕЕМ: Grandиозный Fitness

Кирилл Хариби, Сюзанна Егиян и Евгений Долганев на пути к идеальному телу.

Регина Тодоренко, «Орел и Решка»: «Вижу своего парня трижды в месяц»

Регина Тодоренко, «Орел и Решка»: «Вижу своего парня трижды в месяц»

Ведущая и путешественница рассказала «Классу», чему удивляться, когда объездил целый мир.

Похудение под прицелом

Похудение под прицелом

Жизнь замечательных людей, или Каково худеть под пристальными взорами любопытствующих. Часть первая.

Евгения Деник, автор проекта WEDDING FAST DATING: «Мы приглашаем на свидания уже помолвленные пары»

Евгения Деник, автор проекта WEDDING FAST DATING: «Мы приглашаем на свидания уже помолвленные пары»

Об уникальном для Омска мероприятии «Классу» рассказали свадебный организатор Евгения Деник и ведущий Алексей Куликов.