Разработчики Google усовершенствовали функцию распознавания голоса

Ранее руководитель компании Сундар Пичаи (Sundar Pichai) отмечал, что компьютеры все лучше распознают команды голосового ввода, а специалистам Google удалось сделать «настоящий прорыв» в этой сфере.

Согласно ежегодному отчету венчурного инвестора Мэри Микер (Mary Meeker) Internet Trends Report представленному в рамках ежегодной конференции Code Conference, машинные системы Google с точностью до 95% научились распознавать человеческую речь на английском языке. Они практически достигли уровня человеческого понимания.

Качественный прогресс компании в этом отношении также не вызывает сомнений. Точность распознавания отдельных лексических единиц улучшилась на 20% с 2013 года. Однако отдельные оговорки все еще встречаются, включая неправильные толкования значения слова. В процессе взаимодействия пользователя с компьютерной системой они, естественно, случаются гораздо чаще, чем в типичном диалоге между двумя людьми. Главной причиной такого недопонимания являются данные интернет-поиска, которые всегда соотносятся с объектами реального мира.

Однако это ничуть не уменьшает достижения Google, ведь, по словам Пичаи, «процент ошибок уменьшается даже в условиях шумной среды».

Усилия компании в сфере искусственного интеллекта очень значительны. Например, в результате глубокого изучения техники нейронного диаграммообразования разработчикам Google удалось максимально улучшить смарт-колонку Google Home. Она оснащена всего двумя микрофонами дальнего действия, однако по качеству и точности распознавания голоса пользователя они с успехом заменяют восемь микрофонов. Смарт-колонка также осуществляет функцию многопользовательской поддержки, которая состоит в одновременном распознавании шести пользователей и обеспечении сохранности результатов индивидуального взаимодействия с устройством.

Благодаря усилиям таких компаний, как Google и Apple в области машинного обучения перспектива использовать собственный телефон в качестве полноценного собеседника не кажется такой уж фантастической. Показательно, что пользователи все чаще прибегают к голосовому вводу в поисках нужной информации. Так количество голосовых запросов выросло до 20% от общего числа обращений на протяжении 2016 года.

Запись опубликована в рубрике Телефоны. Добавьте в закладки постоянную ссылку.