Руководитель команды разработки Siri раскрыл главные особенности своего творения

На вопрос о том, какой голосовой помощник лучший, незамедлительно последует ответ – Siri. Алекс Асеро, стоящий у руля команды разработчиков помощника раскрыл его самые главные преимущества.

Широкую известность персональному помощнику Siri, за разработкой которого стоит компания Apple принес большой уровень локализации. На сегодняшний день он получил поддержку 24 языков и различает 36 диалектов. К слову, его главные конкуренты – помощники Google Assistant и Alexa – понимают всего лишь пять и два языка соответственно.

С выходом ОС iOS 10.3 была представлена еще и поддержка шанхайского диалекта китайского языка, за счет чего использование Siri расширилось еще больше. В интервью информационному агентству Reuters глава подразделения голосового помощника Siri в компании Apple Алекс Асеро, пришедший в ряды разработчиков компании в 2013 году, поделился самыми главными преимуществами своей разработки.

Некоторое время разработкой Siri занималась сторонняя компания Nuance. Но несколько лет назад в Apple посчитали, что более целесообразно использовать собственную платформу, в основе которой находится машинное обучение, позволяющее постоянно улучшать возможности голосового помощника.

Алекс Асеро также объяснил, каким образом Siri обучают новому языку. Все начинается с поиска носителей языка, которые делают начитку различной информации и слов, используя при этом разные диалекты и акценты. Человеческая речь записывается, а затем транскрибируется другими людьми. Таким образом, обеспечивается правильность звучания всех слов так, как в обычных разговорах. Затем эти необработанные данные вводятся в алгоритмическую модель машинного обучения.

Модель компьютерного языка пытается предсказывать транскрипцию производительных потоков слов. Алгоритм автоматически улучшается с течением времени, поскольку он обучается при добавлении новых данных. Сначала Apple оптимизирует все эти данные, а затем переходит к следующему шагу.

Но после этого разработчики не переходят сразу к внедрению изменений в Siri. Вместо этого Apple добавляет поддержку нового языка как новую функцию голосового управления iOS и macOS, к которому можно получить доступ, нажав на кнопку с микрофоном на клавиатуре iPhone. Таким образом, Apple получает новые образцы речи, которые поступают в базу данных компании, сохраняя при этом анонимность пользователей.

Так как в новых образцах имеется большое количество шумов, разработчики Apple вручную их транскрибируют, затем используя эти данные для улучшения системы языковой модели. В докладе говорится, что на этом этапе происходит снижение ошибок восприятия системы в два раза.

Затем этот процесс повторяется до тех пор, пока в Apple не решат, что система работает достаточно точно и может быть внедрена в Siri . На этом же этапе происходит начитка данных, которые голосовой помощник использует для генерации ответов на запросы пользователей.

Таким образом, по завершению всех этапов подготовки выпускается обновление помощника в рамках обновления ОС. Возможности Siri на сегодняшний день достаточно широки, так как он может отвечать на различные вопросы. Но в то же время помощник все еще очень сильно зависит от разработчиков, так как база данных ответов и запросов создается вручную. Компания Apple стремится к тому, чтобы в будущем все действия людей в улучшении Siri выполнял искусственный интеллект, так как сейчас разработчикам приходится обновлять базы данных языков каждые две недели. Так что, разработка конечной технологии значительно сложнее, чем может показаться на первый взгляд.

Многие источники сообщают, что Apple готовит к выпуску серьезное улучшение Siri, которое будет представлено этой осенью вместе с новыми iPhone. Пока что неизвестно, какие именно технологии будут использовать, но, по всей видимости, купертиновцы уже делают первые шаги к своей конечной цели.

Запись опубликована в рубрике Новостной дайджест. Добавьте в закладки постоянную ссылку.