Понедельник, 23 декабря 2024 года
Выбор редакции

Нейросеть от Microsoft научили распознавать речь не хуже людей

Нейронные сети в наши дни по-прежнему остаются той самой отраслью высоких технологий, которая двигает вперёд не только их разработчиков, но и всё человечество. Данные зачатки искусственного интеллекта практически каждый месяц показывают новые удивительные возможности машинного обучения, чем определённо стоит гордиться их разработчикам. Сегодня, одна из таких систем показала способность распознавать речь с невиданной до этого точностью.

В конце прошлого года Microsoft представила алгоритм распознавания речи, который ошибается не чаще, чем профессиональный стенографист с коэффициентом ошибочных слов 5.9%. Теперь специалистам компании удалось снизить процент ошибок до рекордных 5.1%. При такой точности можно говорить о том, что система достигла уровня человека.

За последний год Microsoft улучшила свой результат на 12%. Компания использует искусственную нейронные сети и акустические модели, постоянно совершенствуя их. В частности, искусственный интеллект научился анализировать контекст и предсказывать, какие слова или фразы могут последовать дальше. Таким образом повышается точность расшифровки аудиозаписи. Эффективность таких систем проверяют на сборнике из 2400 записей телефонных разговоров на общие темы, этот тест называется Switchboard.

Показатель в 5.1% ошибок сопоставим с результатами работы нескольких специалистов, которым разрешили прослушать аудиозапись несколько раз и общаться друг с другом. Если Microsoft планирует использовать алгоритм в своих сервисах, скоро голосовой помощник Cortana станет лучше понимать пользователей. Технология также может найти применение в офисном пакете компании (например, для перевода презентаций) и Microsoft Cognitive Services.


Новости партнеров