Четверг, 19 сентября 2024 года
Выбор редакции

Новости сегодня

21 : 25
Магнитные бури: Как подготовиться и пережить сильные гeoмагнитные колебания
20 : 05
Казнь пейджером: Израиль смог дистанционно взорвать сотни людей «Хезболлы» за секунду
18 : 10
Белграду придется выбрать между Западом и Россией
13 : 45
Галкин* использует концерт для антироссийских идей, — СМИ
13 : 44
Гороскоп по знакам Зодиака на 20 сентября 2024 года подскажет, чего не стоит делать в этот день
13 : 43
День рекрутера, День риса и другие праздники, которые отмечают 20 сентября 2024 года
13 : 41
Мужской гороскоп на 20 сентября 2024 года поможет избежать неприятностей
13 : 39
Какой праздник сегодня, 20 сентября 2024 года: церковь готовится к Рождеству Пресвятой Богородицы и поминает святых
13 : 38
Какие праздники отмечают сегодня в России 20 сентября 2024 года
13 : 37
Православная церковь России 20 сентября 2024 года отмечает Луков день
Больше новостей

Распознавание речи на 25% улучшил ИИ в «VK Видео»

Распознавание речи на 25% улучшил ИИ в «VK Видео»

Сервис «VK Видео» внедрил новые алгоритмы искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте. Точность анализа и расшифровки выросла на 25 %, кроме того, нейросети теперь знают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.

Автоматические субтитры генерируются с помощью ML-моделей, которые создают текст и расставляют знаки препинания, синхронизируют его с видео. Для повышения точности аудиопоток проходит через несколько этапов обработки. Нейросеть отсеивает сторонние шумы, распознает речь и превращает её в текст. После чего подключаются модели пунктуации и денормализации, которые превращают набор из распознанных слов в удобный, читаемый текст. Потом ИИ синхронизирует получившийся текст с аудиодорожкой. Все это позволяет субтитрам быть понятными и удобными как в профессиональных роликах, так и любительских видео.

В ближайшее время нейросети научатся разделять речь разных спикеров на отдельные реплики, что упростит восприятие и чтение субтитров.

Популярность субтитров растет. Доля пользователей, использующих эту функцию в веб-версии, только за последний месяц увеличилась на 28 %, и сейчас субтитрами пользуются 11 % всей аудитории «VK Видео». Технология помогает людям с нарушениями слуха, а также удобна для просмотра видео в условиях, когда звук включать нежелательно.

Источник: CNews


Новости партнеров