Понедельник, 19 мая 2025 года
Выбор редакции

Новости сегодня

00 : 35
Инфляция и зарплаты: экономические реалии, с которыми столкнулись россияне
22 : 50
В ГД предложили учесть надбавки за работу в праздники: что это значит для работников?
21 : 37
Исследование: метан из впадины Балтийского моря вызывает научный интерес
20 : 52
Госдума инициирует введение дополнительного отпуска для поддержки рождаемости в России
20 : 08
Европейская политика: Как Лиссабон и Владивосток становятся символами недоговоренности
19 : 57
Ликвидация Савченко: кто стоит за кулисами? Роль СБУ под вопросом
17 : 25
Сюрприз для россиян: полное ограничение для пенсионеров с квартирами!
13 : 01
Церковный праздник праведника Иова Многострадального 19 мая 2025 года: что можно делать в этот день
13 : 00
Мужской гороскоп на 19 мая 2025 года подскажет, как избежать необдуманных поступков
12 : 59
Гороскоп от Павла Глобы на 19 мая 2025 года дает представителям знаков зодиака еще один шанс переосмыслить жизнь
Больше новостей

Распознавание речи на 25% улучшил ИИ в «VK Видео»

Сервис «VK Видео» внедрил новые алгоритмы искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте. Точность анализа и расшифровки выросла на 25 %, кроме того, нейросети теперь знают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.

Автоматические субтитры генерируются с помощью ML-моделей, которые создают текст и расставляют знаки препинания, синхронизируют его с видео. Для повышения точности аудиопоток проходит через несколько этапов обработки. Нейросеть отсеивает сторонние шумы, распознает речь и превращает её в текст. После чего подключаются модели пунктуации и денормализации, которые превращают набор из распознанных слов в удобный, читаемый текст. Потом ИИ синхронизирует получившийся текст с аудиодорожкой. Все это позволяет субтитрам быть понятными и удобными как в профессиональных роликах, так и любительских видео.

В ближайшее время нейросети научатся разделять речь разных спикеров на отдельные реплики, что упростит восприятие и чтение субтитров.

Популярность субтитров растет. Доля пользователей, использующих эту функцию в веб-версии, только за последний месяц увеличилась на 28 %, и сейчас субтитрами пользуются 11 % всей аудитории «VK Видео». Технология помогает людям с нарушениями слуха, а также удобна для просмотра видео в условиях, когда звук включать нежелательно.

Источник: CNews


Новости партнеров