Интернет и IT

VK запускает видеозвонки с текстовой расшифровкой

Нейросети будут автоматически генерировать субтитры в процессе видеозвонков, а после пришлют в чат полный файл с текстовой расшифровкой сказанного.

На платформе «VK Звонки» появилась функция автоматического перевода звуковой дорожки видеовстречи в текст, который сохранится в чате после звонка. Об этом сказано на сайте VK.

Пользователи в процессе звонка могут запустить автоматические субтитры, которые продублируют речь участников видео-конференции.

После завершения созвона сервис пришлет в чат файл с текстовой расшифровкой фраз выступающих. В документе будут расставлены все тайм-коды и имена говоривших.

Запись очищается от фоновых звуков с помощью интеллектуального шумоподавления, затем нейросеть распознаёт слова, формирует из них текст и делит речь на предложения в соответствии с конкретным спикером. Нейросети постоянно совершенствуются и учатся в том числе на актуальной разговорной речи и сленге, — говорится в сообщении.

Новая функция будет полезна тем, кто ведет деловые встречи. Можно быстрее расшифровывать интервью, выделять ключевые тезисы, а также пересылать информацию коллегам, которые не смогли присутствовать на онлайн-собрании.

Субтитры пригодятся тем, у кого под рукой нет наушников, а включать звук в общественном месте при переговорах неудобно.

Кроме того, субтитры будут хорошим помощником для слабослышащих пользователей: они смогут участвовать во встречах без ограничений.

Комментарии

3
  • ООО ЕСС

    А ФСБшникам то как теперь будет хорошо и удобно. Не нужно скачивать и хранить объёмное видео разговора, скачал килобайтный файлик .txt

    Хошь - распечататй и в дело приложи, с видео так не сделаешь...