Сервис «нейродубляжа» ElevenLabs представил модель для преобразования речи в текст
Поддерживает 99 языков, в том числе русский.
Источник: ElevenLabs
- Scribe v1 — первая для ElevenLabs модель для преобразования речи в текст, рассказала компания. Она поддерживает 99 языков, в том числе русский.
- Сервис разделит речь дикторов, чтобы было понятно, кто говорит, добавит временные метки на уровне слов для «точных субтитров» и маркировку «аудиособытий», например смех аудитории, пишет TechCrunch.
- Разработчики могут использовать Scribe через API. Создатели контента и компании — через панель управления ElevenLabs. Согласно инструкции, нужно выбрать Speech to Text, затем нажать на кнопку “Transcribe files” и загрузить видео- или аудиофайл.
Источник: ElevenLabs
- ElevenLabs стал известен благодаря функции «нейродубляжа» видео на разные языки. В ноябре 2024-го сервис представил функцию создания подкастов из текстовых файлов с двумя «ИИ-ведущими», а в декабре выпустил Flash v2.5 с «самой низкой задержкой» озвучивания текста среди своих моделей и поддержкой русского языка.
- В январе 2025 года компания привлекла $180 млн. По итогам раунда инвесторы оценили стартап в $3,3 млрд — втрое больше, чем годом ранее.
99 комментариев