ElevenLabs выпустила Flash v2.5 с «самой низкой задержкой» озвучивания текста среди моделей компании и поддержкой русского языка
Бесплатно можно ввести 10 тысяч знаков в месяц.
- Новые модели Flash v2 и Flash v2.5 озвучивают текст за 75 миллисекунд, рассказали в компании. При этом v2 поддерживает только английский язык, а v2.5 — 32 языка, включая русский.
- ElevenLabs предлагает использовать модели с низкой задержкой для создания голосовых помощников, которые смогут поддерживать «естественный ритм» диалога, и для озвучивания игровых персонажей.
- Модель смогла сгенерировать аудио для 60 символов на русском языке меньше чем за две секунды, ниже можно послушать результат.
Скринкаст vc.ru
- Найти ИИ-агента, который адаптирован для русского или других языков, можно в библиотеке голосов. В строке поиска нужно ввести язык и выбрать понравившийся голос из списка кнопкой Add.
Агенты, адаптированные для русского языка. Скриншот vc.ru
- Модель Flash можно протестировать на платформе ElevenLabs для создания ИИ-агентов (не доступно с российских IP-адресов). Бесплатно дают 10 тысяч кредитов в месяц. Платная подписка начинается от $5 в месяц (510 рублей по курсу ЦБ на 19 декабря 2024 года), в ней уже от 30 тысяч кредитов и лицензия на использование голосов в коммерческих целях.
- ElevenLabs основали в 2022 году бывший ML-инженер Google Пётр Дабковски и бывший разработчик стратегий развёртывания Palantir Мати Станишевски. Стартап стал известен благодаря функции «нейродубляжа» видео на разные языки. В июне 2023 года его оценивали в $100 млн. В январе 2024-го — в $1,1 млрд.
37 комментариев