Voice Engine - Клонирование голоса на основе 15-секундного аудио c ChatGPT
Компания Open AI представила предварительную версию новой модели искусственного интеллекта "Voice Engine", интегрируемой с ChatGPT. В отличие от остальных моделей, она способна c поразительной точностью воссоздать голос, основываясь на аудио длинной всего лишь 15 секунд!
Где можно применить модель Voice Engine?
- Перевод видео и аудио подкастов на несколько языков (данная технология уже активно применяется HeyGen);
Помощь детям в обучении за счёт взаимодействия с учениками и создания персонализированных ответов в режиме реального времени;
Оказание помощи людям с ограниченными возможностями и пациентам имеющими проблемы с речью;
- Предоставление поддержки по услугам в отдаленных районах.
Дата выхода Voice Engine
Несмотря на анонсирование Voice Engine, Open AI не торопится предоставить открытый доступ к данной модели, поскольку пытаются противостоять её злоупотреблению и использованию в недобросовестных целях.
На данный момент мы решили провести предварительный просмотр, но не выпускать эту технологию в широкое пользование. На основе результатов наших небольших тестов мы примем более взвешенное решение о том, стоит ли внедрять эту технологию в широких масштабах.
Компания интенсивно проводит тесты, в тесном сотрудничестве с партнёра для разработки регламента по защите голосов и безопасности применения. В будущем планируется создать надежные меры по аутентификации, такие как проверка голоса, списки защищенных личностей и водяные знаки в целях обеспечения прозрачности и этичности использования Voice Engine.
А вы ждёте выход Voice Engine? Поделитесь в комментариях