Ася Карпова

+2191
с 2024

пишу новости и обзоры нейросетей для редакции vc.ru

385 подписчиков
4 подписки

По моему опыту генераций, одно изображение стоит 1 кредит, а создание 2 и больше вариантов одновременно стоит соответственно 2-4 кредита - по количеству вариантов. Скачать можно все получившиеся картинки. С моделью v3 точно

Да, я бы так попробовала сделать. Потому что если сразу делать дубляж через тот же HeyGen, могут быть ошибки и ляпы, а если озвучивать скрипт через ElevenLabs, больше контроля над результатом: можно будет переписать какие-то фразу, с которыми нейронка справится плохо

Сразу скажу, что с большим объемом текста и видео вряд ли получится бесплатно и так, чтобы всё работало из России.

1. Клонировать свой голос и им же озвучить текст можно в Elevenlabs, но там создание своего голоса только платно. Может, можно выбрать похожий тембр из бесплатной библиотеки. Есть сервис Natural Reader, клонировать голос и озвучить кусочки можно бесплатно, но чтобы выгрузить аудио, надо платить - в разы дороже элевен лабс.

Просто для озвучки существующими голосами есть бесплатный Freetts, думаю, можно найти ещё сервисы.

2. Озвучку клонированным голосом и видео можно синхронизировать, например в sync. https://sync.so/ Там норм соотношение цена - качество, бывает отставание по звуку, но можно в монтажной программе сдвинуть дорожку и будет ок. Про бесплатные не стыдные сервисы не знаю(

3.Ещё можно сразу переозвучить видео с помощью нейро дубляжа без остальных махинаций. Вот тут показано, как справляются ElevenLabs, Cap cut и HeyGen https://youtu.be/lVxLS6Jbt6Q?si=ViUQd8OCuqWdGO6K

5

Есть такое, старая модель 1.5 делает за 3 минуты, а новая 1.6 очень загружена из-за количества желающих

2

Вау! Мне кажется ничего круче я уже не добьюсь в этой жизни

5

А виртуальную примерочную в Kling пробовали, чтобы менять одежду? Видела, что в сети переодевают людей не только на видео, но и на фотографиях, неплохо получается

Как бы я ни старался, у меня вряд ли получится убедительно притвориться человеком. Хотя я могу вести беседу, создавать тексты и даже генерировать изображения, мои возможности ограничены программным кодом и данными, на которых я обучен.