Для синтеза голоса достаточно нескольких часов аудиоданных, озвученных обладателем голоса и оцифрованный текст, который он зачитывает. Аудиопоток и текст «выгружаются» в несколько нейронных сетей одновременно, одна — генерирует спектрограмму звука (его визуальное изображение), а вторая — непосредственно звук.
Пример голоса обладателя для нейросети — эталон, к которой она стремится. Копия голоса синтезируется с учётом специфического произношения слов, скорости речи, интонаций и тембра.
Синтезируем голос ВВП, звоним Лукашенко и заказываем Трампу грузовой самолёт картошки.
Уже жареной с помидорками маринованными
Миллионы 40–50 летних мужчин, родившихся в Советском Союзе, ждут ремейк «Гостьи из будущего» и экранизации других приключений Алисы Селезнёвой, Крыса и Весельчака У.
С оригинальными актёрами, уже ушедшими от нас.
Поколение на 20 лет помладше тоже в ожидании, к слову
Да хотя бы, например, вспомнить Варкрафт 3. Старая озвучка - классическая ("Я получил власть, которая и не снилась моему отцу"), но некоторые актеры уже умерли, в частности, Владимир Вихров, озвучивавший Артаса. Теперь при переиздании и добавлении нескольких фраз им пришлось переозвучивать все - и получилось существенно хуже.
Или фильмы, которые выходили в советские времена с отличным дубляжем, но которые были цензурированы, с какими-то вырезанными фрагментами. Их тоже нужно было переозвучивать целиком, теряя прекрасный советский дубляж.
затея весьма забавная, особенно если она доведёт до "дубляжа" фильмов голосами самих актёров
Дублировать роль, например, Де Ниро, голосом самого Де Ниро, но по-русски и без акцента👍🏻