Модель генерирует видео длительностью до 5 секунд с разрешением 544p и 720p. В качестве промптов служит текст на английском и китайском языках; западные обзорщики отмечают, что нейросеть от Tencent справляется с английскими запросами чуть хуже, чем аналоги, например, Runway Gen-3. При этом видео получаются ничуть не хуже: HunyuanVideo создаёт сцены с разнообразными объектами и текстурами, реалистичным движением и освещением.
Не сказал бы, что движения реалистичные, особенно по первой генерации. Есть и получше, поэтому насчет "превосходит конкурентов" я бы поспорил. С остальными вроде неплохо, качество довольно хорошее
Никогда бы не подумал, что для таких технологий понадобится так много вычислительных мощностей. Надеюсь, что в будущем нейросети с такими требованиями будут намного доступнее
Ну вообще, по сравнению с другими ии, которые я встречал, этот очень даже неплох. Но уверен и в нем есть ошибки, и где-то уж точно появится "второй плавник")
Скоро любой сможет создать свой маленький фильм, просто написав пару предложений)) Представляю, какие прикольные видео можно будет сделать.
Сейчас уже много подобных моделей, им нужно совершить какую то революцию чтобы блеснуть, к примеру сделать так чтобы система создавала хотя бы минутные видео.