Точнее сказать я написал стихи, сгенерировал песню (голос и музыку), придумал сюжет клипа, сгенерировал нейросетью референсы (картинки) в едином стиле и сюжете, референсы превратил в 5-секундные видео с помощью нейросетей же. А потом монтажер всё это свел в единый клип.
По просьбе автора переношу сюда свой комментарий из ВК. Чтобы всё было в одном месте.
В целом, мне понравилось. И идея, и реализация.
Сильнее всего смущает, что нет бочки. Снейр есть, а бочки нет - и звучит это странненько.
Пояснение по просьбам трудящихся.
Обычно в сильную долю бьёт бочка, а в слабую - снейр (он же малый барабан, он же рабочий).
Это если очень упрощённо - бывает и наоборот (но реже), бывают и более навороченные варианты-вариации.
Так вот. Нейросеть поставила тут снейр, который бацает в слабые доли и иногда прям исполняет.
Но бочки на сильных нет. Сознание ее дополняет, додумывает, но реально она там отсутствует ))
Я все равно ничего не понял)
на сегодняшний момент, считаю что нейросети не конкуренты живым исполнителем точка по одной простой причине. нейросетях отсутствует контроль исполнения. отсутствует механизм генерации отдельных треков точка возможности контроля длительности и акцентов при вокале. контроля правильности фонетического исполнения. отсутствует возможность переиспользование готовой композиции. как только данные возможности будут реализованы тогда можно будет говорить по какой бы то ни было конкуренции. и при этом это останется очень хорошим инструментом для тех людей которых отсутствует возможность техническая финансовая физиологическая реализовать свои идеи в творчестве.
я и сам периодически балуюсь подобный генерации. однако, чтобы получить более или менее приемлемый по смыслу и исполнению а также по аранжировке и мелодии трек нужно в среднем потратить от двух до трёх недель. при этом после генерации ещё нужно дорабатывать. сложные рифмовые переходы подводки и прочие элементы и орнаменты стиха нейросеть не умеет генерировать и правильно воспроизводить