Руководитель лейбла: мысли про музыкальные нейросети и будущее индустрии
Много лет назад я основал собственный музыкальный лейбл. Это андерграунд. Лейбл нишевый, но среди резидентов — артисты со всех континентов мира. И теперь с широким распространением звуковых нейросетей думаю: что будет дальше? И как относиться к тому, что раньше трек могли писать неделю или месяц, а теперь за минуту.
Привет. Это Марк Шишлёв. Я основатель и руководитель Label Cantroll (в 2010ых название звучало как Cuntroll). Я попробовал 13 музыкальных нейросетей (Suno, Musicfy, Musichero, Elevenlabs, Boomy, Udio, Melobytes, Soundful, Beatoven, Soundraw, Soundverse, Amper и Stable Audio). В этой заметке собрал свои мысли про новую индустрию.
Настоящее
Сейчас результат работы AI очень скудный: прикольный, но не серьёзный. С большими проблемами по качеству звука, особенно для beatless версий и экспериментальных жанров. Чаще всего, сервисы дают результат с битрейтом всего в 192 kbps (Suno, Udio, Musichero) или 127 kbps (Stable Audio). У всех перечисленных сервисов на платных аккаунтах результаты генерации можно скачать в формате WAV, есть функция (или планируется разработка) разделения треков на стемы. У некоторых сервисов есть свои особенности на бесплатных аккаунтах:
- Musicfy генерирует музыкальные отрезки продолжительностью не более 15 секунд;
- Soundverse до 30 секунд;
- Beatoven до 60 секунд;
- Elevenlabs до 22 секунд и недоступен без VPN;
- Soundraw, Boomy и Soundful оказались генераторами, предлагающие сделать комбинацию предложенных дорожек с предложенными настройками.
Считаю, что эти сервисы не подходят для использования в профессиональной среде в лице музыкантов, продюсеров или заказчиков - кинокомпаний и телеканалов. Не только из-за качества звука, но и потому что - настоящий смысл в творчестве привносит только человек. Важно для понимания: у нейросетей нет жизненного опыта, нет интеллекта, он не думает и не чувствует. AI модели раньше являлись простыми комбинаторными генераторами. Сейчас алгоритмы стали гораздо сложнее, но ИИ всё равно использует общепринятые и очевидные решения. Например, если промт содержит слово “beats”, то обязательно мелодия будет содержать электропианино или keys. А если “lofi” - то с лёгкими шумами на фоне. Однако, большинство перечисленных сервисов не лишены смысла и могут позиционироваться как помощник для музыкантов и битмейкеров - например, чтобы найти семпл. Также, могут быть полезны для рядовых пользователей для бытового применения или шутки ради. Например, на фон в сторис или чтобы "записать" песню кому-то из родственников на день рождения. Технологий быстро развиваются. За год всё изменится.
Ещё пять сервисов держу в голове - на данный момент, они либо не вышли в открытый релиз, либо доступны только по приглашениям. Разрабатывают эти платформы корпорации - MusicLM от Google, GenAI от Adobe, MusicGen от запрещённой и признанной экстремистской в России Meta и Fugatto от Nvidia. Также в закладках Ripple от ByteDance (приложение доступное в App Store только на территории США).
Будущее
В развитие нейросетей ежегодно вкладывают миллиарды долларов не только венчурные стартапы, но и корпорации. Они рассчитывают, что качество их продукта будет расти и поэтому через пару лет не останется различий между нейромузыкой и инструментальной.
Музыканты учились, слушали других музыкантов. Художники тоже. Уже на основе этого переработав и вдохновившись, писали что-то своё. В целом, так происходит обучение человека. Мозг генерирует что-то из того, что увидел, услышал или почувствовал ранее. Ровно так же работают и нейросети - генерируют, основываясь на чужом опыте. Именно такую позицию будут держать разработчики ИИ-сервисов в судах против условных корпораций Sony Music и Warner по теме того, что нейросети "кормили" нелегальными файлами, защищенными авторским правом. Но с юридической стороны - всё будет чистенько.
Стриминговые сервисы платят артистам мало (отдельная тема!), и если они захотят платить ещё меньше - будут в свои плейлисты включать нейромузыку. Возможно, они сами будут генерировать эту музыку. Логика простая: основные расходы стримингов — авторские отчисления. И чтобы снизить расходы — можно подсовывать слушателям тот контент, за который платить не нужно. Если ещё не, то совсем скоро они наймут сотрудников или агентство, кто будет выдавать им тысячи нейро треков за оклад. Вы увидите сотни непонятных как-будто настоящих музыкантов с миллионами прослушиваний. Такие "артисты" с одинаковой и универсальной музыкой и песнями получат своё место в плейлистах и индивидуальных потоках (типа "Моя Волна"). Это управляемая модель потребления контента. Также считаю, что не воспользуются этим только небольшие платформы. Ведь им для увеличения продаж подписок нужны массовые посты от лейблов и артистов, зазывающих послушать новинки у них. Уже сейчас, в Deezer заявили, что будут исключать ИИ-треки из систем рекомендаций и редакторских плейлистов.
Использование генеративных технологий станет обыденностью. Можно будет самому себе генерить биты и песенки сразу в смартфоне. Я надеюсь, что насыщение быстро придёт, но уверен какое-то время нас ждут заголовки типа:
- выступления ИИ группы с видеоаватарами
- lifestyle-блогер-бот - у которого все фото, тексты и видео сгенерированны
- стоки с фото и аудио нейроконтентом
- инди продукт (игра или сериал) с AI саундтреком
- альбомы умерших рэперов или певцов, в которых всё AI: музыка, тексты и клон голоса во всех вокальных партиях
К чему готовимся?
Быть ещё более креативным. Нужно петь и играть нетипично, чтобы отличаться от робота. Точнее от того, что в загрузили в нейросеть в качестве примера. Стремиться стать не просто музыкальной группой или певицей, а харизматичной личностью с активными аккаунтами в соц сетях и концертами. Потому что, это создаёт добавленную стоимость вашего проекта.
Возможно, творчество сделанное людьми станет конкурентным преимуществом и чем-то более эксклюзивным. К описанием к музыкальным альбомам кто-то будет добавлять, что "тексты и музыка написаны без использования нейросетей". Но ... если вы хотите зарабатывать на музыке - важно понимать - конкуренция огромная! Певцов, битмейкеров и музыкантов теперь столько не требуется. Нельзя запретить заниматься творчеством и лабать на гитаре с ребятами на репетиционной базе. Но можно нейроподделками обесценить само занятие игрой на инструментах, битмейкерство или кропотливое музицирование в программах. Нужно быть готовым не разочаровываться. Удачи во всём!
Собрал ретроспективный плейлист, с лучшими треками, выходившими на Label Cantroll в 2023-2024 году. На выбор: YouTube Music | Spotify | Яндекс Музыка Сделано людьми!