Новый ИИ-инструмент Riffusion генерирует музыку на основе описаний звука
Riffusion - модель искусственного интеллекта, которая генерирует музыку на основе текстовых подсказок, создавая визуальное представление звука в виде сонограммы и преобразовывая его в аудио. Инструмент создан на основе модели преобразования текста в изображение Stable Diffusion 1.5 - разработчики доработали модель для применения скрытой диффузии к…
Спектр звука - это ж просто 2 картинки - real + imaginary. Че такого по словам генерить такие две картинки, а не привычные нам.