Я неделю генерировал изображения хот-догов во славу «Яндекса»

Проверяю, выглядит ли их нейросеть конкурентно.

«Миджорни» только что представила веб-версию — до этого нужно было танцевать с бубном вокруг телеграм-ботов или аккаунтов «Дискорда». В поиске альтернатив пару недель назад скачал «Шедеврум».

Что за «Шедеврум»

В паре слов, это бесплатное приложение «Яндекса» для генерации картинок по описанию. Над каждым запросом думает от 15 секунд до примерно минуты (зависит от времени суток, ночью быстрее) и предлагает четыре варианта. Выбранный вариант можно скачать в разрешении ~1Мп (1024х1024). Количество попыток не ограничено.

Приложение работает как социальная сеть на минималках: местные пользователи оценивают картинки друг друга, и, полагаю, там самым помогают доучить нейронку. Правда, в ленте в основном примеры неудачных запросов и получающаяся цветастая чушь.

Ещё там можно создавать тексты и видео, но сегодня не об этом.

Что делаем

Для тестов выбрал шесть съедобных объектов. Вот результат генерации без дополнительных условий:

Я неделю генерировал изображения хот-догов во славу «Яндекса»

Основной промт для разговора с тонким миром

К запросам добавил несколько ключевых слов: 3d icon render на белом фоне clean. Так получил симпатичные нарисованные объекты: объёмные и полностью помещающиеся в кадр, на светлых фонах. С ними должно быть удобно работать дальше.

Как «Шедеврум» держит удар: экспериментируем с материалами

Попросил нейросеть представить, как мои объекты выглядели бы из бумаги. Запрос пополнился словами бумажный и оригами. Получилось вполне изобретательно.

Я неделю генерировал изображения хот-догов во славу «Яндекса»

Затем генерируем объекты из кубиков (лего набор конструктор). Нормально, но при детальном рассмотрении это скорее наборы с распродажи «Алиэкспресса»: кубики и сами странные, и стыкуются странно (хотя нейросеть училась на идеальных примерах — фотографиях и рендерах реальных конструкторов).

Я неделю генерировал изображения хот-догов во славу «Яндекса»

С другой стороны, материалы выглядят правдоподобно-пластиково, со стыками и зазорами.

Возможно, проблема лечится более хитрым промтом — например, названием софта для создания реальных Lego-наборов или чем-то в этом духе.

22 лайка
набрал лего-пончик, это мой рекорд

Далее несколько рукодельных раундов. Сначала делаем объекты плюшевыми (плюшевый сшитый ворсистый игрушечный ткань). Эта серия, к слову, набрала много лайков.

Я неделю генерировал изображения хот-догов во славу «Яндекса»

На 80% нейросети удалось передать материал и поверхность игрушек. Но, как видите, сосиска осталась пластиковой, соус гелеобразным, а рожок ещё выглядит съедобным. Откуда взялись пластиковые пипки так и не смог понять.

Бабушкин раунд идеально удался: нити красиво и геометрично сплелись. Промт максимально простой — шерстяной связанный.

Я неделю генерировал изображения хот-догов во славу «Яндекса»

Мой любимый круг генерации: надувные резиновые объекты. Получилось круто: могу представить детей, которые в Адлере плавают с такими штуками. И цвета, и блики, и поведение материала (местами даже видна подсдутость) выглядят правдоподобно.

Я неделю генерировал изображения хот-догов во славу «Яндекса»

Пластилиновые объекты могли бы быть лучше, хотя обрели правильные свойства — края стали неровными, рукотворными; объекты местами деконструировались до монотонных кусочков пластилина.

Я неделю генерировал изображения хот-догов во славу «Яндекса»

Иногда нейросеть спотыкается: более охотно преобразовывает те детали, которые люди и сами часто меняют. К примеру бургерная булочка может пшеничной, ржаной, золотой — нейросеть видит и подхватывает эту вариативность. А вот вафельный рожок везде одинаковый, и сетка очень старается оставить его в оригинальном виде. Я добавил в промт всякие пластилиновые мультики и игры типа Neverhood, но рожок так и не поддался.

Ещё немного резины: в этот раз в стиле воздушных шариков (праздничный надутый воздушный шар резиновый). Забавно, что сетка отказалась работать со словом латекс — оно в запретном списке. Получился приятный результат: нейросеть местами подмешала праздничный золотистый оттенок. Чёртов рожок опять вафельный.

Я неделю генерировал изображения хот-догов во славу «Яндекса»

Последнее, на что хватило моей фантазии — мозаичные и витражные объекты. Далеко не с первого раза они получились, и в итоге довольно разными. Неудивительно: надо уточнять запрос какими-то стилями, именами художников и скульпторов, конкретными названиями витражей для более консистентного результата.

Я неделю генерировал изображения хот-догов во славу «Яндекса»

Бургерная котлета поддалась последней, а вот с картошкой фри сетка так и не поняла, что делать (по крайней мере, в первые 10 попыток).

Лирическое отступление

Изначально хотел кормить картинками другие нейросети, чтобы убрать с них фон. В среднем получается вполне сносно, приведу даже более живописный пример: результат работы нейронки, которая по плоскому изображению из «Шедеврума» построила трёхмерное.

Я неделю генерировал изображения хот-догов во славу «Яндекса»

Наверное, это и будет главным выводом этой статьи: до эксперимента «Шедеврум» лично для меня звучал, как что-то не совсем неприличное. На деле вполне сподручен и очень доступен: возможно, в следующий раз напишу сравнительный обзор уже с другими сетками.

Пробуем просить сетку сделать более творческие вещи

Делаем изометрические домики (дом здание isometric). Нейронка нахваталась разных типов изометрий, поэтому домики плохо стыкуются между собой (возможно, промт можно уточнить названиями ракурсов).

Я неделю генерировал изображения хот-догов во славу «Яндекса»

В целом, вышло довольно оригинально: немного поплыли предметы экстерьера вроде окон, зато получилось творчески замешать исходные объекты и здания. Идеальный способ получить идеи и референсы изометрических городов.

Роботы из объектов получились интересные (пластиковый белый робот). Чем более детализированный робот, тем выше шанс, что сетка вляпается в какую-то из традиционных проблем: в те же сложности с отрисовкой пальцев, например.

Я неделю генерировал изображения хот-догов во славу «Яндекса»

Робокотлету сделать не получилось, да и не нужна она роботам, котлета ваша.

Наверное, самое творческое задание — смешать объект и лампочку. Некоторые объекты получились быстро, по другим приходилось много раз менять запрос. Например, добавлять к нему слова нить и накаливание, чтобы сетка лучше понимала, какую часть лампочки можно кастомизировать. Рожок не получился лампочкой.

Я неделю генерировал изображения хот-догов во славу «Яндекса»

Главное не класть их в рот.

UPD

Ещё несколько тематических генераций.

Стимпанк:

Я неделю генерировал изображения хот-догов во славу «Яндекса»

Кожа и шипы:

Я неделю генерировал изображения хот-догов во славу «Яндекса»
2727
14 комментариев

Оригами-пончик — 🔥
Возьму на вооружение, кстати, «нейроматериаловедение» (-:

Благодарю, Михаил!

Ответить

нейросопромат!

2
Ответить

Чет не могу найти Миджорни для веба. Дадите ссылку?

Ответить

была новость вчера: https://vc.ru/midjourney/905275

мопед не мой, детали ещё не смотрел

1
Ответить

крузак на фоне бетонного заводика специально для читателей vc.ru

Ответить

А заводик точно бетонный? Больше похож на зефирный (-:

Ответить

Йеее! Теперь все колбасники и лампочники станут боготворить вас!

Ответить