Да, но я немного о другом, я о том, что есть массив данных для обучения и использование его (или части) в создании нового изображения (это прослеживается в примерах от миджурни), а есть поиск изображения по промту и использование его как референс, что очень заметно например у Dalle в первом примере "День Победы на Таймс-сквер". Обратите внимание что он очень точно перерисовал исходное изображение, вплоть до других людей вокруг.
Спасибо за статью, но сразу возникает вопрос на сколько нейросеть умеет сопоставлять запрос с описанием культовых фото. Я имею ввиду что она с большой вероятностью угадывает по запросу ваше загаданные фото, как сервис Акинатор, и видимо старается выдать результат максимально удовлетворяющий запрос.
у моего провайдера каким-то образом работают все мультфильмы/детские программы, но стоит включить что-нибудь из более серьезного контента, то через пару секунд сразу затык