RAG не применяется для генерации изображений напрямую, но может использоваться для улучшения текстового ввода, который затем интерпретируется визуальными генеративными моделями, такими как DALL-E от OpenAI. Например, текст «горный пейзаж с закатом» может быть дополнен уточнениями через RAG и затем преобразован в изображение. Технологии, такие как у NVIDIA, сосредоточены на моделях глубокого обучения для создания фотореалистичных изображений, что используется в видеоиграх и анимации.