Возьмем Midjourney, Stable Diffusion и DALL-E. Несколько R&D-команд изобрели диффузные нейросети, которые умеют выразительно и точно превращать текстовый запрос в изображение. И стали думать, как сделать из своих изобретений продукты — то есть создать опыт человеко-машинного взаимодействия, чтобы привлечь много людей, которые будут платить компании деньги. Исходя из того, как каждая из команд видела цель, исходя из контекста вокруг и из доступного инструментария, Stable Diffusion и DALL-E решили эту задачу, создав графический интерфейс, а Midjourney — создав опыт в виде беседы с ботом в Discord.
Какой из вариантов лучше? Или по-другому: какой опыт создают такие решения? Чего добились команды? Если коротко, мне кажется, подход Midjourney на практике сработал лучше — несмотря на то, что графический интерфейс проще понять с первых шагов, работа с ботом быстрее учит пользователей за счет эффекта P2P-обучения (англ. person-to-person — от человека к человеку). Сообщество обучает само себя. К чему я это? Выбор средств для решения задачи определяет весь остальной дизайн. И этот пример показывает насколько.
Не хотелось бы вообще ,чтобы роботы кого то заменяли
но хотелось бы спихнуть на них скучную рутину )