История о том как я делал бота генерирующего из текста .svg
Предисловие
Представьте: Вы думаете, что придумали что-то, до чего еще никто не догадался. Вы загораетесь этой идеей и начинаете в соло реализовывать. Делаете киллерфичу, а на следующий день какая-то IT компания реализовала то же, силами целой команды и на порядок лучше. Так же было и со мной. Недавно ребята из recraft.ai выкатили инструмент для генерации svg. Гораздо более мощный и удобный чем тот бот, который я сделал.
Как это выглядит?
Есть бот в телеграм которому пишешь любое слово на английском - получаешь в ответ векторное изображение
Как это работает?
Нейросети генерировать векторные изображения на данный момент (04.06.23) - пока не умеют. На сколько мне известно. Но с имитацией вектора в растре отлично справляются и midjorney и stable diffusion. Процесс - генерируешь в stable, и трассируешь в Adobe Illustrator - работал. Сначала появилась мысль автоматизировать это. И затем понял, что по сути это генерация из текста в вектор обходными путями.
Я использовал модель Lora обученную на Flat иллюстрациях. Для запроса я использовал следующий запрос:
После генерации изображения, мне нужно было трассировать результат чтобы получить вектор. Я сравнил доступные варианты. И все работало плохо. Потом я случайно наткнулся на Vectorizer AI. Он находится в бете и у него оказался бесплатный API. “Ну это знак” - подумал я и решил использовать его.
Результат понравился и я сел за код) Точнее сел не я а GPT4 с плагинами, т.к. питоном я не владею и знаю только основы.
Все шло как по маслу и у меня получилось написать код который генерировал картинку и конвертировал в svg. Осталось сделать Телеграм-бота. Тот ко мне подключился знакомый. Он отрефакторил код и вместе мы в тот же день запилили бота.
На следующий день обнаружилась масса багов и подводных камней.
- Внешняя ссылка для stable diffusion хостится на huggingface. 72 часа бесплатно, за остальное - плати
- Сервер с видеокартой стоит порядка 20000 -25000 в месяц
- Были баги и ошибки
- Вечером 3го дня я увидел сервис в котором моя фича уже сделана
Заключение
Проблемы - решаемы, но увидев крупного конкурента у меня опустились руки.
Я решил поделиться этой статьей, чтобы показать, что даже в одиночку - реально сделать что-то необычное. Ну и позвать вас к себе в телеграм про UX/UI.
Нейросети меняют мир и это только начало.
5+ за старания🤛🏼
Имба чел, уважуха