Gemini 2.0 Flash: как бесплатно редактировать фото в нейросети
Как фотошоп, только понимает команды на русском языке.
В марте 2025 года стала доступна экспериментальная версия Gemini 2.0 Flash — ИИ-модель, которая понимает команды на естественном языке и выполняет их прямо в чате. Нейросеть отредактирует изображение по промпту, раскрасит чёрно-белую фотографию, «оживит» набросок, уберёт или добавит объект. Ниже — несколько тестов Gemini 2.0 Flash.
Содержание:
Как работать в Gemini 2.0 Flash (Image Generation)
Важно: у сервиса есть региональные ограничения. С российского IP зайти в него не получится.
В марте 2025 года нейросеть доступна бесплатно. У нового пользователя есть 32 000 токенов, но на практике счётчик обнуляется с каждым новым чатом. Одна генерация в среднем стоит около 300 токенов, конкретная цена зависит от сложности задачи и рассчитывается в процессе.
Особенность Gemini 2.0 Flash состоит в том, что нейросеть понимает естественный язык и редактирует изображения с помощью промпта. ИИ выполнит команду и пришлёт результат в чат.
Чтобы начать пользоваться моделью:
- Зайдите на сайт Googe AI Studio, выберите вкладку «Create prompt» и модель «Gemini 2.0 Flash (Image Generation)».
Настройте генерацию. Справа есть ползунок «Temperature», который регулирует степень свободы нейросети. Чем выше значение (максимальное — два), тем больше креативности допустит ИИ в ответах. В настройках безопасности можно отрегулировать чувствительность контента. По умолчанию ползунки «Harassment» («Домогательство»), «Hate» («Ненависть»), «Sexually explicit» («Откровенность»), «Dangerous content» («Опасность») стоят на минимальной отметке, а «Civic integrity» («Гражданская порядочность»), наоборот, на максимальной. В отзывах пользователи признаются, что не понимают, как категории безопасности влияют на конечный результат.
Начните чат.
Готовое изображение сохраняется с логотипом. Чтобы скачать картинку, нужно нажать на значок «Download» в правом нижнем углу генерации.
Как сгенерировать изображение
Gemini 2.0 Flash умеет рисовать изображения с нуля. Для этого:
- Напишите промпт.
- Нажмите «Run».
Ниже — пример генерации по запросу: «Нарисуй гиперреалистичную фотографию девушки в солнечных очках». Нейросеть сгенерировала картинку с разрешением 795 × 1024 пикселя всего за 10 секунд.
Как поменять позу
В Photoshop, чтобы изменить позу человека, понадобится как минимум освоить марионеточную деформацию и поправить искривившийся фон. В Gemini 2.0 Flash достаточно:
- Прислать фотографию в чат с нейросетью.
- Написать промпт.
- Нажать «Run».
ИИ справился с заданием за 88 секунд и 540 токенов. Промпт был написан на русском языке: «Поменяй позу человека на фотографии. Человек должен стоять с поднятыми руками».
Нейросеть поддерживает диалог и после генерации, поэтому оператор может продолжить редактировать фото.
Как изменить фон
Следующий шаг — перенести человека в лес. Чтобы выполнить задачу вручную, нужно отделить фигуру от прежнего фона, скопировать её на новый, поработать со светом, тенями и цветом. В Gemini 2.0 Flash все действия умещаются в один промпт: «Поменяй фон. Пусть человек стоит в лесу».
Как улучшить качество
Отредактированная фотография выглядит сжатой. Чтобы восстановить её, понадобится промпт «Улучши качество фото. Сделай его более резким».
Как удалить объект
В Photoshop для этого нужно воспользоваться заплаткой или выполнить заливку. В Gemini 2.0 Flash снова понадобится только промпт. Например: «Сотри девушку посередине».
Как добавить объект
Gemini 2.0 Flash работает и наоборот — нейросеть может сгенерировать недостающий объект. Вот, как ИИ сделал картинку более оживлённой по промпту «Дорисуй людей на пляже. Пусть он будет людным».
Как сделать фотографию цветной
В нейросети от Google чёрно-белую фотографию раскрасит промпт. Ниже — эксперимент, как нейросеть справилась с командой на разных языках. Одно фото раскрашено по промпту на английском языке («Make this photo in color»), второе — на русском («Сделай это фото цветным»).
Раскрасить старое фото можно и в других нейросетях. Например, в Palette или Colorize.
Как «оживить» рисунок
Gemini 2.0 Flash может стать ещё одной нейросеткой в помощь родителям. Чтобы самостоятельно, в графическом редакторе, превратить детскую каляку-маляку в осмысленное изображение, нужны довольно высокие навыки рисования. В нейросети — промпт. Например: «Преврати этот эскиз в 3D-изображение мультяшного мальчика».
Как изменить внешность
С задачей убрать пирсинг, изменить причёску или цвет глаз можно обратиться к опытному ретушёру, а можно — к Gemini 2.0 Flash. Ниже — оригинал снимка и версия, отредактированная по промпту «Сделай цвет глаз голубым. Убери пирсинг. Распусти волосы».
Как добавить надпись
Нейросети часто не справляются с надписями. Поэтому следующий эксперимент — генерация текста на открытку. За генерацию по русскоязычному промпту нейросеть забрала 300 токенов, по англоязычному — 530 токенов.
А вы уже попробовали Gemini 2.0 Flash? Как считаете, хорошо нейросеть справляется с задачами? Или Photoshop пока незаменим?