Gemini 2.0 Flash: как бесплатно редактировать фото в нейросети

Как фотошоп, только понимает команды на русском языке.

Gemini 2.0 Flash: как бесплатно редактировать фото в нейросети

В марте 2025 года стала доступна экспериментальная версия Gemini 2.0 Flash — ИИ-модель, которая понимает команды на естественном языке и выполняет их прямо в чате. Нейросеть отредактирует изображение по промпту, раскрасит чёрно-белую фотографию, «оживит» набросок, уберёт или добавит объект. Ниже — несколько тестов Gemini 2.0 Flash.

Содержание:

Как работать в Gemini 2.0 Flash (Image Generation)

Важно: у сервиса есть региональные ограничения. С российского IP зайти в него не получится.

В марте 2025 года нейросеть доступна бесплатно. У нового пользователя есть 32 000 токенов, но на практике счётчик обнуляется с каждым новым чатом. Одна генерация в среднем стоит около 300 токенов, конкретная цена зависит от сложности задачи и рассчитывается в процессе.

Особенность Gemini 2.0 Flash состоит в том, что нейросеть понимает естественный язык и редактирует изображения с помощью промпта. ИИ выполнит команду и пришлёт результат в чат.

Чтобы начать пользоваться моделью:

  • Зайдите на сайт Googe AI Studio, выберите вкладку «Create prompt» и модель «Gemini 2.0 Flash (Image Generation)».
Начало работы в модели Gemini 2.0 Flash. Источник: aistudio.google.com
Начало работы в модели Gemini 2.0 Flash. Источник: aistudio.google.com
  • Настройте генерацию. Справа есть ползунок «Temperature», который регулирует степень свободы нейросети. Чем выше значение (максимальное — два), тем больше креативности допустит ИИ в ответах. В настройках безопасности можно отрегулировать чувствительность контента. По умолчанию ползунки «Harassment» («Домогательство»), «Hate» («Ненависть»), «Sexually explicit» («Откровенность»), «Dangerous content» («Опасность») стоят на минимальной отметке, а «Civic integrity» («Гражданская порядочность»), наоборот, на максимальной. В отзывах пользователи признаются, что не понимают, как категории безопасности влияют на конечный результат.

  • Начните чат.

Готовое изображение сохраняется с логотипом. Чтобы скачать картинку, нужно нажать на значок «Download» в правом нижнем углу генерации.

Источник: aistudio.google.com
Источник: aistudio.google.com

Как сгенерировать изображение

Gemini 2.0 Flash умеет рисовать изображения с нуля. Для этого:

  1. Напишите промпт.
  2. Нажмите «Run».

Ниже — пример генерации по запросу: «Нарисуй гиперреалистичную фотографию девушки в солнечных очках». Нейросеть сгенерировала картинку с разрешением 795 × 1024 пикселя всего за 10 секунд.

Результат неплохой, но видна «рука» нейросети. Источник: Unsplash, сгенерировано в Gemini 2.0 Flash 
Результат неплохой, но видна «рука» нейросети. Источник: Unsplash, сгенерировано в Gemini 2.0 Flash 

Как поменять позу

В Photoshop, чтобы изменить позу человека, понадобится как минимум освоить марионеточную деформацию и поправить искривившийся фон. В Gemini 2.0 Flash достаточно:

  1. Прислать фотографию в чат с нейросетью.
  2. Написать промпт.
  3. Нажать «Run».

ИИ справился с заданием за 88 секунд и 540 токенов. Промпт был написан на русском языке: «Поменяй позу человека на фотографии. Человек должен стоять с поднятыми руками».

Нейросеть поддерживает диалог и после генерации, поэтому оператор может продолжить редактировать фото.

Модель учла, что у человека с поднятыми руками будет задран пиджак и чуть приподнят подбородок. Источник: Unsplash, сгенерировано в Gemini 2.0 Flash
Модель учла, что у человека с поднятыми руками будет задран пиджак и чуть приподнят подбородок. Источник: Unsplash, сгенерировано в Gemini 2.0 Flash

Как изменить фон

Следующий шаг — перенести человека в лес. Чтобы выполнить задачу вручную, нужно отделить фигуру от прежнего фона, скопировать её на новый, поработать со светом, тенями и цветом. В Gemini 2.0 Flash все действия умещаются в один промпт: «Поменяй фон. Пусть человек стоит в лесу».

Нейросеть справилась с задачей за 75 секунд и 300 токенов. Источник: Unsplash, сгенерировано в Gemini 2.0 Flash
Нейросеть справилась с задачей за 75 секунд и 300 токенов. Источник: Unsplash, сгенерировано в Gemini 2.0 Flash

Как улучшить качество

Отредактированная фотография выглядит сжатой. Чтобы восстановить её, понадобится промпт «Улучши качество фото. Сделай его более резким».

За 103 секунды и 200 токенов нейросеть сделала фото ярче, но качество не улучшила. Этот эксперимент будем считать неудачным. Источник: Unsplash, сгенерировано в Gemini 2.0 Flash 
За 103 секунды и 200 токенов нейросеть сделала фото ярче, но качество не улучшила. Этот эксперимент будем считать неудачным. Источник: Unsplash, сгенерировано в Gemini 2.0 Flash 

Как удалить объект

В Photoshop для этого нужно воспользоваться заплаткой или выполнить заливку. В Gemini 2.0 Flash снова понадобится только промпт. Например: «Сотри девушку посередине».

Удачный результат всего за 57 секунд и 525 токенов. Источник: Unsplash, сгенерировано в Gemini 2.0 Flash
Удачный результат всего за 57 секунд и 525 токенов. Источник: Unsplash, сгенерировано в Gemini 2.0 Flash

Как добавить объект

Gemini 2.0 Flash работает и наоборот — нейросеть может сгенерировать недостающий объект. Вот, как ИИ сделал картинку более оживлённой по промпту «Дорисуй людей на пляже. Пусть он будет людным».

За 300 токенов и 28 секунд на берегу появились отдыхающие. Источник: Unsplash, сгенерировано в Gemini 2.0 Flash 
За 300 токенов и 28 секунд на берегу появились отдыхающие. Источник: Unsplash, сгенерировано в Gemini 2.0 Flash 

Как сделать фотографию цветной

В нейросети от Google чёрно-белую фотографию раскрасит промпт. Ниже — эксперимент, как нейросеть справилась с командой на разных языках. Одно фото раскрашено по промпту на английском языке («Make this photo in color»), второе — на русском («Сделай это фото цветным»).

Обе генерации стоили около 50 токенов. Генерация на английском заняла 104 секунды, на русском — 133 секунды. Фото, раскрашенное по русскому промпту, теплее, но обе версии удачные. Источник: Unsplash, сгенерировано в Gemini 2.0 Flash 
Обе генерации стоили около 50 токенов. Генерация на английском заняла 104 секунды, на русском — 133 секунды. Фото, раскрашенное по русскому промпту, теплее, но обе версии удачные. Источник: Unsplash, сгенерировано в Gemini 2.0 Flash 

Раскрасить старое фото можно и в других нейросетях. Например, в Palette или Colorize.

Как «оживить» рисунок

Gemini 2.0 Flash может стать ещё одной нейросеткой в помощь родителям. Чтобы самостоятельно, в графическом редакторе, превратить детскую каляку-маляку в осмысленное изображение, нужны довольно высокие навыки рисования. В нейросети — промпт. Например: «Преврати этот эскиз в 3D-изображение мультяшного мальчика».

ИИ выполнил задачу за 199 секунд и 270 токенов. Источник: сгенерировано в Gemini 2.0 Flash 
ИИ выполнил задачу за 199 секунд и 270 токенов. Источник: сгенерировано в Gemini 2.0 Flash 

Как изменить внешность

С задачей убрать пирсинг, изменить причёску или цвет глаз можно обратиться к опытному ретушёру, а можно — к Gemini 2.0 Flash. Ниже — оригинал снимка и версия, отредактированная по промпту «Сделай цвет глаз голубым. Убери пирсинг. Распусти волосы».

Результат выглядит не слишком естественно. Стоил он 800 токенов и был готов за 80 секунд. Источник: сгенерировано в Gemini 2.0 Flash  
Результат выглядит не слишком естественно. Стоил он 800 токенов и был готов за 80 секунд. Источник: сгенерировано в Gemini 2.0 Flash  

Как добавить надпись

Нейросети часто не справляются с надписями. Поэтому следующий эксперимент — генерация текста на открытку. За генерацию по русскоязычному промпту нейросеть забрала 300 токенов, по англоязычному — 530 токенов.

С текстом на английском Gemini 2.0 Flash явно справилась лучше. Надпись без ошибок, написана красивым почерком. Чем не может похвастаться открытка с надписью «С лобовыю маме». Источник: Unsplash, сгенерировано в Gemini 2.0 Flash  
С текстом на английском Gemini 2.0 Flash явно справилась лучше. Надпись без ошибок, написана красивым почерком. Чем не может похвастаться открытка с надписью «С лобовыю маме». Источник: Unsplash, сгенерировано в Gemini 2.0 Flash  

А вы уже попробовали Gemini 2.0 Flash? Как считаете, хорошо нейросеть справляется с задачами? Или Photoshop пока незаменим?

7
1
1
Начать дискуссию