Как определить сгенерированное изображение: Полное руководство
Сгенерированные изображения повсюду, и с каждым днем они становятся все более реалистичными. Вот как их всегда можно распознать.
Генераторы изображений становятся все более пугающе хорошими.
И в ближайшее время они станут еще лучше. Изучение признаков ИИ-изображений сейчас очень важно, чтобы вы могли использовать их в будущем. Хотя с каждым днем распознать их становится все труднее, эта статья посвящена самым простым способам идентификации AI-изображений, и к ее концу, я уверен, у вас разовьется интуиция!
Еще больше полезностей - в телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.
Дело движется быстро. Вот только два года работы генератора изображений MidJourney:
Несмотря на то что технологии развиваются бешеными темпами, я уверен, что определить, является ли любое изображение сгенерированным ИИ, можно (пока что).
Прежде чем мы погрузимся в работу, я дам вам один совет, который помогает всегда, независимо ни от чего:
Просто увеличьте изображение!
Признаки искусственного интеллекта
В этой статье я подробно расскажу о каждом из следующих признаков и приведу примеры, которые помогут вам определить сгенерированные изображения.
- Фоновые объекты, которые не имеют смысла
- Несоответствующие/нереалистичные текстуры и узоры
- "Непонимание" формы или функции объекта
- Странный текст
Давайте перейдем прямо к делу!
Признак 1: фоновые объекты, которые не имеют смысла
Начнем с того, что это один из самых быстрых способов определить, что изображение сгенерировано ИИ.
ИИ любит "фокусироваться" на главном объекте в сцене, демонстрируя свою способность детализировать наиболее важный объект. Однако он часто "забывает" обратить внимание на фон изображения. Вот отличный пример этого:
На первый взгляд это выглядит вполне реально. Однако не сразу можно заметить, что связность изображения начинает нарушаться. Например, что происходит с "мостом" на заднем плане?
Как видите, кабели и колонны на мосту совершенно бессмысленны и явно не служат опорой.
Во-вторых, этот "другой поезд" на заднем плане не имеет абсолютно никакого смысла и выглядит как чье-то плохое воспоминание о вагоне поезда:
Вот еще один пример. Эта фотография выглядит вполне реальной, то есть пока мы не посмотрим на задний план:
Как видите, при увеличении масштаба из земли торчат, казалось бы, случайные артефакты, ветви деревьев невероятной длины и аморфная, непонятная "штука" в середине справа.
Признак 2: непоследовательные/нереалистичные текстуры и узоры
Это полезно, когда фон размыт или недостаточно детализирован, и особенно полезно для знакомых вам текстур, таких как кожа, ткань, камень, металл и другие поверхности. Вот пример:
Эта фотография выглядит невероятно реалистично; на самом деле, если бы вы просматривали социальные сети и взглянули на это изображение, я готов поспорить, что вы не определили бы, что оно сгенерировано ИИ. Кроме того, здесь очень мало фоновых странностей, так что как мы можем это определить?
Давайте начнем с увеличения.
1-й признак: Кожа
Сгенерированная ИИ кожа обычно не соответствует реальной, особенно если приблизить ее. Увеличив масштаб, мы видим, что текстура кожи здесь просто выглядит ненатуральной:
Ее кожа кажется почти пластиковой, неестественной и слишком гладкой. Здесь не видно ни одной поры! Зоны перехода, такие как верхняя губа и под носом, кажутся почти нарисованными. Вы также заметите, что отдельные волоски не соединены между собой, а некоторые парят в пространстве.
Вот еще один пример "странной" кожи на другом изображении:
Кожа здесь имеет довольно неестественный вид, не так ли? Не говоря уже о случайных вкраплениях и удлинении волос...
Признак 2: Текстура одежды + детали
Одежда на сгенерированных изображениях часто выглядит реалистично издалека, но при ближайшем рассмотрении становится ясно, что что-то не так. Давайте посмотрим на другую деталь на первом изображении:
Здесь есть множество вещей, которые являются неправильными:
- Вязаный шарф на самом деле представляет собой странный псевдо-полосатый узор, не похожий на какую-либо узнаваемую текстуру ткани.
- Молния проходит сквозь шарф.
- Пуговица неправильной формы и аморфная
Если вы посмотрите на другие примеры одежды, созданной ИИ, это станет еще более очевидным:
У этой фотографии свитера крупной вязки есть несколько проблем. Блуждающие "волоски", которые вы ожидаете увидеть на свитере, непоследовательны и бессмысленны. Если присмотреться, некоторые нити уходят в никуда и сливаются друг с другом, не являясь настоящей вязкой. Кроме того, края оплетенных нитей расположены как бы случайно.
Вот последний пример: джинсовая куртка.
Опять же, вместо видимых нитей мы имеем узор в горошек. Кроме того, в золотистых нитях есть случайные детали, которые не имеют абсолютно никакого смысла.
Признак 3: Глаза
Глаза, сгенерированные ИИ, все еще немного странные, даже сегодня. На оригинальном изображении вы можете увидеть это вблизи:
Веки здесь толстые и почти кукольные, а радужные оболочки (особенно левого глаза) плавают в пространстве, почти вытянутые. Ее ресницы также потрепаны и отсутствуют на некоторых участках век.
Вот еще один пример, еще более жуткий:
Зрачки не по центру, а радужки явно неправильной формы. Не говоря уже о том, что кожа здесь опять же не имеет смысла: ее текстура выглядит неправильно.
Этих признаков, как правило, достаточно, чтобы определить, что изображение человека сгенерировано ИИ, но впереди еще больше!
Признак 3: "Непонимание" формы или функции объекта
ИИ на самом деле не знает, как все устроено. Когда он генерирует изображение, он не задумывается о том, как объект взаимодействует с чем-то, что не находится в его окружении. И снова это особенно заметно для фоновых объектов.
Выглядит как красивая кухня, верно? Нет. Давайте увеличим масштаб.
Ах да, куча "кухонных принадлежностей". Можете ли вы опознать хоть одну из них?
Бутылка "оливкового масла" на грани падения на плиту...
Горшок с растением с невидимыми корнями?
Контейнеры, которые совершенно не подходят по всем параметрам...
Кстати, каким-то образом я зашел так далеко в статье, даже не упомянув о том, что ИИ все еще очень плох в генерации рук. Если присмотреться, то почти у любой руки, сгенерированной ИИ, можно обнаружить несоответствия:
Выглядит неплохо, правда? А может, и нет:
Да, становится ясно, что ИИ на самом деле не знает, как работает что-либо в реальном мире. Всегда будьте начеку!
Признак 4: странный текст
Хотя некоторые генераторы изображений ИИ, такие как Dalle3, могут добавлять текст к изображениям, сгенерированное ИИ изображение выдает себя, если на нем есть искаженный текст или логотипы. Вот хороший пример:
Это выглядит почти по-настоящему (даже несмотря на пять чашек кофе), но текст на чашках абсолютно бессмысленный:
Вот еще один пример: витрина магазина (изображение не слишком реалистичное, но я просто показываю, что текст сгенерированного изображения может быть хорошо смотреться издалека):
Как видите, на первый взгляд крупная надпись выглядит нормально, но когда мы немного увеличиваем масштаб других элементов...
Надпись просто странная и непонятная. Это явно не текстура или что-то вроде искусства; она "пытается" быть надписью, но у нее просто не получается.
Это четыре самых важных фактора для определения изображений ИИ! Надеюсь, это поможет. Давайте попробуем использовать некоторые из этих знаний на наглядных примерах.
Просто для развлечения: Несколько действительно сложных примеров
Здесь собраны сгенерированные ИИ изображения, которые очень сложно распознать даже с первого взгляда. Только при увеличении масштаба мы можем увидеть суть...
Разбившийся Cybertruck:
Ух ты, выглядит очень реалистично. Хм, вообще-то... попался!
Селфи в 2012 году:
Это действительно хорошее изображение; единственное, что выдает ИИ, - "логотип" футболки.
Фотография в ресторане:
Это очень сложно определить, особенно на маленьком экране. Но, как всегда, мы должны увеличить.
Я постарался сделать эту статью как можно более полной, не упуская ни одного момента, и надеюсь, что она станет хорошей отправной точкой для тех из вас, кто хочет уметь определять сгенерированные изображения.
В следующий раз, когда вы будете листать соцсети и увидите что-то, что выглядит немного не так, не забудьте увеличить масштаб.
Спасибо за чтение!
Еще больше полезностей - в телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.
Оригинал статьи на английском - здесь.
любой человек который пользуется интернетом больше двух часов в день может с легкостью отличить сгенерированный контент при чем не только изображения от реального
Как примитивно вы размышляете, вы скорее всего никогда не генерировали самостоятельно изображения!
Комментарий удалён модератором
Сможет, но в том случае, если не сделана постобработка изображения.
Селфи в 2012 году
Логотип футболки в таком кач-ве - спорное док-во.
Там вообще может быть какая-то абстракция.
Я обратил внимание на несоответствие цвета растительности на лице: щетина, скорее, коричневая, а волосы на бороде - чёрные. Впрочем, возможно, такое у людей встречается , или же мужчина подкрашивал бороду.
Фотография в ресторане:
Аналогично: неясно, какой шрифт и язык. Может, так и задумано?
Но в этой фотографии у мужчины на переднем праве что-то не то с пальцами левой руки - они какие-то неестественно длинные. Впрочем, возможно, у него какой-то дефект, и он специально руку спрятал.
С изображением поезда тоже не всё так однозначно.
1. Возможно, там на дальнем плане, не мост, а ... башенный кран?
2. Странный вагон на заднем плане может быть не вагоном , а частью чего-то другого железнодорожного, возможно, в процессе демонтажа и/или после аварии.
На этой картинке ещё вопрос вызывает отсутствие щели в стыке между рельсами - на переднем плане (у ближайшей рельсы) он как-будто должен быть.
И, странно, что вы не заклеймили надпись на табло вагона - там же тоже что-то нечитаемое :)
Легко и приятно искать дичь, если заведомо известно, что изображение сгенеровано нейросетью.
Допускаю, что набив руку, можно определять реальность изображения на глазок, но в типовых случаях (реклама и прочий маркетинг) это смысла особого не имеет, т.к. суть от этого не меняется.
А там, где суть имеет значение, скорее всего, будут использоваться закрытые нейросейти с ручной пост-обработкой, и установить подлинность фотографии без нейросетей следующего поколения будет непросто.
Если основательно всмотреться, можно много чего найти ).
Комментарий удалён модератором
Захламили уже интернет этой генеренкой. Даже на стоках валом этого хламаФотошопер порвался? Обожаю генеренку: кратное снижение расходов на медиаматериалы без потери конверсии тех каналов, где они используются.
И да, господи, наконец-о можно не тратить бесценное время сотрудников на общение с альтернативно-одаренными непонятыми гениями в тот момент, когда все штатные дизайнеры заняты. Теперь любой некритичный маттериал закрывается нейросетью