Как отличить оригинальный контент от созданного искусственным интеллектом фейка

Бездушные фразы, автотюн, молчаливые герои и другие показатели.

Как определить дипфейк: признаки контента, созданного нейросетью

Легко понять, что контент сгенерирован, если на картинке люди с шестью пальцами, а на видео персонажи проходят сквозь друг друга. Но с развитием технологий задача усложняется: ИИ-творения становятся всё реалистичнее и определить нейрослед иногда практически невозможно.

В этой статье — подсказки и программы, с помощью которых можно выявить такой контент.

Содержание

Как распознать сгенерированный нейросетью текст
Сервисы для определения сгенерированного текста
Как определить сгенерированное изображение
Как определить сгенерированное видео
Сервисы для определения сгенерированных изображений и видео
Как распознать сгенерированную музыку
Сервисы для определения сгенерированной музыки
И ещё немного советов для проверки любого контента
Коротко: как проверить, что контент создала нейросеть

Повторы

Если одна и та же мысль упоминается несколько раз, возможно, текст написан ИИ. Происходит это потому, что многие нейросети «не осознают», что говорят одно и то же.

Разработчики OpenAI, создавшие ChatGPT, пишут в блоге: «Часто модель бывает чересчур разговорчивой и повторяет некоторые фразы, — например, раз за разом говорит, что её обучили в OpenAI. Происходит это потому, что специалисты, которые обучают ИИ, тренируют его давать более длинные ответы».

Тогда неудивительно, что нейросеть льёт воду как студент в дипломе и пишет «водянистые» выводы.

Допустим, в этом тексте про продуктивность ChatGPT упоминает технику помидора два раза.

ChatGPT упоминает технику помидора сначала на русском языке, а потом — на итальянском. Источник: chatgpt.com

Конечно, повторяются (специально или случайно) и люди, поэтому важно «выносить вердикт» по совокупности признаков.

Бесконечные списки

Если статья или другой текст состоит из сплошных списков — это тоже звоночек. Люди используют их не так часто, как нейросети.

Обычно списки делают для того, чтобы информацию было проще воспринимать. Но важно учитывать формат. К примеру, если текст с инструкцией состоит на 80% из списков — это ок, но если столько же списков в сочинении или новости — то это уже сомнительно.

Claude строит весь текст на списках. Источник: anthropic.com/claude

Формальный тон

Вроде всё логично и грамотно, но текст написан безэмоционально, а некоторые слова, фразы или даже целые предложения звучат неестественно. Как утверждает в своём блоге Сатья Д. — гендиректор сервиса по SEO-оптимизации Surfer, — ИИ часто начинает фразы с «by» («c помощью»).

То же самое относится и к текстам на русском языке. Например, в материале про то, как правильно выбрать температуру для утюга, ChatGPT использует оборот «пожароопасная ситуация», который больше подходит для технической инструкции, чем для статьи на сайте. Здесь будет уместнее «пожар». Также в этом контексте суховато звучит фраза «продлить срок службы одежды». Человек бы так не сказал.

Ещё предложение «Это не только опасно, но и может испортить вещь» звучит странно. Куда логичнее было бы сформулировать «Это может не только испортить вещь, но и привести к пожару». Источник: chatgpt.com

Выдуманные факты

Нейросети периодически врут — вставляют несуществующие факты. Например, в этом тексте Claude пишет, что костюм чумного доктора придумал врач Карло Урбани. Такой врач и правда был, но родился он в 1956 году. А вот про Константинополь — да, по некоторым данным, чума убила примерно 300 тысяч человек. Правда, это была другая чума — Юстинианова (ок. 541–750 гг. н.э.) В общем, каждый факт надо проверять под лупой.

По мнению нейросети, чумные доктора также занимались экзорцизмом, а если точнее — экзорцизмами. Источник: anthropic.com/claude

Определить нейросетевой след помогут:

Writer AI Content Detector — бесплатный сервис, в котором можно проверять до 5 тысяч знаков ежедневно.
GPTZero — сервис, в котором можно бесплатно проверять до 5 тысяч знаков ежедневно. За больший объём нужно платить, цены начинаются от $8,33 в месяц. Оплатить картой российского банка нельзя.

Нюанс: по данным исследования сингапурских и вьетнамских учёных, точность ИИ-детекторов в среднем составляет 39,5%. Если текст редактируют и намеренно добавляют в него ошибки, показатель снижается до 22%.

Странная анатомия

Нейросети часто ошибаются с анатомическими особенностями и пропорциями — например, создают шесть пальцев вместо пяти, уши странной формы или разные по длине стопы.

Рука ребёнка выглядит не совсем естественно. Источник: midjourney.com

А здесь ухо выглядит несколько упрощённо. Источник: midjourney.com

То же самое касается форм объектов на ИИ-изображениях: входная дверь может быть слишком длинной, а мотоцикл — слишком маленьким по отношению к человеку.

Слишком идеальное изображение

ИИ часто лишает объекты деталей и текстуры. Отсюда, к примеру, идеально пропорциональные лица с супергладкой кожей. В жизни таких людей не существует. Самые продвинутые из нейросетей научились добавлять мимические морщинки, поры и прыщики, но даже те выглядят «причёсанно».

Идеальная картинка может также указывать на обработку в фоторедакторе или другой нейросети, поэтому полностью полагаться на этот признак не стоит.

Нейросеть попыталась создать реалистичную кожу, но она всё равно вышла слишком гладкой. Источник: fusionbrain.ai

Это изображение выглядит реалистичнее. Но если приглядеться, можно заметить слишком пропорциональное лицо и ровную кожу. Источник: midjourney.com

Размытый фон

Ещё его называют «боке». Нейросети любят использовать размытый фон. Но боке может быть и художественным приёмом — такого эффекта можно добиться с помощью объектива. Поэтому стоит смотреть и на другие признаки.

А вот что нередко происходит, когда ИИ не размывает фон: можно долго развлекаться, рассматривая фотографов, некоторые из которых потеряли часть голов. Источник: instagram.com (принадлежит компании Meta, признанной в РФ экстремистской)

Неправильные тени и отражение

Нейросети часто ошибаются и с этими деталями, поэтому стоит присматриваться к воде, зеркалам, стенам и любым отражающим поверхностям.

Что-то происходит с тенями. Источник: fusionbrain.ai

Повторяющиеся элементы

Чем больше объектов на картинке, тем выше вероятность, что некоторые из них будут очень похожи друг на друга или даже повторяться.

Деревья и кустарники сделаны как под копирку и выглядят слишком идеально. Источник: fusionbrain.ai

Бессмысленные надписи

Иногда надписи на ИИ-изображениях вообще не имеют смысла. Поэтому ещё один из способов — прочитать тексты на картинке. Правда, среди нейросетей есть исключения, способные генерировать надписи. Например, Ideogram, Flux или Grok — они создают контент с читаемым текстом.

Все слова на картинке — несуществующие. Источник: fusionbrain.ai

Нет метаданных

Метаданные — это информация, которая сохраняется на фотографии: модель камеры или смартфона, дата и время съёмки, локация, технические характеристики. Правда, метаданные можно легко удалить самостоятельно, поэтому это только один из признаков.

Нет источника изображения

Ещё один технический способ определить нейрокартинку — проверить источник изображения с помощью обратного поиска по картинке. Например, через Google Image или «Яндекс Картинки». Если найти источник не выходит, возможно, изображение сгенерировала нейросеть.

Искажённые пропорции тела

Даже в роликах, созданных такими продвинутыми нейросетями, как Hailuo AI, временами появляются персонажи со странными руками и другими нереалистичными анатомическими особенностями. В общем, всё то же самое, что и с картинками.

Источник: hailuoai.video

Неестественные движения

ИИ всё лучше справляется с генерацией реалистичных видео, но иногда люди и животные на них двигаются либо слишком быстро, либо слишком медленно, либо просто странно дёргаются. То же самое касается движений глаз: если внимательно присмотреться, видно, что моргают персонажи не с той скоростью и частотой, что бывает у людей.

Здесь вызывает подозрения и физика, и движения, и мимика. Источник: Sora.com

Игнорирование законов физики

Может сложиться впечатление, что на экране «Начало» Нолана, но есть нюанс: если фантастические фильмы играют на условностях, то нейросети — просто косячат.

Например, на видео ниже явно делали ставку на реалистичность. Но есть одно но: когда человек идёт по снегу, он не оставляет следов. Конечно, возможно, это выдуманный мир, где живут суперлёгкие люди, не оставляющие следов, но тогда почему на некоторых кадрах следы есть.

Задачка со звёздочкой: если человек не оставляет следов на песке, то кто оставил их до него? Источник: Sora.com

Странная смена деталей

Часто ИИ «забывает», какие детали придумал в начале ролика, и меняет их к финалу. На этом видео искусственный интеллект постоянно меняет цвет краски на кисточке, хотя рука не отрывается от холста. В целом в сгенерированном видео объекты часто исчезают или меняются. Но уловить такие детали бывает непросто — нужно вглядываться.

Загадочные метаморфозы цвета краски на кисточке. Источник: Sora.com

Молчание

Как правило, в реалистичных видео персонажи просто молчат. Нейросети ещё не очень хорошо справляются с тем, чтобы герои шевелили губами естественно, поэтому звука на них либо нет, либо его подкладывают — например, вставляют музыку.

Девушка молчит и делает важные заметки прямо на столе. Источник: Sora.com

Несовпадение голоса с движениями рта может указывать на дипфейк.

Впрочем, в декабре 2024 года Kandinsky выпустил версию 4.0, которая генерирует аудио по видео. Как это выглядит на деле — пока не понятно, потому что сейчас эту функцию могут протестировать только некоторые дизайнеры, художники, кинематографисты и блогеры. Открыть полный доступ для всех желающих разработчики обещают в первом квартале 2025 года.

Дисклеймер: все они могут ошибаться.

Hive AI Detector — сервис для определения ИИ-изображений с бесплатными и платными опциями, оплатить картой российского банка нельзя. Цена — по запросу.
AI or Not — позволяет проверять до 10 изображений в месяц бесплатно, а дальше — нужна подписка (от $5). Оплатить картой российского банка нельзя.
SDXL Detector от Hugging Face — бесплатный сервис для выявления ИИ-изображений.
Tonfotos, ExifTool, Metadata — бесплатные сервисы для проверки метаданных.
TinEye — бесплатный сервис для поиска источника изображения.
TrueMedia и Deepware scanner — бесплатные сервисы, которые распознают ИИ-видео.

Дрожание голоса

Если прислушаться к треку «Ain’t Got a Nickel Ain’t Got a Dime», созданным Suno, можно заметить, что голос «исполнителя» дрожит, но не так, как у человека. Вокал, как пишет старший редактор раздела технологий иностранного медиа Lifehacker Джейк Питерсон, «звучит почти как при автотюне, но всё же роботизированно». Автотюном называют редактирование вокала, при котором исправляют неточно спетые ноты и интонацию. Обычно голоса правят незаметно, но иногда настройки «выкручивают» специально, как в треке «Love Lockdown» Kanye West.

Низкое качество звука

Иногда треки звучат как старые MP3 — например, это заметно в сэмплах Soundful и Loudly. Впрочем, низкое качество звука характерно и для музыкантов жанра lo-fi, поэтому «подубитая» запись ещё не говорит о том, что трек написан ИИ.

Нелогичность

Если песня сгенерирована удачно, на первый взгляд может показаться, что всё в порядке. Но при внимательном прослушивании в хороших наушниках временами всплывают «странности»: проскальзывают нелогичные предложения, «как-то не так» развивается мелодия. Вот ещё одно из наблюдений Питерсона: «есть ощущение, что в “Stone” Suno забыл, как должен звучать припев».

Иногда услышать, что «что-то не так», помогает трюк — смена скорости песни.

Сервисов по распознанию ИИ-музыки пока нет. Альтернативные варианты — программы по определению искусственных голосов и сервисы, в которых можно изменить скорость воспроизведения трека.

AI Voice Detector проводит анализ и определяет голоса, сгенерированные ИИ. Работает только по платной подписке: $12,99 в месяц или $130 в год. Оплатить картой российского банка нельзя.
PlayHT. В нём есть функция «AI voice detection», которая также выявляет искусственно созданные голоса. Это бесплатно.
TimeStretch — бесплатный сервис, в котором можно менять скорость воспроизведение треков.

Ниже — лайфхаки, которые помогут распознать созданный нейросетями материал:

Уточнение у ChatGPT. Работает не только с текстом, но и с изображениями: достаточно отправить чат-боту файл и спросить, мог ли его создать ИИ. ChatGPT не даёт утвердительных ответов, но показывает, какие детали ему кажутся подозрительными.

ChatGPT не только даёт ответ, но и подсказывает сервисы для проверки

Проверка в нейросетях. Для этого надо подумать, какой промпт мог использоваться для создания файла, а потом — сгенерировать по нему нужный контент. Если получится что-то похожее, значит, фото, видео, текст или трек созданы ИИ. Облегчит задачу сервис imageprompt.org, который напишет промпт по картинке.
Просто «что-то не так». Даже если нет слишком длинных рук или подозрительного дрожания голоса, может возникать «эффект зловещей долины». Так называют отвращение или неприязнь к объекту, похожему на человека, но ведущему себя неестественно. Например, могут отталкивать слишком медленные движения или странная мимика.

Тексты. Нужно смотреть на повторяющиеся фразы и нетипичные для человека формулировки, а также проверять факты в тексте, потому что нейросети их часто выдумывают. Ещё ИИ-тексты обычно состоят из сплошных списков.
Изображения. Как правило, они выглядят слишком идеальными, вдобавок в таких файлах нет метаданных и источника изображения. Ещё важно присматриваться к пропорциям тел и предметов, расположению теней и отражений — нейросети их часто искажают. На то, что руку к созданию картинки приложил ИИ, могут указывать размытый фон, повторяющиеся элементы и бессмысленные надписи.
Видео. Основные признаки: искажённые пропорции тела, неестественные движения, размытый фон. Герои ИИ-видео обычно молчат. Ещё в роликах часто игнорируются законы физики и меняются детали — например, к финалу действия у персонажа может смениться причёска.
Музыка. Низкое качество звука и дрожащий «задыхающийся» голос могут говорить о том, что музыку создала нейросеть. Кроме того, иногда песня развивается нетипично.
Важно полагаться и на интуицию: если в голове крутится мысль «здесь что-то не так», возможно, так и есть. Ещё можно проверить следы ИИ через ChatGPT (работает с текстами и фото). Или попробовать угадать промпт, по которому мог быть создан файл, и прогнать его через популярные нейросети.
Пока не существует сервисов, которые на 100% определяют сгенерированный контент.
По отдельности некоторые признаки могут говорить не о том, что контент создан нейросетью, а о том, что у автора своё видение. Поэтому выносить приговор стоит по совокупности признаков.

А вы умеете распознавать сгенерированный контент «на глаз»? Полагаетесь на интуицию или пользуетесь специальными сервисами?

Как определить дипфейк: признаки контента, созданного нейросетью

Как распознать сгенерированный нейросетью текст

Сервисы для определения сгенерированного текста

Как определить сгенерированное изображение

Как определить сгенерированное видео

Сервисы для определения сгенерированных изображений и видео

Как распознать сгенерированную музыку

Сервисы для определения сгенерированной музыки

И ещё немного советов для проверки любого контента

Коротко: как проверить, что контент создала нейросеть