Как определить дипфейк: признаки контента, созданного нейросетью
Бездушные фразы, автотюн, молчаливые герои и другие показатели.
Легко понять, что контент сгенерирован, если на картинке люди с шестью пальцами, а на видео персонажи проходят сквозь друг друга. Но с развитием технологий задача усложняется: ИИ-творения становятся всё реалистичнее и определить нейрослед иногда практически невозможно.
В этой статье — подсказки и программы, с помощью которых можно выявить такой контент.
Содержание
- Как распознать сгенерированный нейросетью текст
- Сервисы для определения сгенерированного текста
- Как определить сгенерированное изображение
- Как определить сгенерированное видео
- Сервисы для определения сгенерированных изображений и видео
- Как распознать сгенерированную музыку
- Сервисы для определения сгенерированной музыки
- И ещё немного советов для проверки любого контента
- Коротко: как проверить, что контент создала нейросеть
Как распознать сгенерированный нейросетью текст
Повторы
Если одна и та же мысль упоминается несколько раз, возможно, текст написан ИИ. Происходит это потому, что многие нейросети «не осознают», что говорят одно и то же.
Разработчики OpenAI, создавшие ChatGPT, пишут в блоге: «Часто модель бывает чересчур разговорчивой и повторяет некоторые фразы, — например, раз за разом говорит, что её обучили в OpenAI. Происходит это потому, что специалисты, которые обучают ИИ, тренируют его давать более длинные ответы».
Тогда неудивительно, что нейросеть льёт воду как студент в дипломе и пишет «водянистые» выводы.
Допустим, в этом тексте про продуктивность ChatGPT упоминает технику помидора два раза.
Конечно, повторяются (специально или случайно) и люди, поэтому важно «выносить вердикт» по совокупности признаков.
Бесконечные списки
Если статья или другой текст состоит из сплошных списков — это тоже звоночек. Люди используют их не так часто, как нейросети.
Обычно списки делают для того, чтобы информацию было проще воспринимать. Но важно учитывать формат. К примеру, если текст с инструкцией состоит на 80% из списков — это ок, но если столько же списков в сочинении или новости — то это уже сомнительно.
Формальный тон
Вроде всё логично и грамотно, но текст написан безэмоционально, а некоторые слова, фразы или даже целые предложения звучат неестественно. Как утверждает в своём блоге Сатья Д. — гендиректор сервиса по SEO-оптимизации Surfer, — ИИ часто начинает фразы с «by» («c помощью»).
То же самое относится и к текстам на русском языке. Например, в материале про то, как правильно выбрать температуру для утюга, ChatGPT использует оборот «пожароопасная ситуация», который больше подходит для технической инструкции, чем для статьи на сайте. Здесь будет уместнее «пожар». Также в этом контексте суховато звучит фраза «продлить срок службы одежды». Человек бы так не сказал.
Выдуманные факты
Нейросети периодически врут — вставляют несуществующие факты. Например, в этом тексте Claude пишет, что костюм чумного доктора придумал врач Карло Урбани. Такой врач и правда был, но родился он в 1956 году. А вот про Константинополь — да, по некоторым данным, чума убила примерно 300 тысяч человек. Правда, это была другая чума — Юстинианова (ок. 541–750 гг. н.э.) В общем, каждый факт надо проверять под лупой.
Сервисы для определения сгенерированного текста
Определить нейросетевой след помогут:
- Writer AI Content Detector — бесплатный сервис, в котором можно проверять до 5 тысяч знаков ежедневно.
- GPTZero — сервис, в котором можно бесплатно проверять до 5 тысяч знаков ежедневно. За больший объём нужно платить, цены начинаются от $8,33 в месяц. Оплатить картой российского банка нельзя.
Нюанс: по данным исследования сингапурских и вьетнамских учёных, точность ИИ-детекторов в среднем составляет 39,5%. Если текст редактируют и намеренно добавляют в него ошибки, показатель снижается до 22%.
Как определить сгенерированное изображение
Странная анатомия
Нейросети часто ошибаются с анатомическими особенностями и пропорциями — например, создают шесть пальцев вместо пяти, уши странной формы или разные по длине стопы.
То же самое касается форм объектов на ИИ-изображениях: входная дверь может быть слишком длинной, а мотоцикл — слишком маленьким по отношению к человеку.
Слишком идеальное изображение
ИИ часто лишает объекты деталей и текстуры. Отсюда, к примеру, идеально пропорциональные лица с супергладкой кожей. В жизни таких людей не существует. Самые продвинутые из нейросетей научились добавлять мимические морщинки, поры и прыщики, но даже те выглядят «причёсанно».
Идеальная картинка может также указывать на обработку в фоторедакторе или другой нейросети, поэтому полностью полагаться на этот признак не стоит.
Размытый фон
Ещё его называют «боке». Нейросети любят использовать размытый фон. Но боке может быть и художественным приёмом — такого эффекта можно добиться с помощью объектива. Поэтому стоит смотреть и на другие признаки.
Неправильные тени и отражение
Нейросети часто ошибаются и с этими деталями, поэтому стоит присматриваться к воде, зеркалам, стенам и любым отражающим поверхностям.
Повторяющиеся элементы
Чем больше объектов на картинке, тем выше вероятность, что некоторые из них будут очень похожи друг на друга или даже повторяться.
Бессмысленные надписи
Нет метаданных
Метаданные — это информация, которая сохраняется на фотографии: модель камеры или смартфона, дата и время съёмки, локация, технические характеристики. Правда, метаданные можно легко удалить самостоятельно, поэтому это только один из признаков.
Нет источника изображения
Ещё один технический способ определить нейрокартинку — проверить источник изображения с помощью обратного поиска по картинке. Например, через Google Image или «Яндекс Картинки». Если найти источник не выходит, возможно, изображение сгенерировала нейросеть.
Как определить сгенерированное видео
Искажённые пропорции тела
Даже в роликах, созданных такими продвинутыми нейросетями, как Hailuo AI, временами появляются персонажи со странными руками и другими нереалистичными анатомическими особенностями. В общем, всё то же самое, что и с картинками.
Неестественные движения
ИИ всё лучше справляется с генерацией реалистичных видео, но иногда люди и животные на них двигаются либо слишком быстро, либо слишком медленно, либо просто странно дёргаются. То же самое касается движений глаз: если внимательно присмотреться, видно, что моргают персонажи не с той скоростью и частотой, что бывает у людей.
Игнорирование законов физики
Может сложиться впечатление, что на экране «Начало» Нолана, но есть нюанс: если фантастические фильмы играют на условностях, то нейросети — просто косячат.
Например, на видео ниже явно делали ставку на реалистичность. Но есть одно но: когда человек идёт по снегу, он не оставляет следов. Конечно, возможно, это выдуманный мир, где живут суперлёгкие люди, не оставляющие следов, но тогда почему на некоторых кадрах следы есть.
Странная смена деталей
Часто ИИ «забывает», какие детали придумал в начале ролика, и меняет их к финалу. На этом видео искусственный интеллект постоянно меняет цвет краски на кисточке, хотя рука не отрывается от холста. В целом в сгенерированном видео объекты часто исчезают или меняются. Но уловить такие детали бывает непросто — нужно вглядываться.
Молчание
Как правило, в реалистичных видео персонажи просто молчат. Нейросети ещё не очень хорошо справляются с тем, чтобы герои шевелили губами естественно, поэтому звука на них либо нет, либо его подкладывают — например, вставляют музыку.
Несовпадение голоса с движениями рта может указывать на дипфейк.
Впрочем, в декабре 2024 года Kandinsky выпустил версию 4.0, которая генерирует аудио по видео. Как это выглядит на деле — пока не понятно, потому что сейчас эту функцию могут протестировать только некоторые дизайнеры, художники, кинематографисты и блогеры. Открыть полный доступ для всех желающих разработчики обещают в первом квартале 2025 года.
Сервисы для определения сгенерированных изображений и видео
Дисклеймер: все они могут ошибаться.
- Hive AI Detector — сервис для определения ИИ-изображений с бесплатными и платными опциями, оплатить картой российского банка нельзя. Цена — по запросу.
- AI or Not — позволяет проверять до 10 изображений в месяц бесплатно, а дальше — нужна подписка (от $5). Оплатить картой российского банка нельзя.
- SDXL Detector от Hugging Face — бесплатный сервис для выявления ИИ-изображений.
- Tonfotos, ExifTool, Metadata — бесплатные сервисы для проверки метаданных.
- TinEye — бесплатный сервис для поиска источника изображения.
- TrueMedia и Deepware scanner — бесплатные сервисы, которые распознают ИИ-видео.
Как распознать сгенерированную музыку
Дрожание голоса
Если прислушаться к треку «Ain’t Got a Nickel Ain’t Got a Dime», созданным Suno, можно заметить, что голос «исполнителя» дрожит, но не так, как у человека. Вокал, как пишет старший редактор раздела технологий иностранного медиа Lifehacker Джейк Питерсон, «звучит почти как при автотюне, но всё же роботизированно». Автотюном называют редактирование вокала, при котором исправляют неточно спетые ноты и интонацию. Обычно голоса правят незаметно, но иногда настройки «выкручивают» специально, как в треке «Love Lockdown» Kanye West.
Низкое качество звука
Нелогичность
Если песня сгенерирована удачно, на первый взгляд может показаться, что всё в порядке. Но при внимательном прослушивании в хороших наушниках временами всплывают «странности»: проскальзывают нелогичные предложения, «как-то не так» развивается мелодия. Вот ещё одно из наблюдений Питерсона: «есть ощущение, что в “Stone” Suno забыл, как должен звучать припев».
Иногда услышать, что «что-то не так», помогает трюк — смена скорости песни.
Сервисы для определения сгенерированной музыки
Сервисов по распознанию ИИ-музыки пока нет. Альтернативные варианты — программы по определению искусственных голосов и сервисы, в которых можно изменить скорость воспроизведения трека.
- AI Voice Detector проводит анализ и определяет голоса, сгенерированные ИИ. Работает только по платной подписке: $12,99 в месяц или $130 в год. Оплатить картой российского банка нельзя.
- PlayHT. В нём есть функция «AI voice detection», которая также выявляет искусственно созданные голоса. Это бесплатно.
- TimeStretch — бесплатный сервис, в котором можно менять скорость воспроизведение треков.
И ещё немного советов для проверки любого контента
Ниже — лайфхаки, которые помогут распознать созданный нейросетями материал:
- Уточнение у ChatGPT. Работает не только с текстом, но и с изображениями: достаточно отправить чат-боту файл и спросить, мог ли его создать ИИ. ChatGPT не даёт утвердительных ответов, но показывает, какие детали ему кажутся подозрительными.
Проверка в нейросетях. Для этого надо подумать, какой промпт мог использоваться для создания файла, а потом — сгенерировать по нему нужный контент. Если получится что-то похожее, значит, фото, видео, текст или трек созданы ИИ. Облегчит задачу сервис imageprompt.org, который напишет промпт по картинке.
Просто «что-то не так». Даже если нет слишком длинных рук или подозрительного дрожания голоса, может возникать «эффект зловещей долины». Так называют отвращение или неприязнь к объекту, похожему на человека, но ведущему себя неестественно. Например, могут отталкивать слишком медленные движения или странная мимика.
Коротко: как проверить, что контент создала нейросеть
- Тексты. Нужно смотреть на повторяющиеся фразы и нетипичные для человека формулировки, а также проверять факты в тексте, потому что нейросети их часто выдумывают. Ещё ИИ-тексты обычно состоят из сплошных списков.
- Изображения. Как правило, они выглядят слишком идеальными, вдобавок в таких файлах нет метаданных и источника изображения. Ещё важно присматриваться к пропорциям тел и предметов, расположению теней и отражений — нейросети их часто искажают. На то, что руку к созданию картинки приложил ИИ, могут указывать размытый фон, повторяющиеся элементы и бессмысленные надписи.
- Видео. Основные признаки: искажённые пропорции тела, неестественные движения, размытый фон. Герои ИИ-видео обычно молчат. Ещё в роликах часто игнорируются законы физики и меняются детали — например, к финалу действия у персонажа может смениться причёска.
- Музыка. Низкое качество звука и дрожащий «задыхающийся» голос могут говорить о том, что музыку создала нейросеть. Кроме того, иногда песня развивается нетипично.
- Важно полагаться и на интуицию: если в голове крутится мысль «здесь что-то не так», возможно, так и есть. Ещё можно проверить следы ИИ через ChatGPT (работает с текстами и фото). Или попробовать угадать промпт, по которому мог быть создан файл, и прогнать его через популярные нейросети.
- Пока не существует сервисов, которые на 100% определяют сгенерированный контент.
- По отдельности некоторые признаки могут говорить не о том, что контент создан нейросетью, а о том, что у автора своё видение. Поэтому выносить приговор стоит по совокупности признаков.
А вы умеете распознавать сгенерированный контент «на глаз»? Полагаетесь на интуицию или пользуетесь специальными сервисами?