Горе-SEO-шник, Яндекс и детекторы ИИ (басня)
Жил-был Человек. Умный, толковый, а главное — с идеей. Захотел он создать полезный сервис, который решал бы проблему одной из его субличностей, облегчал жизнь другим подобным товарищам и нес в мир добро. На волне оптимизма сделал сайт, помимо сервиса, выложил на него отличные, как ему казалось, по содержание инфостатьи. Уникальные по Text.ru, по Главреду чистые и читаемые на 8 и выше. Да, без новизны, но все в них было по делу, с логикой и пользой. Опубликовал — и стал ждать.
Суровый Яндекс не впечатлился. Мало того, что не проиндексировал статейки, так ещё и фильтр МПК на всё повесил. «Как же так? И что же теперь делать?» — озадаченно-расстроено подумал Человек.
Оптимизм поутих. И субличность-программист тут же зарылась в новые для себя SEO-шные дебри, что надо было сделать изначально. В результате выяснилось, что тексты текстами и польза пользой, а SEO никто не отменял: на сайте никакой оптимизации не было, как не было и функционала для этого. Посидела несколько дней субличность-программист, потрудилась, нашла об кого подумать (в процессе родилась эта статья) и стало на сайте всё по канонам: titles, descriptions, микроразметка, картинки с alt’ами. Ну, просто божественная обертка для SEO-конфеток!
Субличность-копирайтер при этом схватилась за голову: «А может все дело собственно в «конфетках»? Сами тексты, наверное, *овно! Вот и не индексируются!»
Появилась догадка: а вдруг всему виной ИИ? Статьи-то писались не вручную, а с помощью нейросетей. Может, Яндекс увидел в них машинный стиль и забанил? Надо было это тоже исправить!
В бой за сайт вступили детекторы ИИ, и с ними Человек столкнулся впервые. Для надежности использовал три:
- GigaCheck от Сбера,
- Copyleaks — «самый точный детектор ИИ по исследованиям третьих лиц»,
- ИИ-детектор от Text-Craft.
Если первый просто предполагает, создан текст человеком или ИИ, то другие два дают цифры, а насколько ими обоими он написан, то есть дают процент «человечности».
И тут начались интересности...
GigaCheck в большинстве случаев правильно определял человек или ИИ, да или нет.
«Самый точный детектор» уверенно определял откровенную ИИ-шную безэмоциональную писанину. Но когда текст немного дорабатывался (Человек прокачался в промт-инжиниринге), то в показаниях уже путался. То куски, написанные ИИ, выдавал за человеческие, то наоборот, что было обиднее. Более того, порой было ощущение, что он просто брал и резал текст примерно пополам: верхнюю часть сплошняком определял человеческой, нижнюю — машинной. Реже наоборот. И никакой логики в этом не было.
Text-Craft оказался точнее и давал более адекватные результаты, как минимум подчеркивал машинописные участки более-менее точно и точечно.
Но самое неожиданное открытие случилось, когда во время проверки текста из него убрали списки. Не содержание пунктов, а именно их оформление: нумерацию или маркировку. И вуаля! Copyleaks вдруг начал на ходу «переобуваться»: есть оформленные списки в тексте — текст написан на 100% ИИ, убираем оформление — текст становится написанным человеком. Иногда для «переобувания» достаточно было просто добавить переносы на новую строку между абзацами.
Так как с Текст-Крафтом такое не прокатывало, Человек принял решение опираться в работе на него. Если в нем все было окей, в остальных тоже.
И заодно провел эксперимент: сгенерировал текст с помощью ИИ и проверил на трех вышеуказанных детекторах.
И в тот момент Человек задумался: «Насколько же вообще можно доверять этим детекторам? Как мы можем на них опираться, если они дают такие странные результаты и если ими так легко можно манипулировать? И как вообще понять, какая «человечность» нужна (если нужна) Яндексу и каким детектором ИИ он будет (если будет) ее проверять?» Вопросы без ответов…
Но если вернуться к басне, то после настройки SEO и переработки статей в более «человечные» (но до добавления на сайт картинок!), Яндекс переобошел странички, проиндексировал их и снял с большинства статей фильтр МПК. Человек облегченно выдохнул — можно работать дальше.
А мораль у басни такова: Учите всё-таки SEO-матчасть, осваивайте промт-инжиниринг — и будет вам счастье!