Как самостоятельно определить, что текст написала нейросеть: 6 шагов
Шпаргалка для тех, кто хочет подловить своего копирайтера или просто вывести свои ИИ-тексты на новый уровень
Меня зовут Карина Ахметгалиева. Я практикующий копирайтер и основатель онлайн-школы по текстам – мой телеграм-канал. С помощью моих продуктов не только обучаю людей с нуля новой профессии, но и помогаю действующим специалистам выйти на новый уровень.
В технологическом университете МИРЭА недавно провели эксперимент, в котором приняли участие 20 преподавателей и свыше 200 студентов. Половина из них писали научную работу самостоятельно. А другие 50% воспользовались помощью нейросетей. Преподавателям же предстояло вычислить такие ИИ‑материалы.
Чтобы это сделать, педагоги обращали внимание на стилистические и орфографические особенности текста. Например, на большое количество повторяющихся слов и смыслов, фактические и логические ошибки, отсутствие оригинальных суждений. Таким способом преподаватели смогли выявить 96% работ, написанных с помощью нейросети. 4% студентов же, которых не разоблачили, признались, что потратили на редактуру ИИ‑текста много часов.
Универсальной инструкции, которая поможет вычислить текст, сгенерированный нейросетью, не существует. Однако проведённый эксперимент показывает: таким материалам присущи схожие паттерны. Рассмотрим их подробнее.
- Повторы смыслов и слов
Нейросеть в ответ на запрос зачастую «отвечает по кругу». Иногда она использует разные вхождения, но смысл всё равно повторяется.
Так, на скриншоте, представленном ниже, искусственному интеллекту была поставлена задача написать продающий пост о новом щадящем способе окрашивания волос. И в небольшом тексте нейросеть неоднократно повторила одни и те же тезисы.
Почти в каждом предложении сгенерированного текста повторяется словосочетание «новый способ окрашивания». А также присутствует неоднократное дублирование смыслов о безопасности метода и индивидуальном подходе, который позволит подчеркнуть уникальность каждого клиента.
2. Наличие в тексте большого количества штампов и клише, отсутствие чувственного опыта
Пример с окрашиванием также показывает: имитировать то, как человек говорит в жизни, нейросеть не может. Люди опечатываются, используют сленг и сокращения, намеренно искажают слова. Такая подача помогает привлечь внимание, вызвать эмоции, передать позицию автора, его чувственный опыт.
Исследования показывают: нейросеть не делится чувствами, не принимает чью‑либо позицию. Поэтому предпочитает нейтральность, штампы и клише. В указанном выше примере это «профессиональные навыки», «высококачественные материалы», «уникальная возможность».
3. Наличие бессмысленных фраз и отсутствие логики
Алгоритмы помогают нейросети строить правильные предложения с точки зрения грамматики. Однако для ИИ не существует понятия «смысл». И логика для каждого абзаца у него может быть своя, поскольку материал получен из разных источников.
К примеру, нейросеть попросили сгенерировать отзыв на спортивный костюм. Текст получился таким: «С помощью костюма можно расслабиться, погрузиться в мир спорта, а также выйти на прогулку. Он имеет регулировку температуры, благодаря которой чувствуешь себя комфортно в любой ситуации».
Некоторые фразы правильно построены, но при этом кажутся абсурдными и напоминают иллюстрацию Хомского.
4. Отсутствие фактуры и поверхностные примеры
Искусственный интеллект даёт в текстах очевидную информацию, общие факты, использует обтекаемые фразы и примеры, которые мало раскрывают вопрос. При этом сложность темы не имеет значения. Вопрос может быть глубоким, как, например, перспективы развития инклюзия в России. Или более простым и индивидуальным, касающимся выбора техники.
В тексте про инклюзию нейросеть рассказала, как важна и актуальна эта тема. А также добавила, что инклюзия — это долгий процесс, сопровождающийся сложностями, но работы по созданию условий для людей с особенностями проводятся. И подвела итог: если не останавливаться, то развитие непременно будет.
Однако написанное не раскрывает вопрос. Важно, чтобы в тексте была конкретика. К примеру, можно проанализировать, какие из принятых законов работают, а какие — нет и почему. Раскрыть зарубежный опыт. И пояснить, какие конкретные шаги для развития инклюзии может ещё сделать государство, бизнес и каждый человек.
В тексте про покупку смартфона, сгенерированном нейросетью, также указаны очевидные факторы выбора. Например: следует определиться с операционной системой (iOS или Android), брендом, ознакомиться с отзывами и техническими характеристиками, а также учитывать собственные возможности.
Однако люди и так это понимают. Другое дело — рассказать про фишки операционных систем, указать ограничения, существующие на данный момент. Или упомянуть об инновационных решениях — например, о технологии eSIM, позволяющей иметь до пяти номеров в одном смартфоне. Или поделиться моделями устройств с завышенной ценой и их аналогами по оптимальной стоимости.
5. Искажение фактов, добавление придуманной информации
Нейросеть правдоподобно отвечает на практически любой вопрос, предоставляя хронику, даты, фамилии, историю происхожден��я. При этом информация бывает искажённой или полностью выдуманной. Такой баг в работе ИИ называют галлюцинацией.
Так, нейросети была поставлена задача: рассказать о знаменитых глухих людях, которые внесли большой вклад в развитие общества. В результате ИИ большую часть из них выдумал.
Например, астронавта Раймонда Лу или боксёра Марио Галлегоса. А 42‑м президентом США всё же был не Мэттью Клинтон, а Билл Клинтон. И слуха он не терял.
Когда фальшивые факты переплетены с правдивыми данными, обнаружить галлюцинации нейросети сложнее. Особенно при беглом чтении. Но если сконцентрироваться на приведённых в тексте примерах, можно заметить те, что выглядят подозрительно, и проверить их, забив в строку поиска.
6. Отсутствие актуальной информации о текущих изменениях, событиях
Нейросети самообучаются при общении с пользователями, запоминая уточнения человека, его реакцию на сгенерированный контент, примеры, которыми человек делится с ботом. Эксперты отметили, что способность ИИ самообучаться стала для них неожиданностью. И что это умение помогает нейросетям совершенствоваться.
При этом машинное обучение, проводимое разработчиками на гигабайтах данных — статьях, книгах, текстах из Сети, — имеет чёткое начало и конец. И в основном нейросети не имеют доступа к поисковым системам. Поэтому информация, которая появилась после проведённого разработчиками обучения, недоступна ИИ до следующего этапа.
Если в тексте нет актуальных сведений по теме или он выглядит оторванным от реальности, поскольку за последнее время многое изменилось, то существует вероятность, что материал писала нейросеть.
Подписывайтесь на мой Телеграм-канал, если было полезно. Там я разбираю ошибки в текстах, портфолио, откликах, рассказываю как выстроить очередь из клиентов и стать востребованным копирайтером.