«Да я честно сам писал!» − как распознать ИИ в тексте научной работы

Целевая аудитория этой статьи – редакторы, преподаватели, научные руководители и все, кому приходится по долгу службы иметь дело с курсовыми, дипломными и другими учебными и научными текстами.

Представим ситуацию − студент сдал работу, вы прогоняете ее через систему «Антиплагиат» и она выдает большой восклицательный знак, предупреждая, что в работе есть подозрительный фрагмент текста, который возможно был написан с помощью сервисов искусственной генерации текста. Но… наверняка, к сожалению, знать нельзя. Такая отметка не дает прямых оснований отклонить работу или не допустить студента к защите. Она лишь уведомляет, что к тексту стоит присмотреться внимательнее, а окончательное решение остается за вами.

Рассказываем, как не оказаться «плохим парнем» в жизни честного студента и, что еще хуже, в своей собственной.

Алгоритм действий такой: при появлении пометки о наличии сгенерированного текста необходимо побеседовать со студентом, чтобы оценить, владеет ли он материалом, и провести дополнительный анализ текста. Уверены, что с беседой вы справитесь самостоятельно, а вот с анализом поможем мы.

Немного о самом детекторе машинно сгенерированных текстов в системе «Антиплагиат». Он работает на основе алгоритмов искусственного интеллекта, обучен и протестирован на большом массиве данных. Это сводит к минимуму риск ложного срабатывания.

Наша система обработала колоссальное количество текстов, чтобы научиться определять искусственно созданные фрагменты. В основе этой функции лежит ряд признаков, свойственных искусственно сгенерированным текстам. Невооруженным глазом эти признаки распознать невозможно, тем не менее у ИИ текстов есть и другие особенности, которые выдают их. И, если знать, что искать, их вполне можно распознать самостоятельно. Именно это мы и научим вас делать.

Искусственный интеллект пишет тексты, которые могут выглядеть очень правдоподобно, наукообразно и иметь высокий процент оригинальности. При этом, если вчитаться повнимательнее, можно найти признаки, которые выдадут искусственного создателя с головой.

1. Бессмысленные фразы:

«Маркетинговые коммуникации представляют собой совокупность усилий компании по созданию благоприятных условий для успешной и прибыльной деятельности на рынке, посредством воздействия на ее внутреннюю и внешнюю среду».
«В этом можно увидеть ряд основных принципов: цель, способ и способы достижения цели».
«Введение диплома по анализу и совершенствования управления организацией, является важнейшим компонентом, который задает контекст и цель для всего исследования».

2. Искаженные словосочетания, термины или клише¹.

3. Странно написанные устоявшиеся определения. Это обычно говорит об использовании ИИ для перефразирования чужого текста.

4. Почти дословные повторы одной и той же мысли.

5. Фейковые ссылки или полное отсутствие ссылок на источники даже в тех случаях, когда из текста следует явная необходимость ссылок. Например: «многие исследователи пишут о…» или «существует ряд исследований…» и т.д.

6. Фактические ошибки, ложная информация, фейковые факты.

7. Фразы, которые проникли в текст из диалога с ботом:

«Сгенерировать ответ заново»
«Как большая языковая модель, я…»
«На момент моего последнего обновления знаний в сентябре 2023 года…»³

Если в работе нашлось сразу несколько таких признаков, вероятнее всего ее написали с помощью генеративных сервисов. Да, неоспоримых доказательств привести нельзя, но в любом случае указанные признаки говорят о крайне низком качестве текста. Такую работу вполне оправданно можно отклонить и отправить на доработку студенту по причине несоответствия требованиям вуза к ВКР.

Если же текст работы соответствует требованиям вуза, и студент демонстрирует полноценное владение материалом, то вы можете снять отметку о подозрительности вручную с соответствующим комментарием.

Более подробную и техническую инструкцию можно посмотреть тут: https://antiplagiat.ru/wp-content/uploads/2023/06/ai_memo_2023.pdf

_______________________________________

¹ Guillaume Cabanac, Cyril Labbé, Alexander Magazinov Tortured phrases: A dubious writing style emerging in science Evidence of critical issues affecting established journals URL: https://arxiv.org/pdf/2107.06751

² Гольдман И.Я., Добробабенко Н.С. Практика рекламы. Десять уроков для советского бизнесмена: Учебник [Текст]. – Новосибирск: СП Интербук, 1991. – 73 с.

³ Guillaume Cabanac, Cyril Labbé, Alexander Magazinov Tortured phrases: A dubious writing style emerging in science Evidence of critical issues affecting established journals URL: arxiv.org/pdf/2107.06751

«Да я честно сам писал!» − как распознать ИИ в тексте научной работы

Как система «Антиплагиат» распознает ИИ тексты

Теперь к главному, показываем на реальных примерах характерные признаки искусственно сгенерированных текстов