«Да я честно сам писал!» − как распознать ИИ в тексте научной работы
Целевая аудитория этой статьи – редакторы, преподаватели, научные руководители и все, кому приходится по долгу службы иметь дело с курсовыми, дипломными и другими учебными и научными текстами.
Представим ситуацию − студент сдал работу, вы прогоняете ее через систему «Антиплагиат» и она выдает большой восклицательный знак, предупреждая, что в работе есть подозрительный фрагмент текста, который возможно был написан с помощью сервисов искусственной генерации текста. Но… наверняка, к сожалению, знать нельзя. Такая отметка не дает прямых оснований отклонить работу или не допустить студента к защите. Она лишь уведомляет, что к тексту стоит присмотреться внимательнее, а окончательное решение остается за вами.
Рассказываем, как не оказаться «плохим парнем» в жизни честного студента и, что еще хуже, в своей собственной.
Алгоритм действий такой: при появлении пометки о наличии сгенерированного текста необходимо побеседовать со студентом, чтобы оценить, владеет ли он материалом, и провести дополнительный анализ текста. Уверены, что с беседой вы справитесь самостоятельно, а вот с анализом поможем мы.
Как система «Антиплагиат» распознает ИИ тексты
Немного о самом детекторе машинно сгенерированных текстов в системе «Антиплагиат». Он работает на основе алгоритмов искусственного интеллекта, обучен и протестирован на большом массиве данных. Это сводит к минимуму риск ложного срабатывания.
Наша система обработала колоссальное количество текстов, чтобы научиться определять искусственно созданные фрагменты. В основе этой функции лежит ряд признаков, свойственных искусственно сгенерированным текстам. Невооруженным глазом эти признаки распознать невозможно, тем не менее у ИИ текстов есть и другие особенности, которые выдают их. И, если знать, что искать, их вполне можно распознать самостоятельно. Именно это мы и научим вас делать.
Теперь к главному, показываем на реальных примерах характерные признаки искусственно сгенерированных текстов
Искусственный интеллект пишет тексты, которые могут выглядеть очень правдоподобно, наукообразно и иметь высокий процент оригинальности. При этом, если вчитаться повнимательнее, можно найти признаки, которые выдадут искусственного создателя с головой.
1. Бессмысленные фразы:
- «Маркетинговые коммуникации представляют собой совокупность усилий компании по созданию благоприятных условий для успешной и прибыльной деятельности на рынке, посредством воздействия на ее внутреннюю и внешнюю среду».
- «В этом можно увидеть ряд основных принципов: цель, способ и способы достижения цели».
- «Введение диплома по анализу и совершенствования управления организацией, является важнейшим компонентом, который задает контекст и цель для всего исследования».
2. Искаженные словосочетания, термины или клише¹.
3. Странно написанные устоявшиеся определения. Это обычно говорит об использовании ИИ для перефразирования чужого текста.
4. Почти дословные повторы одной и той же мысли.
5. Фейковые ссылки или полное отсутствие ссылок на источники даже в тех случаях, когда из текста следует явная необходимость ссылок. Например: «многие исследователи пишут о…» или «существует ряд исследований…» и т.д.
6. Фактические ошибки, ложная информация, фейковые факты.
7. Фразы, которые проникли в текст из диалога с ботом:
- «Сгенерировать ответ заново»
- «Как большая языковая модель, я…»
- «На момент моего последнего обновления знаний в сентябре 2023 года…»³
Если в работе нашлось сразу несколько таких признаков, вероятнее всего ее написали с помощью генеративных сервисов. Да, неоспоримых доказательств привести нельзя, но в любом случае указанные признаки говорят о крайне низком качестве текста. Такую работу вполне оправданно можно отклонить и отправить на доработку студенту по причине несоответствия требованиям вуза к ВКР.
Если же текст работы соответствует требованиям вуза, и студент демонстрирует полноценное владение материалом, то вы можете снять отметку о подозрительности вручную с соответствующим комментарием.
Более подробную и техническую инструкцию можно посмотреть тут: https://antiplagiat.ru/wp-content/uploads/2023/06/ai_memo_2023.pdf
_______________________________________
¹ Guillaume Cabanac, Cyril Labbé, Alexander Magazinov Tortured phrases: A dubious writing style emerging in science Evidence of critical issues affecting established journals URL: https://arxiv.org/pdf/2107.06751
² Гольдман И.Я., Добробабенко Н.С. Практика рекламы. Десять уроков для советского бизнесмена: Учебник [Текст]. – Новосибирск: СП Интербук, 1991. – 73 с.
³ Guillaume Cabanac, Cyril Labbé, Alexander Magazinov Tortured phrases: A dubious writing style emerging in science Evidence of critical issues affecting established journals URL: arxiv.org/pdf/2107.06751
Вспоминаю свою работу. Тогда было проще, ИИ не было. Были диски на Горбушке "1000000 рефератов, курсовых и дипломных" На мой взгляд принципы проверки на антиплагиат некорректные, т.к. проверяется вся работа целиком, в т.ч. справочные материалы. Эти фрагменты вообще нельзя брать в качестве объекта проверки - т.к. это справочные материалы - они во всем мире пишутся и читаются ОДИНАКОВО. Что там можно своего придумать-то?
Каждому последующему поколению будет сложнее и сложнее писать "уникальные" работы.
Я ХЗ в чем проблема использования ИИ при создании работы. Ее же все равно нужно прочитать, скорректировать, и хотя бы понимать, чтобы защититься. ИИ дает быстрый ответ на вопрос.
Я сына научил при помощи ИИ уроки делать - он оценил. Одно условие - проверять, читать и вникать, что она выдала.
Были бы в мое время такие технологии - я бы круглым отличником был, с кучей свободного времени!
хм... ну если главная цель получения образования быть круглым отличником с кучей свободного времени, то да
Максим, справочные материалы, список литературы и титульный лист отключаются в системе "Антиплаигат", их, конечно, не нужно проверять на плагиат.