|
|
|
По вопросу интерпретации результатов компьютерной проверки на наличие плагиата в академических и научно-исследовательских работах
Шакенов Мади Амангельдыевич, Кандидат юридических наук
Ницше писал, что нет фактов, есть лишь их интерпретация. Данное высказывание применимо не только в рамках философской системы немецкого мыслителя, но и во многих аспектах повседневной жизни. В частности, в данной работе применимость данного высказывания будет проанализирована относительно такого острого академического вопроса как проверка работ на наличие в них плагиата. Для начала необходимо определиться с ключевыми понятиями в данной сфере. Предлагаем понимать под плагиатом заимствование чужой идеи в своей работе без соответствующей отсылки к оригинальному источнику идеи. Такое рабочее определение снимает вопрос о возможном перефразировании текста работы и подачу его в качестве оригинальной работы. Отметим, что перефразирование рассматривается одним из краеугольных письменных навыков в рамках курсов академического английского языка [1;2; 3]. Конечно же, в академическом английском языке перефразирование обязательно должно сопровождаться с отсылкой к соответствующим источникам. И здесь мы плавно переходим к другому очень важному вопросу, а именно: как проводится проверка на наличие плагиата? Существующие мощности информационно-вычислительных систем пока оставляют желать лучшего, равно как и уровень оцифровки письменных источников. Можно предположить, что по мере развития технологий, и в особенности, алгоритмов искусственного интеллекта, возможность проверки на наличие плагиата перейдет на новый уровень, а именно, машины будут подсказывать, где идея уже была высказана и таким образом давать возможность сверки полученных результатов и выводов авторам. Тем не менее, уже сейчас имеется возможность проверки достаточно больших текстов по определенным алгоритмам на наличие неизмененных заимствований. При этом все программные решения, которые могут проводить такие проверки (антилпагиат.ру, Turnitin, eTXT и др.) не утверждают факт наличия или отсутствия плагиата. В связи с этим даже применяются термин «проверка на уникальность текста», что на наш взгляд не отражает сущность такой проверки и такая формулировка не будет нами использоваться далее. Основных причин на то, что разработчики программных решений не претендуют на утверждение наличия способностей у их «детищ» найти плагиат, по нашему мнению, две: 1. Как было определено выше главное в плагиате это заимствование не формы, а содержания – идеи; 2. Даже при наличии заимствования, оно может быть соответствующим образом оформлено с указанием надлежащего первоисточника. По первой позиции все достаточно ясно: машина, проверив оригинальность текста, не может точно определить возможность наличия перефразированной идеи, что, как указано выше, мы надеемся будет исправлено в будущем. По второму же пункту есть несколько существенных замечаний. Во-первых, на сегодняшний день имеется множество систем цитирования, даже в рамках, казалось бы, одной системы можно найти достаточно множество подвариантов. Все это приводит в большинстве случаев к тому, что компьютеры неспособны различить корректное цитирование от нарушения академических стандартов. А если прибавить к этому тот факт, что принятое в Казахстане цитирование (Приказ Председателя ВАК МОН Республики Казахстан от 28 сентября 2004г. № 377-3ж), которое, кстати, применяется в настоящей работе лишь для наглядной демонстрации сложности его применения к зарубежным и нестандартным источникам, не соответствует ни англоязычным стандартам, ни межгосударственным стандартам СНГ (например, стандарту ГОСТ 7.1-2003), то становится ясно, что с распознаванием корректного цитирования в академических работах Республики Казахстан складывается совсем печальная история. Во-вторых, имеются свои нюансы техники оформления источников. Здесь проблемы и с кросс-цитированием, и с авто-цитированием, с особенностями цитирования зарубежных источников, технических стандартов, законов и т.д. Все это тоже потенциально может снижать точность отчета по проверке на наличие плагиата. В-третьих, плагиатом не могут быть названы общеизвестные вещи, а равно некоторые тексты, на которые не распространяются авторские права, например – тексты законов (хотя, конечно же, отсутствие указания на закон, может рассматриваться слабой академической практикой, о чем будет написано ниже). В-четвертых, почти всегда машины находят заимствования в библиографии. Здесь, конечно же, можно просто установить запрет на проверку этой части текста, но все же помимо библиографии в различных видах цитирования может использоваться подстраничное указание источников. Опять-таки, заимствованный текст может всплывать в таких частях академических работ как аннотация, резюме, эпилог, предисловие и даже во введении и в заключении, так как в этих местах очень часто используют шаблонные фразы и устойчивые выражения, о которых речь также зайдет ниже. Главным показателем машинной проверки на антиплагиат является так называемый процент «уникальности текста». Вот здесь, с учетом указанного выше, возникают реальные проблемы. Например, когда руководство той или иной научно-исследовательской организации, слабо понимающее систему проверки на антиплагиат, начинает требовать 97% уникальности текста, ссылаясь при этом на некий опыт зарубежных университетов. Уверены, что в таких случаях такой малограмотный менеджмент просто никогда толком не работал с системами Turnitin и его аналогами. Ключевым для этого утверждением здесь является то, что это касается не работы от лица, отправляющего текст на проверку или непосредственного автора текста, а лица, интерпретирующего результаты машинной проверки. Еще одной насущной проблемой становиться проблема подачи статьи в журналы, рекомендованные КОКСОН МОН РК. Согласно требованиям МОН РК в данных журналах проводятся и проверка на наличие плагиата. К сожалению, необходимо отметить, что зачастую у лиц, интерпретирующих данные проверки, не имеется воли, знаний или попросту желания признать факт отсутствия плагиата в работах, в которых относительно низкий уровень «уникальности текста». Например, представим, что текст прошел проверку и показал следующие данные 61% уникального текста, 25% цитирования и 14% заимствований. Неискушенному в подобного рода проверках лицу, может показаться, что на лицо факт слабой работы. Однако, как и везде, «дьявол кроится в деталях». Для начала необходимо поднять еще один очень сложный вопрос: слабая (плохая) академическая практика. Этот термин в отличии от плагиата более разнообразен и может включать неверное цитирование, ошибки в оформлении источников, а также в зависимости от специфики академических работ могут быть ограничения на количество источников, таблиц и диаграмм. Очень часто плохой академической практикой могут быть названы работы с большой долей цитирования, такие работы могут определить в качестве «компилированных». Однако какой должен быть при этом процент, необходимо устанавливать отдельно для каждой специальности и вида работ. Так, например, в технических специальностях возможен более низкий уровень «уникальности текста», что связано не только со спецификой терминологии и языка, но также, возможно, и с особенностью повышенных требований по количеству цитирования. Кроме того, нужно учитывать и специфику самой работы, если это аналитическая справка, то здесь также уровень «уникальности» будет ниже, так как любая аналитика подразумевает определенный уровень компиляции первоисточников. Немаловажно также отметить, что по мере развития цифровизации научно-технической деятельности, объемы доступных текстов в сети Интернет будут стремительно расти. Любой язык имеет определенный запас слов и их комбинации, с точки зрения математики, ограничены. Поэтому можно смело прогнозировать, что средняя «уникальность текста» будет падать со временем, в случае отсутствия изменений в методики и алгоритмах проведения компьютерной проверки текстов. По результатам любой компьютерной проверки важно рассматривать структуру заимствований в отчете и проводить так называемую «ручную» проверку. Суть в том, что если в структуре отчета присутствуют незначительные по объему источники, то нет смысла их учитывать. Практика показывает, что существующие программы проверки на наличие плагиата могут «зацикливаться» на шаблонных фразах и устойчивых выражениях указывая, что они являются заимствованиями. При этом возможно достижение уровня заимствования/цитирования с одного источника до 8-9 % от сравнительно небольшого текста, такого как средняя, по казахстанским меркам (статья объемом 10-15 страниц) и до 4-5 % крупного текста (например, как в диссертации объемом 100-150 страниц). Таким образом, при проверке структуры отчета и проведения «ручной» проверки проверяющее лицо должно акцентировать свое внимание на наличие устойчивых выражений и шаблонных фраз, если таковые отмечаются в отчете, то их необходимо снимать с общего объема заимствований. В качестве вывода, хотелось бы обратиться к лицам, проводящим проверку на наличие плагиата. Возвращаясь, к примеру со статьей представим, что в структуре отчета нет ни одного источника больше 5,63% по цитированию и нет ни одного источника больше 2,03% по заимствованию. При этом 141 из 162 источников менее 1% от объема работы и при этом явно видно, что отмечаются именно устойчивые выражения и шаблонные фразы, выделена вся библиография, а также крупными блоками заимствований в аннотации отмечаются названия законов. Требовать в таких случаях повышения уникальности текста является, на мой взгляд, ошибкой (возможно, даже, оскорблением авторского коллектива), так как в нем нет никакого смысла – в конце концов это проверка на наличие плагиата, а не на изощренность языка авторов. Таким образом, можно прийти к следующему умозаключению: каким бы универсальным не было высказывание того или иного мыслителя, всегда найдутся уникумы, опровергающие эту мысль своим бездумным поведением, хотя, наверное, это тоже является видом интерпретации, только низкого качества...
Список использованных источников:
1. Academic English Website for International Students and EAP Teachers// https://academic-englishuk.com/. 2. Academic English. A practical and introductory course to build your skills in academic writing// https://www.edx.org/course/academic-english. 3. The English and Academic Preparation – Grad Track// https://www.coursera.org/learn/copy-of-glasscock#syllabus.
Доступ к документам и консультации
от ведущих специалистов |