Статья опубликована на портале «Газета.Ru» 01.06.19 под заголовком "Ученые-плагиаторы: что будет с российской наукой?"
Автор: Михаил Соколов
Скандалы с заимствованием текстов диссертаций происходили в последние года регулярно, и не только в России. Так, должности потеряли министр обороны Германии Карл-Теодор цу Гуттенберг и выбранная Дональдом Трампом своим представителем в Национальном совете безопасности Моника Коули. Возросшая частота диссертационных скандалов связана с распространением программного обеспечения, распознающего некорректные заимствования. Теперь любой желающий может легко проверить любую диссертацию и, если повезет, найти там найти там компромат.
На прошлой неделе министр высшего образования и науки Михаил Котюков отправил в отставку и.о. ректора Курганского государственного университета Константина Прокофьева. Этому предшествовал скандал, вызванный тем, что активисты группы «Диссернет» обнаружили в диссертации Прокофьева плагиат.
Людям, не связанным с наукой, нетерпимое отношение ученых к плагиату может показаться удивительным. В конце концов, мы живем в эпоху тотального копи-пэйста. Уважение к авторству, однако, во многих отношениях, является фундаментом институтов современной науки. Тронь его — и они развалятся. Ученые не получают непосредственного экономического вознаграждения за сделанные ими открытия. Вместо этого они получают признание и уважение коллег, которые, помимо того, что приятны сами по себе, могут быть конвертированы в приглашения на работу и финансирование для будущих исследований. Чтобы этот механизм работал, однако, необходимо, чтобы было понятно, кого вознаграждать. Те, кто присваивают чужой труд, лишают автора заслуженного признания и ставят всю конструкцию «открытия в обмен на признания в обмен на деньги» под сомнение. Ученый больше не может быть уверен, что получит заслуженную награду за годы усилий, а те, кто платит деньги — что они заплатят их человеку, который способен внести вклад в науку. Поэтому свидетельства широкого распространения плагиата вызывают такую тревогу.
Казалось бы, задача защиты научного авторства должна была стать проще с появлением распознающего плагиат программного обеспечения. Теперь достаточно прогнать через него новые тексты статей или диссертаций, чтобы обнаружить, нет ли в них повторений написанного ранее другими людьми. Это не позволит обнаружить все случаи плагиата, поскольку присваиваться могут не только слова, но и идеи, которые, разумеется, можно передать и совершенно иными словами. Но это позволит выявить одиозные случаи, когда чужой текст заимствуется большими кусками — и, соответственно, содержащиеся в нем идеи тоже.
Кроме того, можно предположить, что те, кто заимствует идеи, заимствуют и слова. В этом смысле антиплагиатные программы позволяют находить не только нарушения, но и нарушителей. Некорректные заимствования являются сигналом, свидетельствующим о склонности к нарушениям научной этики. Более того, они являются сигналом, свидетельствующим о том, что заимствующий автор невысоко оценивает достоинства своей собственной работы. Плагиат может сойти с рук, если содержащий заимствования текст никто не прочитает. Если, однако, текст будут читать, то вероятность, что кто-то заметит совпадения, резко возрастает.
Заимствуя, автор расписывается в том, что не думает, что написанное им может быть много кому интересно.
Ковровое применение «Антиплагиата», по идее, должно помочь выявить тех, кто оказался в науке по ошибке.
Так ли это на самом деле, попробовал выяснить Центр институционального анализа науки и образования Европейского университета в СПб, проверив на «Антиплагиате» репрезентативную выборку из 2468 диссертаций, защищенных за десятилетие 2006-2015 годов. Более поздние года не брались, поскольку те, кто занимался исследованием, предполагали (как оказалось, ошибочно), что из-за пристального внимания копи-пэйст будет к концу этого периода полностью изжит. В отличие от «Диссернета», который опирался в своих поисках на догадки о том, где с наибольшей вероятностью можно найти злостных плагиаторов, мы стремились к тому, чтобы все диссертации с равными шансами могли попасть в нашу выборку и, соответственно, мы могли сделать выводы о средней доле заимствований в генеральной совокупности и о том, в каких группах он наиболее распространен. (Полностью процедуры и результаты исследования описаны в препринте, доступном на сайте ЦИАНО).
Результат был несколько неожиданным. Исходя из предположения, что присвоение чужого текста сродни краже, мы ожидали, что ученые поделятся на два типа — тех, кто крадет много, и тех, кто никогда не тронет чужого. Если ты влез через форточку в чужую квартиру, не имеет смысла брать, скажем, одну пятую часть найденных там денег, потому что и за малую, и за большую кражу тебя накажут одинаково.
На самом деле, и диссертации, в которых некорректных заимствований не было бы вовсе, и диссертации, в которых они составляли бы большую часть текста, встречаются редко. Лишь четверть диссертаций содержала менее 7% заимствований (предел того, что может объясняться ошибочным распознанием «Антиплагиатом» законных цитат или ссылок в качестве некорректных). При этом свыше половины текста диссертации списали лишь 6,1% авторов. Большинство находилось где-то посередине.
Средняя доля некорректных заимствований в докторской составляла 19,1% текста. Медиана (уровень, выше и ниже которого находятся ровно по половине выборки) составляет 13,9%. Большинство заимствует что-то, но лишь немного пускаются во все тяжкие и берут все.
Мы предполагали также, что те, кто заимствует большую часть текста, будут более других склонны к другим формам академической недобросовестности — например, «накручивать» публикационные показатели, которые от университетов и институтов последние годы требовал Минобрнауки. Они будут публиковаться в «мусорных» журналах, печатающих что угодно за деньги, чтобы отчитаться большим числом публикаций, и будут цитировать сами себя или обмениваться цитированиями с коллегами, чтобы имитировать широкое влияние своих трудов. Кроме того, исходя из предположения, что чужой текст заимствуется, поскольку заимствующий просто не в состоянии написать свой, мы ожидали, что более устойчивые к подобному взлому показатели, которые рассчитывает Российский индекс научного цитирования (публикации и цитирования в более качественных журналах) будут у этой группы ниже, чем у ученых, которые не заимствуют ничего.
Вкратце — все эти предположения оказались ошибочными. Доктора наук, заимствовавшие большую часть текста, не обнаруживают никакой особой склонности к накрутке показателей; различия между группами с максимальными и минимальными заимствованиями в их публикационных профилях по большей части незначительны. Если механически применить критерий, запрещающий заимствования, и лишить степени всех, заимствовавших свыше какого-то процента текста (скажем, трети), лишенные в среднем вряд ли будут по своим научным достижениям много хуже, чем те, у кого она останется.
Самое правдоподобное объяснение того, что наши ожидания не оправдываются, заключается в том, что заимствование части текста диссертации не обязательно воспринимается заимствующим и его окружением как «кража».
Во многих случаях они, видимо, рассматриваются как куда менее тяжкий проступок, если проступок вообще. Есть формальные правила, запрещающие заимствования, но есть множество неформальных правил, объясняющих, когда формальным правилам надо неукоснительно следовать, а когда они не более чем благие пожелания. Статус формальных правил в такой системе сродни статусу правил дорожного движения. Среди правил поведения на дороге есть такие, которые будет нарушать только явный отморозок (например, мертвецки пьяным на скорости кататься вокруг детского сада), а есть такие, которые нарушит большинство людей в России, не испытывая при том особых угрызений совести (перейти пустынную улочку вне зоны перехода). Даже в случае преступлений против собственности между собственно кражей и добропорядочным поведением есть обширная серая зона. У вора-форточника вряд ли есть какие-то сомнения в том, как квалифицируются деяния. Но человек, прихватывающий домой пачку бумаги из офиса или задерживающийся на лишний день в командировке, чтобы осмотреть достопримечательности, вряд ли думает о себе как о воре, даже если и ощущает некоторую сомнительность своего поведения.
В интервью, которые брались по этому проекту, информанты делились множеством соображений о том, когда заимствовать чужой текст можно. Некоторые говорили, что не видят большого греха в копировании описания оборудования и процедур эксперимента; кто-то верил, что можно взять ритуальные части с обоснованием актуальности и новизны темы; кто-то думал, что научный руководитель может использовать работу своего бывшего аспиранта, сделанную под его руководством, кто-то считал, что литературный обзор по определению не предполагает никакой оригинальности, и в его копировании нет никакого греха. Подобные неформальные правила отличаются в дисциплинарных деревнях — у химиков они иные по сравнению с физиками и биологами, а экономисты не похожи на историков и социологов. Где-то они, в целом, строже (самые строгие, похоже, в филологии, где медианная доля заимствований 6%). Где-то, наоборот, мягче — например, в сельскохозяйственных науках, где медианная доля заимствований почти 30%. По меркам экономистов, 28% заимствований, недавно обнаруженных у мэра Екатеринбурга Высокинского — это сравнительно скромно (как минимум у четверти экономистов показатель выше).
Внутри дисциплин доля заимствований скорее определяется специфическими обстоятельствами конкретного диссертанта, чем его моральными или профессиональными качествами. У кого-то есть толковые аспиранты, у которых можно взять параграф-другой, а у кого-то нет. При этом там, где неформальные правила говорят, что к формальным правилам надо относиться серьезно, они, видимо, соблюдаются достаточно строго, поэтому масштабные нарушения — больше половины текста — везде редки. Случаи, когда один человек пошел бы защищать диссертацию, написанную другим, всего-навсего поменяв в ней титульный лист, были бы одиозными по меркам любой дисциплины, и нам такое не встретилось ни разу.
Значит ли это, что с существованием неформальных норм, гласящих, что в некоторых частях диссертации копи-пэйст допустим, можно просто смириться? Есть аргументы против этого. Например: диссертация — эта квалификационная работа, которая пишется не так, как проще и удобнее всего ее автору, а так, чтобы продемонстрировать его способность полностью самостоятельно проводить исследования и представлять его результаты научному сообществу. Мы не позволяем школьникам пользоваться Гуглом на экзамене, хотя им это и проще. Собственно, мы как раз и хотим убедиться, что они могут преодолевать сложности. К диссертации применяются те же правила. Другой довод — разрешите копи-пэйст хоть где-то, и придется вести бесконечные дискуссии о том, где границы этого где-то проходят: если можно взять 20% текста, то почему бы не 25? Под влиянием этих и других соображений мир пришел к политике нулевой терпимости к плагиату.
Россия, можно предполагать, двинется в том же направлении — во всяком случае, наши данные показывают, что ученые из столичных городов и с более плотными связями с мировой наукой склонны заимствовать меньше других. Но до цели остается еще долгий путь.