Українська правда

Чорний ринок цитування. Які схеми використовують вчені, аби піднятися кар’єрними сходами

- 25 серпня, 15:39

Наука, як і будь-яка інша сфера діяльності, час від часу стає плацдармом для шахрайства.

Проблема академічної недоброчесності, яка, на думку очільника МОН України "знаходиться не в юридичній, а культурній площині", поширена не лише серед вітчизняних науковців, але і в світі. І кількість та зухвалість способів, за допомогою яких дослідники можуть штучно завищувати цінність (не обов’язково) своїх робіт, продовжує зростати.

Команда вчених з Нью-Йоркського університету (NYU) в Абу-Дабі провела своєрідну спецоперацію, аби з’ясувати, як недоброчесні науковці підробляють кількість цитувань своїх робіт. Їх занепокоїло те, як стрімко зросла кількість способів, за допомогою яких можна підробити кількість цитувань досліджень. Результати їхньої роботи опубліковані у науковому журналі Nature.

Індекси цитування та цитованості в світі науки відіграють неабияку роль, і їх постійно треба підвищувати, адже це один із факторів, що свідчить про затребуваність та актуальність досліджень.

Довідково: Індекс цитованості – числовий наукометричний показник, який свідчить про рівень затребуваності наукових праць кожного конкретного вченого.

Індекс цитування – масштабна наукометрична базу даних, покажчик на посилання між публікацією, що відображає, в яких роботах вона цитується і які наукові праці цитує сама. Цей показник не можна відобразити в цифрах.

Якщо коротко, то індекс цитованості – це показник в цифрах, індекс цитування – база даних для аналізу.

Спостерігачі за доброчесністю досліджень давно підозрювали, що цитати продаються на "паперових фабриках" – сервісах, які штампують низькоякісні дослідження.

"Паперові фабрики мають можливість вставляти цитати в статті, які вони продають", – заявив Сіріл Лаббе, вчений у галузі комп’ютерних технологій з Університету Гренобль-Альпи у Франції, коментуючи штучне створення "конвеєру" цитувань.

У чому полягало дослідження чорного ринку цитувань

У листопаді 2023 року аналітична фірма Clarivate з Філадельфії (штат Пенсильванія, США) виключила понад 1000 дослідників зі свого щорічного списку найбільш цитованих науковців – їх підозрювали у шахрайстві з цитуваннями та "гіперпублікованості".

Вченим-викривачам NYU довелося бути вигадливими і не відставати від, власне, об’єктів своїх досліджень.

Проаналізувавши підозрілі цитати, пов'язані з одним з авторів із переліку Clarivate, науковці знайшли фірму, яка, на їхню думку, могла продавати цитати для профілів у пошуковій системі Google Scholar.

Тож команда вирішила створила профіль неіснуючого вченого у системі Google Scholar і завантажила туди 20 фейкових досліджень, згенерованих штучним інтелектом, аби, зокрема, зв’язатися з "продавцем".

Спершу автори дослідження написали компанії на електронну пошту, згодом спілкування перейшло у WhatsApp.

"Ми почали помічати кілька профілів Google Scholar із сумнівними тенденціями щодо цитування. Коли рукопис отримує сотні цитувань протягом декількох днів після публікації, або коли у вченого різко зростає кількість цитувань, стає зрозуміло, що щось не так", – зауважив Ясір Закі, науковець з Нью-Йоркського університету (NYU) в Абу-Дабі, чия команда опублікувала результати своєї "спецоперації" у лютому.

Невдовзі фірма розповіла про свої "послуги" і запропонувала "вченому" придбати 50 цитувань за 300 доларів або 100 цитувань за 500 доларів.

У результаті дослідники купили від імені фальшивого вченого 50 цитувань. Вже через 40 днів на сторінці профілю у Google Scholar було додано 50 посилань з досліджень у 22 журналах, 14 з яких індексуються Scopus.

Scopus – це величезна наукометрична база даних, що є джерелом великої кількості статей, рефератів та цитування. Тисячі журналів, що індексуються цією базою даних, публікують дослідження та світові огляди у різних галузях науки (техніка, медицина, соціальні та гуманітарні науки, мистецтво тощо).

Купівля цитувань на 300 доларів допомогла дослідникам остаточно упевнитися – чорний ринок фальшивих посилань, про який вони давно здогадувались, однозначно існує.

Фейкові цитати для наповнення профілю у Google Scholar науковці купили у фірми, яка, схоже, продає їх оптом. Однак її назву вони розголошувати не захотіли через побоювання, що фейковий профіль у Google Scholar можуть викрити, а разом з тим – і імена авторів досліджень, які розмістили фальшиві цитати.

Коментуючи той факт, що в Google Scholar можна створити підроблені профілі, провідний інженер компанії Анураг Ачарья заявив:

"Хоча академічні зловживання можливі, вони трапляються рідко, оскільки всі аспекти видно – статті, що індексуються; статті, включені автором до свого профілю; статті, що цитують автора; де розміщені статті, що цитують тощо. Будь-хто у світі може викрити вас у цьому".

Практика штучного підвищення кількості цитувань є далеко не тільки етичною проблемою – багато аспектів кар'єри дослідника залежать від того, скільки посилань отримують його роботи. Багато установ використовують кількість цитувань для оцінки науковців, а кількість цитувань, своєю чергою, впливає на такі показники, як h-індекс – показник впливовості, за яким вимірюють продуктивність науковців та вплив їхніх досліджень.

Крім того, цей вид академічної недоброчесності може мати реальні наслідки, як було у випадку з новопризначеним ректором Університету Саламанки в Іспанії – вченим у галузі комп’ютерних технологій Хуаном Мануелем Корчадо. У червні іспанська газета El País повідомила, що Комітет з дослідницької етики країни закликав університет розслідувати його роботу після звинувачень у штучному підвищенні своїх показників у Google Scholar. Корчадо ситуацію не прокоментував.

Як кіт Ларрі намагався підірвати репутацію Google Scholar

Профіль вигаданого вченого – не єдиний спосіб, який використали науковці, аби оцінити масштаб проблеми фальшивого цитування. Минулого місяця вони створили у Google Scholar профіль кота на ім'я Ларрі Річардсон, де розмістили десяток фальшивих робіт з "його авторством".

Потім дослідники опублікували ще з десяток безглуздих досліджень на академічному сайті соціальних мереж ResearchGate, в яких цитувалися роботи Ларрі.

В результаті "котячі роботи" отримали понад 130 цитувань, а Ларрі став чи не найвпливовішим інтелектуалом і найцитованішим котом у світі, як заявляли самі дослідники.

Приблизно через тиждень після того, як особистість Ларрі була розкрита, Google Scholar видалив усі "його" дослідження, а також ті, що посилалися на нього – разом із накопиченими цитатами. Все це зробили з єдиною метою – аби довести, що Google Scholar можна маніпулювати.

Фальшиві препринти

Хоча "спецоперація" Ясіра Закі та його колег може видаватися локальною, але її мета охоплює більш широкі спроби оцінити масштаби проблеми псевдоцитування науковців.

Тому команда вчених з NYU, крім схеми з профілем псевдонауковця, за допомогою спеціального програмного забезпечення загалом вивчила близько 1,6 мільйона профілів Google Scholar, які мали щонайменше 10 публікацій. Науковці зосередилися на пошуку профілів з більш ніж 200 цитуваннями, а також випадках, коли кількість цитувань дослідників зростала у 10 і більше разів щороку або на щонайменше 25% від загальної кількості цитувань. У результаті ідентифікували 1016 таких профілів.

За словами Закі, багато посилань на статті з цих профілів походять з препринтів – попередніх публікацій матеріалів, – які навіть не пройшли рецензування, тобто незалежну експертну оцінку. Останні вказані в бібліографіях статей, але не цитуються в основному тексті рукописів.

Крім того, комп’ютерний вчений Гійом Кабанак з Тулузького університету у Франції, який створив інструмент, що ідентифікує сфабриковані роботи зі схемами задля обходу антиплагіатних програм, заявив, що в багатьох дослідженнях з'являються посилання на роботи, які не мають нічого спільного з темою дослідження.

Також автори дослідження опитали 574 науковців з 10 найрейтинговіших університетів світу. Вони виявили, що з тих університетів, які враховують кількість цитувань при оцінці науковців, понад 60% отримують відповідні дані саме з Google Scholar.

Що пропонують дослідники?

Нині команда Лаббе працює над створенням інструменту, який автоматично позначатиме підозрілі цитування, за допомогою яких можна буде ефективніше виявляти недобросовісних дослідників.

Щоб допомогти у цьому, команда NYU пропонує ввести метрику під назвою "індекс концентрації цитування", призначену для виявлення так званих "кілець цитування", коли вчені домовляються цитувати один одного, щоб завищувати показники.

"Підозрілі вчені зазвичай мають масові цитування лише з декількох джерел", – каже Рахван.

Наразі не лише практика штучного збільшення цитованості як така викликає занепокоєння у "детективів доброчесності", але і те, що з часом методи недоброчесних науковців стануть ще більш витонченими, щоб уникнути викриття.

Сіріл Лаббе вважає, що завадити цьому може лише комплексна зміна підходів до оцінки впливовості вчених: щоб ті не перебували під тиском накопичення якомога більшої кількості цитувань для просування по кар'єрних сходах.

"Тиск на публікації та цитування згубно впливають на поведінку науковців", – підсумував він.