La letteratura scientifica è contaminata da un certo numero di articoli falsi, prodotti da aziende specializzate nel costruire manoscritti verosimili basati sul plagio di articoli precedenti e sull’invenzione di dati e autori. Tali prodotti servono a ricercatori e scienziati a inizio carriera a “fare quantità”, in modo da progredire nel numero di pubblicazioni. Di solito si tratta di raggiri, perché prima o poi la verità viene a galla e l’articolo sarà ritrattato.
Da tempo si sa dell’esistenza di questo mercato, ma è difficile stabilirne l’entità. Un’analisi pubblicata su Nature suggerisce che negli ultimi due decenni sono stati pubblicati più di 400 mila gli articoli scientifici che presentano forti somiglianze testuali con studi già noti prodotti da “fabbriche di testi”. Di questi, circa 70 mila sono stati pubblicati solo lo scorso anno. L’analisi stima che tra l’1,5 e il 2% di tutti gli articoli scientifici pubblicati nel 2022 presenti elementi che li rendono riconducibili a lavori “di fabbrica”. Tra gli articoli di biologia e medicina, la percentuale sale al 3%.
La società che ha condotto l’analisi, spiega Nature, ha usato un software di apprendimento automatico chiamato Papermill Alarm. Adam Day, presidente della società che l’ha sviluppato, ha spiegato di avere impostato il software per analizzare i titoli e gli abstract di oltre 48 milioni di articoli pubblicati a partire dal 2000, elencati in OpenAlex, un gigantesco indice aperto di documenti di ricerca lanciato l’anno scorso, e per segnalare i manoscritti il cui testo corrispondesse molto da vicino ai lavori noti delle “fabbriche”.
Secondo diversi osservatori, questo approccio basato sulla somiglianza stilistica è il migliore disponibile al momento per stimare la prevalenza dei falsi articoli, ma potrebbe inavvertitamente comprendere articoli autentici che le cartiere hanno copiato, o casi in cui gli autori hanno inserito dati reali in un articolo dallo stile molto standardizzato. Day, tuttavia, afferma di aver cercato di mantenere i falsi positivi quasi a zero, convalidando i risultati su un campione di articoli noti per essere autentici o falsi.
Le stime sono considerate quindi più che plausibili, anche se l’azienda ha deciso di non rivelare i dettagli della propria metodologia per evitare che la concorrenza possa copiare il sistema, o che i truffatori abbiano strumenti in più per aggirare i controlli. Le informazioni sensibili vengono però condivise privatamente con gli investigatori di frodi.
L’analisi indica che le “fabbriche” non sono distribuite uniformemente tra le riviste, ma si concentrano su titoli particolari, ma anche qui Day afferma di non voler rivelare pubblicamente quali editori sembrano essere i più colpiti, perché ritiene che potrebbe essere dannoso farlo.
Negli ultimi anni, spiega Nature, gli editori hanno intensificato gli sforzi per combattere le “fabbriche di articoli”, concentrandosi su strumenti (tra cui Papermill Alarm) che aiutano a individuare gli articoli falsi o plagiati.
Il fatto che il testo segua un modello standard è solo uno dei segnali che attivano l’allarme. Tra gli altri ci sono indirizzi mail sospetti che non corrispondono a nessuno degli autori di un articolo; indirizzi mail di ospedali in Cina (il problema è noto per essere molto diffuso in quel Paese); grafici identici usati per rappresentare esperimenti diversi; giri di parole che indicano sforzi per evitare il rilevamento del plagio; citazioni di altri studi falsi; duplicazioni di invii tra le varie riviste. Ce ne sono altri, ma non sono stati rivelati tutti per evitare di mettere in guardia i truffatori.
Qualunque sia l’entità del problema, conclude Nature, esso ha travolto i sistemi di controllo degli editori. Il più grande database di ritrattazioni al mondo, compilato dal sito web Retraction Watch, registra meno di 3.000 ritrattazioni legate all’attività di “fabbricazione”, su un totale di 44.000. Queste sono «solo una piccola parte delle stime al ribasso che abbiamo sulla portata del problema», ha detto Day. «I fabbricanti di articoli possono sentirsi abbastanza al sicuro».
(Foto di Christa Dodoo su Unsplash)
Può funzionare ancora meglio
Il sistema trasfusionale italiano funziona grazie alle persone che ogni giorno scelgono di donare sangue, per il benessere di tutti. Vuoi essere una di quelle persone?