Fino allo scorso febbraio, i dati erano spesso usati dalla politica, al più, per fare colore. Dall’inizio della pandemia sono diventati la base su cui si prendono le decisioni da cui dipende la vita delle persone, e anche queste ultime hanno imparato a prestarvi molta più attenzione. Ma i dati, per essere significativi, devono essere aperti, trasparenti, e soprattutto “di qualità”. Come ha dimostrato il Regno Unito, che per un problema con il programma Microsoft Excel ha temporaneamente “perso” 16 mila positivi al coronavirus, la qualità dei dati che entrano, e dell’elaborazione che ne viene fatta, è centrale per innescare decisioni sensate. Bisogna diffidare di chi dice che i dati sono qualcosa di “oggettivo”. Come disse l’economista Ronald Coase, “torturando” abbastanza a lungo un dato, confesserà qualunque cosa. Da qui l’importanza che i dati siano aperti: è importante che la comunità di esperti possa analizzarli, confrontarli, controllarne la correttezza e fare le proprie considerazioni. È il modo migliore per dare qualità a tutta la catena decisionale.
Trasparenza e responsabilità
Il lato scomodo da accettare è che i dati aperti permettono di controllare chi prende le decisioni, di metterlo di fronte alla qualità del suo lavoro e alle sue responsabilità. È il concetto di trasparenza del quale da anni si parla ma che poi, quando si presentano occasioni concrete per metterlo in pratica, non incontra lo stesso entusiasmo. Massimo Mantellini, sul suo blog, emette una sentenza piuttosto dura: «La ragione di una simile pretesta di riservatezza è banale ed è la medesima per cui l’Italia continua a non avere un vero e propria FOIA ma solo una sua sottospecie: perché se i dati fossero pubblici (tranne alcune piccole eccezioni) le nostre decisioni potrebbero essere migliorate dal contributo di tutti ma sarebbero sottoposte allo scrutinio di tutti. L’eterna variabilità delle scelte politiche sarebbe stata infine sottoposta ad un giudizio dotato di un’inedita oggettività». Secondo Mantellini sono proprio gli effetti della trasparenza a dissuadere dal realizzarla: «“Garbage in, garbage out” recita un famoso motto di un tempo: mentre è in atto un processo di inevitabile parziale liberazione delle informazioni, sarà sufficiente inquinare le fonti in entrata (sta già succedendo) anche solo rendendo i dati non omogenei per ottenere il medesimo effetto adulterante senza bisogno di inventarsi bugie o ritardi. E la politica, locale, regionale o nazionale, sarà salva».
Appelli e lettere
Una serie di associazioni ha firmato una lettera aperta per chiedere che i dati siano condivisi in formato aperto, ben descritti e in un formato leggibile da un computer (machine readable): «La cittadinanza, stremata, chiede risposte mirate, meno gravose di “tutti in lockdown”. Elaborarle richiede dati pubblici, disaggregati, continuamente aggiornati, ben documentati e facilmente accessibili a ricercatori, decisori, media e cittadini». Non è il primo appello di questo tipo che viene pubblicato, ma è il primo che ottiene un così largo appoggio (116 sigle nel momento in cui scriviamo questo post). Prima di loro, Paolo Giordano e Alessandro Vespignani, fisici, avevano firmato un articolo sul Corriere in cui chiedevano, tra le altre cose, dati aperti e trasparenza. Il loro intervento offre indicazioni precise ed è imperniato sulle domande, più che sulle accuse: «I dati che raccogliamo non sono i migliori. Per esempio, dopo nove mesi di emergenza, ragioniamo ancora in base al saldo di occupazione delle terapie intensive, invece di monitorare i flussi di ingresso e uscita che permetterebbero di cogliere prima le accelerazioni dell’epidemia. Ma soprattutto, raccogliamo pochi dati. Cosa ne è stato di tutti i fogli che nei mesi scorsi abbiamo compilato a mano prima di entrare in teatro o in un ambulatorio medico? E perché non abbiamo un modo più affidabile di misurare l’affollamento sulle metropolitane, che non siano le foto scattate dai passeggeri? Stiamo perdendo una mole di informazioni preziose, informazioni che, raccolte dalla tecnologia portatile e convogliate in un database, ci darebbero un aiuto enorme nella stressante “convivenza con il virus”». E poi ancora: «Su quali proiezioni settimanali (se ci sono) si basa l’operato del governo e delle Regioni? Che analisi vengono impiegate per anticipare il carico sul sistema sanitario? Quali stime e quali criteri sono adottati per la protezione delle fasce di popolazione a rischio? Quanti tracciatori sono stati assunti, dove e secondo quale strategia di controllo territoriale? Su che basi è stata pianificata l’attuale capacità di testing delle diverse regioni, province, aree urbane? Ogni cittadino ha diritto, specie in un frangente così, di avere a disposizione le informazioni rilevanti, tutte al netto di quelle sensibili ovviamente, per poter valutare se le misure intraprese gli appaiano ragionevoli o no». L’articolo è stato pubblicato prima che si parlasse dei “21 parametri” che regolano l’algoritmo che pare sia alla base delle decisioni sulla classificazione del livello di rischio delle regioni. Perché, oltre ai dati, non rendere pubblico anche l’algoritmo? C’è una comunità di scienziati, là fuori, che non vede l’ora di dare una mano. Non perdiamo questa occasione.
(Foto di KOBU Agency su Unsplash)
Col sangue si fanno un sacco di cose
Le trasfusioni di sangue intero sono solo una piccola parte di ciò che si può fare con i globuli rossi, le piastrine, il plasma e gli altri emocomponenti. Ma tutto dipende dalla loro disponibilità, e c’è un solo modo per garantirla.