lunedì 12 aprile 2021

Tre piccioni con un Tweet

[articolo aggiornato dopo la pubblicazione iniziale]

È successa una cosa interessante. Su un social (Twitter).
Premetto che, nonostante frequenti da tempo il web e i social succedono sempre cose curiose che mi fanno riflettere sulle dinamiche, sulle relazioni, i rapporti su internet, le parole, le abitudini, le interazioni. Insomma, il web e i social offrono una miniera di spunti a volte incredibili. In questi giorni (forse siamo tutti un po' più nervosi?) ho anche provato, per l'ennesima volta, il peso del dover scrivere in pubblico ciò che si pensa, niente di drammatico, ho solo posto un dubbio sulla riapertura delle scuole in un momento così grave dal punto di vista sanitario e sono stato inondato da insulti, minacce, aggressività verbale infinita. Non che fosse la prima volta ma ogni volta mi stupisco sempre. Ma torniamo al discorso iniziale.

Tutto è iniziato qualche giorno fa, in pieno "allarme" vaccino Astra Zeneca. Dopo alcuni decessi seguiti a vaccinazioni le autorità sanitarie di vari paesi (tra i quali l'Italia) hanno sequestrato dei lotti di vaccino o hanno addirittura sospeso la sua somministrazione, per poi decidere dei limiti di età. Una notizia apparentemente normale (in passato è già successo, anche in Italia e poi la farmacovigilanza ha proprio questo compito, verificare sul nascere qualsiasi allarme o sospetto su farmaci in uso) ma che, ovviamente, ha scatenato polemiche, paure e discussioni.
Una delle cose che più mi ha colpito è che se si va a studiare il dato così com'è non dovrebbe essere allarmante. I casi di morte (per trombosi) dopo la vaccinazione ricalcano quelli che accadono normalmente nella popolazione generale, senza la vaccinazione. Con le ultime valutazioni si è notato che c'è un lieve aumento (pur restando eventi estremamente rari, molto più rari di quanto accada nella popolazione generale già senza vaccinazione) in donne giovani che hanno fatto il vaccino e quindi, per precauzione (forse eccessiva?) si è deciso in molte nazioni di porre dei limiti (escludendo preferibilmente per esempio proprio le giovani donne da questo tipo di vaccino) non posti prima.
Nessun dramma. Se si conoscesse la statistica o il concetto matematico di rischio, un dato del genere su questo vaccino non solo non genererebbe allarme ma sarebbe totalmente insignificante (per la popolazione, non certo per le autorità regolatorie che devono indagare su qualsiasi evento sospetto).

Si potrebbe chiudere tutto qui.
Ma le persone vogliono chiarezza, giustamente e non è nemmeno facile darla, soprattutto perché viviamo un periodo di grande emotività.
Allora ho provato a spiegarlo schematicamente, con dei dati chiari, semplici e senza tanti fronzoli. Sarà il metodo giusto?
Così ho cercato di far riflettere, giocando con un "trucco", ho scritto che tra i miei pazienti, tutti quelli colpiti da Covid sono donne. Beh, non è una bugia ma è un "gioco" che ha anche un lato statistico. Un trucco come questo può essere usato in malafede nella ricerca scientifica per avere un risultato fraudolento, può essere un errore, conoscere queste "scorciatoie", può servire per saper leggere uno studio e addirittura per capirne le eventuali irregolarità, insomma, ho cercato di far sorgere una riflessione: essendo ginecologo era ovvio che tutti i miei pazienti con Covid fossero donne.

Ma niente, molti non afferravano e soprattutto mi hanno fatto sorgere una riflessione. 
Su internet ci sono medici come me (e ormai ce ne sono tantissimi) che fanno divulgazione scientifica. Ci sono anche biologi, chimici, giornalisti, una marea di nutrizionisti che parlano bene di alimentazione. Insomma, esistono tante figure che si mettono a disposizione (gratis) degli altri. Molto bello.
Mancano però (non è così, l'ho scoperto dopo) gli statistici.
Uno statistico che faccia divulgazione. Spieghi le correlazioni, gli eventi, i grafici, i bias, la significatività, i confronti, il rischio, insomma, tutti quei concetti che poi aiutano a capire meglio le malattie, la medicina, le terapie, la ricerca. Un buon modo per capire concetti come "rischio", le probabilità, le possibilità di un effetto collaterale, il bilancio rischi benefici, tutti concetti che in medicina sono non solo fondamentali ma, oggi, importantissimi.
Uno statistico sarebbe forse la figura migliore per spiegarli. Ce ne sarebbe davvero bisogno. Io ho provato a fare un esempio statistico.
 

Ho iniziato facendo un gioco "il 100% dei miei pazienti con Covid sono donne: il Covid colpisce soprattutto le donne. O no?". Si capisce?
Ecco, sapendo che sono ginecologo, volevo mostrare un tipico errore statistico o di contesto. Se sai che sono ginecologo è ovvio, che qualsiasi mia paziente, con Covid o senza, sia una donna. E poi la mia richiesta agli statistici di intervenire.
Ci credereste?
Alcuni hanno colto ma altri hanno iniziato a dire che non è vero che la maggioranza dei malati di Covid siano donne, che le donne sono più protette dalla malattia e così via. Appariva sempre più evidente che pochi avevano colto il senso del post o perché non lo avevano capito o perché non sanno che sono un ginecologo. Eppure è anche scritto nell'intestazione della mia pagina, nella biografia.

Ma non è questo il punto quanto quello che questo tweet, banalotto, può significare. Perché bisogna estrarre il buono da ogni cosa, vedere cosa possiamo imparare da ogni avvenimento. E qui abbiamo preso tre piccioni con un Tweet.

1) La statistica è una cosa complicata perché matematica. Il risultato finale dipenderà da quello che consideri. Può stupirci perché i dati oggettivi contraddicono le nostre credenze o può confermarne altre. Però dipende da cosa analizziamo e come, dai numeri, dai gruppi, da come facciamo i calcoli e da tante altre cose. Lo statistico dovrebbe evitare più possibile gli errori per arrivare a un risultato più possibile oggettivo. Altrimenti può ottenere qualsiasi risultato, anche completamente sbagliato.

Con una frase ricorrente nell'ambiente informatico ma adottata da quello della ricerca si dice "garbage in, garbage out" (spazzatura entra, spazzatura esce). Se metti dei dati non corretti avrai dei risultati non corretti, inattendibili. Se io analizzo solo la mia realtà, piccola, poco significativa (per esempio i miei dati medici personali, i dati dei miei pazienti, gli effetti di una terapia che prescrivo a 100 persone) molto probabilmente avrò un'impressione finale, un giudizio sbagliato. Non per forza ma probabilmente avrei un'alta possibilità di sbagliare. Se leggo le notizie dei giornali che dicono che sono morte 10 persone dopo un vaccino, prima devo sapere se le 10 persone erano parte di un gruppo di 100 o di 10.000.000 di vaccinati. È una cosa diversa che porta a considerazioni diverse.

2) Non limitarsi al titolo ma approfondire. Molte persone non hanno capito il senso del mio tweet. Se io, medico (mettiamo di medicina generale) avessi detto che il 100% dei miei pazienti con Covid fosse di sesso femminile si tratterebbe, in effetti (e se vero) di un dato curioso, interessante, anche preoccupante. Possibile che la malattia colpisca soprattutto le donne? Ecco, farei arrivare ai lettori un messaggio totalmente sbagliato e che non ha nulla a che vedere con la realtà. Un falso.
Ma approfondendo, sapendo che sono un ginecologo, il dato assume tutto un altro significato. Diventa ovvio, normale, scontato. Essendo un ginecologo, di che sesso dovrebbero essere le mie pazienti con Covid? Ma femminile, certo. Ecco. Il contesto è fondamentale, non solo la correttezza dei dati. Potrei quindi dare una notizia corretta ma se non si conosce il contesto, l'ambito che la ospita, potrei farvi credere quello che voglio.

3) Manipolando i dati posso concludere ciò che preferisco. Diceva Darell Huff: "Tortura abbastanza a lungo i dati ed essi confesseranno qualunque cosa".
Non pensiate sia una cosa rara o inusuale. Molte ricerche, volontariamente o solo per un normale "innamoramento" nei confronti di un'idea, un'ipotesi, usano i numeri a vanvera facendoli poi diventare la pezza d'appoggio per quello che si vuole. Se ho interesse a giungere a una conclusione (che un farmaco funziona, che non funziona, che sia sicuro, che sia economico e così via) posso usare i numeri come voglio per avere i risultati che voglio.
È qui che entra in gioco la "pubblicazione". Mettendo in pubblico i miei calcoli, le statistiche, i dati (i dati grezzi, ovvero quelli "puri", che nessuno ha manipolato per i calcoli) posso vedere se quel risultato, quella conclusione è vera, attendibile e credibile. Per questo chi ha una teoria la pubblica, per permettere a tutti di controllarne le caratteristiche. Per questo se dico che i miei pazienti con Covid sono tutte donne, prima di concludere che il Covid colpisce prevalentemente le donne devo annunciare la mia specializzazione. Altrimenti avrei compiuto una manipolazione dei dati nascondendo ai lettori un particolare fondamentale. Un trucco nemmeno così raro nella ricerca scientifica.

Insomma da un episodio banale e semplice ne ho approfittato per spiegare alcune cose.
Ho fatto bene? Non lo so. Come ha detto una commentatrice su Twitter:


Torno alle mie visite, và.
😅
Alla prossima!