Avete appena fatto un test sierologico per verificare se siate o
meno stati infettati da un virus potenzialmente letale.
Il test è molto attendibile: 99% come risulta dalla sua
certificazione internazionale.
Dopo qualche minuto di attesa il personale medico vi consegna il
risultato: POSITIVO all'infezione!
Siete comprensibilmente molto preoccupati per la vostra salute e
per la vostra vita: la speranza che il vostro responso sia errato
vi sembra remotissima: 1 su 100, una condanna sicura.
Mentre siete tramortiti dalla sentenza ricevuta qualche ora prima
ci incontriamo per caso e me ne parlate.
Controllo su google il dato relativo all'incidenza degli infetti
sulla popolazione (la percentuale di individui infettati dal virus
nel nostro paese) e subito vi rassicuro: nonostante il risultato
positivo del vostro test "sicuro al 99%", la probabilità che voi
siate davvero infetti è pari soltanto al 23%, la metà di quella
che avreste tentando di indovinare l'uscita di testa o croce
lanciata una moneta.
Siete sbalorditi da quanto vi ho detto, ma non vi sentite ancora
rassicurati.
Quella che segue è una dimostrazione - basata sulla logica - del
fatto che una situazione del genere si verifichi più spesso di
quanto potremmo credere.
Prima di affrontare l'argomento Covid-19 - al momento senz'altro
vostra preoccupazione prevalente - parliamo del virus HIV, quello
che nei primi anni '80 Luc Montagnier (prima di diventare un
vecchio nobel spacciatore di news strampalate) ha scoperto esser
la causa dell'insorgenza dell'AIDS (o SIDA come si dice alla
francese, vista la nazionalità dello scopritore).
L'AIDS colpisce (e spesso uccide) ogni anno centinaia di migliaia
di persone nel mondo: soltanto nei paesi sviluppati, dotati di un
sistema sanitario con sufficienti risorse, è stato possibile
cronicizzare questa pericolosa malattia sottoponendo gli infetti a
specifiche terapie per tutta la durata della loro vita.
Identificare chi sia portatore di HIV - per limitarne il contagio
- è stata da subito la priorità della ricerca.
Ad oggi, pur senza aver sviluppato un vaccino, disponiamo di un
test la cui affidabilità è molto elevata.
Iniziamo col chiarire che nessun test sierologico è affidabile al
100%: un valore pari al 99% è di assoluto rispetto.
Per il nostro scopo vogliamo calcolare, ottenuto un responso
positivo al test sulla presenza di anticorpi specifici, quale sia
la probabilità di essere davvero infettati dall'HIV (cioè che il
test abbia restituito un'informazione corretta).
Negli ultimi anni l'incidenza degli infetti da HIV sul totale
della popolazione italiana si è stabilizzata su un valore pari al
3 per mille: cioè 3 persone ogni mille italiani hanno contratto
l'HIV e sono potenzialmente contagiosi.
Su una popolazione di 60 milioni di abitanti gli "infetti" saranno
dunque all'incirca 180.000 individui, e, di conseguenza, i "non
infetti" saranno 60 milioni - 180.000 = 59.820.000
individui.
Ci sono solo 4 possibilità:
- "positivo al test ed infetto": il test ha funzionato
correttamente identificando la persona come infetta;
- "negativo al test e non infetto": il test ha funzionato
correttamente identificando la persona come non infetta;
- "positivo al test e non infetto" (falso positivo): il test ci segnala questa
persona come infetta ma non lo è;
- "negativo al test ed infetto" (falso negativo): il test ci segnala questa
persona come non infetta mentre lo è;
L'affidabilità abbiamo detto essere pari al 99%, dunque ogni 100
persone sottoposte al test una di esse verrà classificata in modo
errato:
falso negativo (negativa al test ma infetta) oppure falso positivo
(positiva al test ma non infetta).
Immaginiamo di sottoporre alla prova tutti quanti gli italiani.
Su
60 milioni, ben 600.000 responsi (l'1% del totale) non sarebbero
corretti ed avremmo in particolare:
1) 1.800 falsi negativi: l'1% dei 180.000 "individui infetti"
risulterebbe negativo al test; inconsapevoli del proprio
stato, contribuirebbero attivamente alla diffusione del contagio.
2) 598.200 falsi positivi: l'1% dei 59.820.000 "individui non infetti"
risulterebbe positivo al test, preoccupandosi di conseguenza!
Se il test fosse attendibile al 100% tutti i positivi sarebbero
infetti e tutti i negativi non infetti, ma sappiamo che le cose
non stanno così: c'è un errore molto piccolo - l'uno per cento -
ma che ha un grosso significato per coloro che si sono sottoposti al
test ed hanno ottenuto un responso
positivo.
A fronte di soli 180.000 individui infetti, coloro che risultano positivi sono 4 volte tanti!
Esattamente sono 776.400, circa l'1,3% dei 60 milioni di persone sottoposte al test.
Per ottenere questo numero si prende il totale degli infetti
(180.000), si tolgono i falsi negativi (1.800) e si aggiungono i
falsi positivi (598.200)
180.000 - 1.800 + 598.200 = 776.400 sono i risultati positivi che otterremmo sottoponendo tutti gli italiani al test.
Ma
attenzione: di questi 776.400 soltanto 178.200 sono davvero
infetti! (i restanti 1.800 infetti sono negativi al test a causa
dell'errore).
Cosa significa tutto ciò?
Sottoponendoci ad un test "affidabile al 99%" per verificare
l'avvenuta infezione da parte di un virus che colpisce solo il 3
per mille della popolazione, anche in presenza di un riscontro
positivo la probabilità di essere infetti è decisamente inferiore
a quanto ci si aspetterebbe, pari a 178.200 / 776.400 = circa il
23%
(esattamente 22,952087 %, vedi nota 1)
Questo apparente controsenso è possibile quando la diffusione del
virus è percentualmente bassa nella popolazione, 0,3% nel caso
dell'HIV: un virus con diffusione pari all' 1% vede crescere la probabilità
di esser infetti in presenza di test positivo sino al 50% (se la diffusione arriva al 10% tale probabilità supera il 90%).
E' da notare tuttavia che - in generale - la diffusione di un
virus, per quanto contagioso, non raggiunge percentuali elevate nella
popolazione: ne consegue che, più frequentemente di quanto possiamo
pensare, un risultato positivo al test specifico non identifica con
sicurezza l'individuo come infetto.
Una strategia comune per limitare il numero dei falsi positivi e falsi negativi consiste nel sottoporre più volte
al test la stessa persona.
Nel caso del mio amico vi lascio il divertente compito di calcolare
quale sarebbe la probabilità di esser infetto se avesse conseguito 2
risultati positivi consecutivi (vedi Nota 2 se non hai voglia di
ragionarci su).
Nota l'incidenza degli infetti sul totale della popolazione (3 per
mille) potremmo chiederci quale sia la possibilità di risultare positivi
al test:
776.400 su 60 milioni di individui significa l' 1,25%.
Cioè, prendendo a caso 100 italiani dovremmo trovarne almeno uno positivo (1,25 esattamente).
Cosa dire in merito al Covid-19? (vedi Nota 3)
L'HIV non scompare spontaneamente dal corpo
di un infettato: in tempi più o meno lunghi determina l'insorgenza
dell'AIDS in forma conclamata.
Pare oramai accertato che una percentuale significativa di infetti da SARS-CoV-2 (il virus che provoca la sindrome Covid-19)
guarisca spontaneamente senza aver manifestato sintomi: si tratta dei cosiddetti
"asintomatici".
Non conoscendo l'esatta incidenza degli infetti sulla
popolazione - finora sono stati sottoposti a tampone gruppi di
persone certo non selezionati con criteri casuali - risulta impossibile
calcolare sia la probabilità di essere infetti prima di esser sottoposti
a test (numero degli infetti / popolazione) che, tanto meno, la
probabilità di
essere infetti in presenza di risultato positivo del test.
Il grado di attendibilità di un tampone è inferiore al 99%, dunque è
ovvio che al crescere del margine di errore dichiarato la probabilità di
esser infetti, qualora positivi,
diminuisce.
Al contrario, aumentando la percentuale degli infetti sulla popolazione, il
risultato del test diventa mano a mano più attendibile.
Prendendo per buoni i numeri ufficiali degli "attualmente
positivi" quale stima attendibile del numero di infetti in questo momento, il tasso di incidenza
sulla popolazione risulterebbe pari all' 1.67 per mille (circa 100.000
su 60 milioni), un terzo di quello relativo all'HIV.
In tal caso risultare positivi ad un test Covid-19 affidabile al 99% comporta una probabilità
di essere infetti pari soltanto al 14%.
Conseguentemente, un test condotto su tutta la popolazione italiana
risulterebbe positivo per 700.000 persone a fronte di soli 100.000
infetti.
Prendendo a caso 100 individui, uno risulterebbe positivo al test;
tuttavia ne servirebbe un gruppo di almeno 600 per trovare un infetto.
Qualora, come affermano alcune stime autorevoli, i contagiati
fossero
un numero fino a dieci volte maggiore di quello ufficiale
(accettando l'ipotesi secondo la quale 9 infetti su 10 sono
asintomatici, sfuggiti finora ai
rilevamenti) parleremmo di un milione di infetti, l'1.67% della
popolazione.
Trovarsi positivi al test comporterebbe avere il 63% di probabilità di essere infetti (invece che il 14%), rimanendo comunque
ancora lontani dal 99%.
Prendendo a caso 100 persone i positivi al test sarebbero 2 o 3 (2,64 è
il dato corretto); ne servirebbe un gruppo di almeno 60 per trovare un
infetto (vedi nota 4).
Che cosa ci suggerisce questa analisi?
E' auspicabile sottoporre un campione casuale e bilanciato della popolazione
ad un test sierologico per ottenere una stima attendibile circa la diffusione del contagio tra la popolazione,
così da disporre di un valore per il parametro "incidenza degli
infetti sulla popolazione".
Anche se, è doveroso specificare, l'uso di un metodo che comporta
la ricerca di anticorpi specifici rischia di fornirci una sovrastima dei
"contagiati e contagiosi": rileverebbe infatti tutti coloro (ancora in
vita) che sono venuti a contatto con il
virus, compresi i "guariti", non più parte della popolazione
infetta, nel cui sangue circolano ancora gli anticorpi.
Per quanto se ne sa al momento, sembra che la famosa "FASE 2" autorizzi un pericoloso "procedere
in ordine sparso".
E' previsto che test sierologici possano esser condotti - a
discrezione - su piccoli gruppi di persone non selezionate con
criteri rappresentativi, quali ad esempio i dipendenti di una
determinata azienda.
E' dunque presumibile che, a chi risulti positivo, venga negato
l'accesso al posto di lavoro: la sua identità potrebbe venir
segnalata alle autorità che, di conseguenza, costringerebbero il
malcapitato ad autoisolamento fiduciario.
In una situazione del genere sarebbe inevitabile una
discriminazione nei confronti di persone sane,
erroneamente identificate come infette: nell'ipotesi di
un'incidenza degli infetti sulla popolazione simile a quella riscontrata
per l'HIV (180.000 infetti in Italia), 3 positivi su 4 non avrebbero
nulla a che fare con il Covid-19.
Per spiegarci meglio, ogni 333 lavoratori ne troviamo uno infetto, ma troveremmo un positivo ogni 77 persone!
Una piccola/media azienda che dia impiego a 150 addetti potrebbe non
aver nessun dipendente infetto ma trovarsi con due di questi positivi al
test, doverli allontanare dal lavoro e costringerli ad esser sottoposti
a misure di
distanziamento sociale (pensiamo solo alle conseguenze per le loro
famiglie).
Infine è opportuno evidenziare un altro rischio di discriminazione.
Non in tutte le aziende si è
deciso di procedere con i test sierologici; in conseguenza di ciò,
soltanto una parte della forza lavoro del nostro paese si troverebbe
esposta al rischio di subire limitazioni - alla libertà di movimento ed
all'accesso al posto di
lavoro - pur essendo non infetta dal virus (falsi positivi).
Non abbiamo invece i mezzi per identificare i falsi negativi: nel caso
più sfavorevole che abbiamo esaminato, un milione di infetti, si
tratterebbe di almeno 10.000 individui che inconsapevolmente
contribuirebbero a spargere il contagio.
Massima attenzione quindi alle scelte che il nostro governo si
appresta a fare nei prossimi mesi.
Note:
-------
Nota 1: come calcolare la probabilità di non esser infetti
nonostante il test abbia dato esito positivo.
Dati:
P = popolazione
i = incidenza degli infetti sulla popolazione
E = margine di errore del test
Il rapporto "infetti / positivi" (che chiamiamo "R") sarà calcolato come:
R = iP / ( iP + ( P - iP ) * E - iPE )
La probabilità per un positivo al test di essere anche infetto (che chiamiamo "Ch") sarà calcolata come:
Ch = ( iP - iE ) / ( iP + ( P - iP ) * E - iPE )
Quest'ultima infatti differisce dal rapporto "infetti / positivi" in
quanto non tutti gli infetti sono anche positivi: esistono i falsi
negativi, cioè infetti il cui risultato al test è negativo, che non
dobbiamo calcolare nel conteggio.
Dobbiamo quindi togliere da iP (nominatore della frazione) il valore di iE.
Nota 2: la probabilità di esser sani nonostante il test positivo è pari a 100% - 23% = 77%
Sottoponendoci nuovamente al test dobbiamo utilizzare il metodo di calcolo per la probabilità composta: 0,77 x 0,77 = 0,59
Dunque se con il primo test positivo la nostra probabilità di esser
comunque non infetti era pari al 77%, con due test scende al 59%, con 3
al 35%, e così via.
Nota 3: gli stessi risultati si possono ottenere utilizzando la statistica Bayesiana.
Il seguente è un articolo molto interessante - tratto da una rivista
specializzata in "data science" postatomi da Andrea Malagoli - che la
applica al caso COVID, spiegando così i motivi di certe strategie
adottate durante l'epidemia:
https://towardsdatascience.com/statistics-and-unreliable-tests-coronavirus-is-difficult-to-contain-e113b5c0967c
Nota 4:
valori ottenuti ipotizzando che gli infetti in Italia siano 100.200 (valore vicino ai dati ufficiali);
Probabilità di essere infetti e positivi al test: 14%
valori ottenuti ipotizzando che gli infetti in Italia siano un milione, dieci volte il dato ufficiale;
Probabilità di essere infetti e positivi al test: 63%
Nota 5:
al seguente link potete trovare il foglio di excel dal quale sono
estratte le tabelle precedenti; cambiando i valori "P", "i" ed "E" nelle
prime 4 righe potete calcolare in diversi contesti la probabilità di
esser infetti qualora il test abbia fornito esito positivo:
opera sui parametri e calcolatore infetti su positivi
Riflessioni su argomenti non scontati
Usciamo dalla bolla che gli algoritmi dei socials ci costruiscono intorno!
contatore visite
Iscriviti a:
Commenti sul post (Atom)
Elenco posts
Elenco dei miei posts scritti nel periodo dal 28/3/18 al 09/12/24: ( su FB ) - pdf e vid...
-
parte 1^ : Introduzione Parte 2^ : il significato di Cosmologia nell'ambito della scienza contemporanea Parte 3^ : l'ipotesi dell...
-
Elenco dei miei posts scritti nel periodo dal 28/3/18 al 09/12/24: ( su FB ) - pdf e vid...
-
Parte 1^ : introduzione. Parte 2^ : complementarietà e principio olografico Parte 3^ : Maldacena e la corrispondenza AdS/CFT. Parte 4 : Enta...
Nessun commento:
Posta un commento