| Le
illusioni dell’intuito e le probabilità statistiche
Un test clinico, atto a rivelare
la presenza di una certa forma di malattia, risulta
positivo in un certo paziente.
Vi viene detto che:
a) L' affidabilità del test in questione è
del 79%;
b) La frequenza media di quella malattia, nella popolazione
da cui proviene il paziente, in quella fascia di età,
è dell’1 %.
Tenuto conto di tutto questo, quale è,
secondo voi, la probabilità che quel paziente
abbia effettivamente quella malattia?
Provate a fare la vostra stima, prendendo tutto il tempo
che occorre.
Consiglio di continuare a leggere solo dopo averla fatta.
Forse alcuni di noi già si riconoscono intrappolati
in uno stile di ragionamento che era apparso nel tunnel
precedente. Un sofisma che ci fa confondere delle cause
con delle probabilità. Si parte da un'intuizione
giusta, anzi giustissima, per trarre però delle
conclusioni errate. Infatti, alcuni di noi pensano addirittura
che l'informazione al punto b) sia stata aggiunta a
bella posta per confondere le idee. Che importa sapere,
dicono candidamente costoro, quale è la probabilità
(o incidenza) media, dal momento che è stato
fatto il test, e che è risultato positivo? Forse
che l'affidabilità del test dipende dall'incidenza
statistica media della malattia in una popolazione?
Cioè da un dato calcolato indipendentemente dal
test e prima che il nostro paziente si sottoponesse
al test? Certo che no! L'affidabilità di un test
clinico è cosa intrinseca, non demografica. È
legata alle proprietà biochimiche dei tessuti,
alle cellule, alle molecole, ai macchinari, non è
cosa legata alle medie su popolazioni. Molti ragionano
proprio così, e infatti si è dimostrato
che rispondono, con una certa sicurezza: la probabilità
è del 79%.
C'è chi è disposto a dare una certa importanza
all'informazione del punto b), chi intuisce (correttamente)
che l'affidabilità del test, per quanto determinata
da proprietà di cellule e di molecole, va pure
combinata con la probabilità di base, quella
stimata sulla popolazione nel suo insieme, per ottenere
la probabilità effettiva che il paziente abbia
la malattia. Ma anche questi lettori, come comprovano
problemi di questo tipo sottoposti a molti medici ospedalieri
americani, ritengono comunque che, alla luce di un test
positivo, la probabilità sia superiore al 50%.
In fondo, dato il risultato del test, riteniamo tutti
che è più probabile che il paziente abbia
quella malattia di quanto sia probabile che non l'abbia.
Invece, la risposta statisticamente corretta, calcolabile
esattamente in base alla legge di Bayes (vedi pag. 113
e la soluzione a pag. 191) è il 7%. Sì,
abbiamo capito bene: il 7%!
Pazzesco, no? Molti di noi, posti di fronte a questa
risposta, reagiscono dicendo che delle tre l'una: o
la risposta è sbagliata (abbiamo fatto qualche
errore di calcolo), o la legge di Bayes (qualunque cosa
sia) non va applicata a casi come questi, o, allora,
tanto vale non fare nemmeno più questi test clinici.
Ma come! Si esegue un test altamente affidabile (il
79% non è proprio un bruscolino), il test risulta
positivo... e la probabilità che il paziente
veramente abbia quella malattia è solo del 7%?
Ma via, non scherziamo! Qui c'è qualcosa che
non funziona!
Infatti! Ma non è la statistica, non sono i test,
né la legge di Bayes. Quello che non funziona
è la nostra intuizione corrente in materia di
rischi e di probabilità. Esamineremo meglio tra
un momento che cosa ci paralizza mentalmente in questi
casi. Ma una cosa dovrebbe subito colpirci: perché
ci smuove così poco il fatto che, grazie al test,
la probabilità di malattia è ben otto
volte più grande? Cosa può fare un test,
dopo tutto? (La spiegazione del calcolo corretto è
a pag. 191). E non è pazzesco, invece, considerare
una probabilità dell'1 % «praticamente
la stessa cosa» che una probabilità dell'8%?
Torneremo su tutti questi punti e vedremo anche che
la legge di Bayes è proprio quello che ci vuole,
razionalmente e scientificamente parlando, per casi
come questi.
Si potrebbe controbattere: ma io la legge di Bayes non
so nemmeno cosa sia! Come si può pretendere che
io calcoli a braccio la risposta, se non so nemmeno
quale è la formula giusta? Anzi, se non sapevo
nemmeno che esisteva una formula per calcolare questo
tipo di probabilità? Infatti, nessuno si aspettava
che noi calcolassimo esattamente la risposta. Al limite,
sarebbe stato più incoraggiante se avessimo detto,
sinceramente (e non per pigrizia mentale), che non avevamo
la più pallida idea di quale fosse questa probabilità.
O che avessimo detto, così, a intuito, 10%, o
perfino 20%. Allora non ci sarebbe stato motivo di allarmarsi.
Non si sarebbe nemmeno parlato di una illusione cognitiva,
di un tunnel della mente. il guaio, invece, è
che «sballiamo» clamorosamente. E che crediamo
di saper rispondere. Tanto è vero che la risposta
corretta ci scandalizza e ci lascia increduli. Anche
chi non risponde proprio che la probabilità è
il 79%, risponde pur sempre con una stima che è
più vicina al 60% che non al 7%. Un errore per
eccesso di quasi nove volte!
La risposta esatta va calcolata adottando la formula
di Bayes. Ne darò qui una versione molto semplificata
e «intuitiva», mettendo intuitiva tra virgolette,
in quanto abbiamo ampiamente constatato che per noi
questi calcoli non sono affatto intuitivi. Si tratta,
piuttosto, di educare la nostra intuizione, passo passo,
attraverso una versione della dottrina bayesiana che
conservi quanto più possibile alcune nostre intuizioni
giuste. La formula è esposta in modo perfettamente
rigoroso in molti trattati di teoria delle probabilità,
ai quali rimando il lettore più smaliziato.
Dunque, si costruisce prima una tabella, esprimendo
le percentuali con una cifra compresa tra zero e uno
(una probabilità del 25% verrà scritta
0,25, una del 79% verrà scritta 0,79, e così
via). Trascrivo i dati utilizzati nel 1966 in un classico
articolo di R. E. Snyder (dal quale ho tratto il nostro
esempio) basato sull'effettivo potere diagnostico della
mammografia nell'individuare un tumore maligno:

Per semplicità,
abbiamo qui supposto che la percentuale dei falsi positivi
(casi con test positivo e malattia assente) sia il «complemento»
di quella dei veri negativi (test negativo e malattia
assente), cioè che la loro somma sia uno (100%).
Lo stesso abbiamo fatto per i falsi negativi (casi di
test negativo e malattia presente) e i veri positivi
(numero in alto a sinistra). Nella realtà le
cose non stanno mai proprio così, ma è
inutile qui complicare ulteriormente i calcoli. I veri
positivi sono quelli che illusoriamente esauriscono,
nella nostra intuizione comune, tutto quanto si deve
sapere sull'affidabilità del test. Infatti, nella
formulazione del problema era stato indicato che il
test era «affidabile al 79%».
Scagli la prima pietra colui, o colei, che aveva rifiutato
di formulare una risposta prima di sapere anche quale
era la percentuale di falsi positivi. A nessuno di noi
viene in mente di richiedere questo ulteriore dato,
eppure, come adesso constatiamo, si tratta di un dato
capitale. Il modo migliore per definire la cifra in
alto a sinistra, cioè la percentuale di veri
positivi, è la «sensibilità»
del test.
La tabella contiene tutti gli ingredienti per applicare
la formula di Bayes, meno uno, che era stato però
fornito esplicitamente nel testo del nostro problema:
la probabilità della malattia indipendentemente
dal risultato del test, cioè uno per cento, ovvero
0,01.
Un dato fondamentale, ai fini di questo calcolo, è
il prodotto tra la sensibilità del test (veri
positivi) e la probabilità di base, cioè
quella che il paziente abbia la malattia con o senza
il risultato del test. Chiamiamo alla buona, tra noi,
questo dato fondamentale PP (probabilità pesata).
Nel nostro caso PP = (0,79) x (0,01) = 0,0079 (si noti
che la probabilità così pesata è
circa otto su mille).
Dobbiamo ora, secondo i dettami della dottrina bayesiana,
ricavare un altro dato fondamentale. Esso risulta dal
prodotto di due cifre: 1) la probabilità che,
qualora il paziente non abbia veramente la malattia,
il test risulti comunque positivo; 2) la probabilità
di non avere la malattia, indipendentemente dal test.
Dalla nostra tabella estraiamo il primo dato (falsi
positivi), cioè 0,1 (dieci per cento). Ovviamente,
il dato numero due è 0,99, ovvero il 99 per cento,
che si ottiene «ribaltando» la probabilità
di avere la malattia indipendentemente dal test (e questa
era, appunto, l'uno per cento).
Moltiplicando 0,1 per 0,99 otteniamo 0,099. Intuitivamente
possiamo pensare a questo dato come a un'altra probabilità
«pesata»: la probabilità di un possibile
«svarione» diagnostico pessimista (dovuto
alla sensibilità non perfetta del test) viene
moltiplicata per la (alta) probabilità, invece,
«ottimista» di non avere la malattia, qualunque
cosa ci dica il test. Chiamiamo di nuovo, tra noi, alla
buona, questo dato SO (svarione compensato dall'ottimismo).
La legge di Bayes ci impone ora di combinare tutti questi
dati nel modo seguente (la nostra intuizione qui ci
aiuta poco, bisogna rieducarla pesantemente per «vedere»
direttamente cosa dice questa formula):
probabilità effettiva della malattia, dato il
test positivo = PP/PP+SO nel nostro caso, essendo PP
= 0,0079 e SO = 0,099 otteniamo una probabilità
finale esatta (o, come si dice in gergo, bayesiana)
di 0,0739, ovvero, arrotondando, il 7%.
Tratto da “L’illusione di sapere”
di Massimo Piattelli Palmarini, Saggi Mondadori
Massimo Piattelli Palmarini, studioso, ricercatore
e collaboratore del “Times Literary Supplement”
e della “Repubblica”, è autore di
numerosi saggi tra i quali: Scienza come cultura (Mondadori
1992), la voglia di studiare (Mondadori 1993) e ritrattino
di Kant a uso di mio figlio (Mondadori 1994). Attualmente
è direttore del Dipartimento di Scienze Cognitive
dell’Istituto San Raffaele di Milano.
|