Ritorna alla prima pagina.
   

Il percorso di questa pagina è:


Le illusioni dell’intuito e le probabilità statistiche

Un test clinico, atto a rivelare la presenza di una certa forma di malattia, risulta positivo in un certo paziente.
Vi viene detto che:
a) L' affidabilità del test in questione è del 79%;
b) La frequenza media di quella malattia, nella popolazione da cui proviene il paziente, in quella fascia di età, è dell’1 %.

Tenuto conto di tutto questo, quale è, secondo voi, la probabilità che quel paziente abbia effettivamente quella malattia?
Provate a fare la vostra stima, prendendo tutto il tempo che occorre.
Consiglio di continuare a leggere solo dopo averla fatta.
Forse alcuni di noi già si riconoscono intrappolati in uno stile di ragionamento che era apparso nel tunnel precedente. Un sofisma che ci fa confondere delle cause con delle probabilità. Si parte da un'intuizione giusta, anzi giustissima, per trarre però delle conclusioni errate. Infatti, alcuni di noi pensano addirittura che l'informazione al punto b) sia stata aggiunta a bella posta per confondere le idee. Che importa sapere, dicono candidamente costoro, quale è la probabilità (o incidenza) media, dal momento che è stato fatto il test, e che è risultato positivo? Forse che l'affidabilità del test dipende dall'incidenza statistica media della malattia in una popolazione? Cioè da un dato calcolato indipendentemente dal test e prima che il nostro paziente si sottoponesse al test? Certo che no! L'affidabilità di un test clinico è cosa intrinseca, non demografica. È legata alle proprietà biochimiche dei tessuti, alle cellule, alle molecole, ai macchinari, non è cosa legata alle medie su popolazioni. Molti ragionano proprio così, e infatti si è dimostrato che rispondono, con una certa sicurezza: la probabilità è del 79%.
C'è chi è disposto a dare una certa importanza all'informazione del punto b), chi intuisce (correttamente) che l'affidabilità del test, per quanto determinata da proprietà di cellule e di molecole, va pure combinata con la probabilità di base, quella stimata sulla popolazione nel suo insieme, per ottenere la probabilità effettiva che il paziente abbia la malattia. Ma anche questi lettori, come comprovano problemi di questo tipo sottoposti a molti medici ospedalieri americani, ritengono comunque che, alla luce di un test positivo, la probabilità sia superiore al 50%. In fondo, dato il risultato del test, riteniamo tutti che è più probabile che il paziente abbia quella malattia di quanto sia probabile che non l'abbia.
Invece, la risposta statisticamente corretta, calcolabile esattamente in base alla legge di Bayes (vedi pag. 113 e la soluzione a pag. 191) è il 7%. Sì, abbiamo capito bene: il 7%!
Pazzesco, no? Molti di noi, posti di fronte a questa risposta, reagiscono dicendo che delle tre l'una: o la risposta è sbagliata (abbiamo fatto qualche errore di calcolo), o la legge di Bayes (qualunque cosa sia) non va applicata a casi come questi, o, allora, tanto vale non fare nemmeno più questi test clinici. Ma come! Si esegue un test altamente affidabile (il 79% non è proprio un bruscolino), il test risulta positivo... e la probabilità che il paziente veramente abbia quella malattia è solo del 7%? Ma via, non scherziamo! Qui c'è qualcosa che non funziona!
Infatti! Ma non è la statistica, non sono i test, né la legge di Bayes. Quello che non funziona è la nostra intuizione corrente in materia di rischi e di probabilità. Esamineremo meglio tra un momento che cosa ci paralizza mentalmente in questi casi. Ma una cosa dovrebbe subito colpirci: perché ci smuove così poco il fatto che, grazie al test, la probabilità di malattia è ben otto volte più grande? Cosa può fare un test, dopo tutto? (La spiegazione del calcolo corretto è a pag. 191). E non è pazzesco, invece, considerare una probabilità dell'1 % «praticamente la stessa cosa» che una probabilità dell'8%? Torneremo su tutti questi punti e vedremo anche che la legge di Bayes è proprio quello che ci vuole, razionalmente e scientificamente parlando, per casi come questi.
Si potrebbe controbattere: ma io la legge di Bayes non so nemmeno cosa sia! Come si può pretendere che io calcoli a braccio la risposta, se non so nemmeno quale è la formula giusta? Anzi, se non sapevo nemmeno che esisteva una formula per calcolare questo tipo di probabilità? Infatti, nessuno si aspettava che noi calcolassimo esattamente la risposta. Al limite, sarebbe stato più incoraggiante se avessimo detto, sinceramente (e non per pigrizia mentale), che non avevamo la più pallida idea di quale fosse questa probabilità. O che avessimo detto, così, a intuito, 10%, o perfino 20%. Allora non ci sarebbe stato motivo di allarmarsi. Non si sarebbe nemmeno parlato di una illusione cognitiva, di un tunnel della mente. il guaio, invece, è che «sballiamo» clamorosamente. E che crediamo di saper rispondere. Tanto è vero che la risposta corretta ci scandalizza e ci lascia increduli. Anche chi non risponde proprio che la probabilità è il 79%, risponde pur sempre con una stima che è più vicina al 60% che non al 7%. Un errore per eccesso di quasi nove volte!


La risposta esatta va calcolata adottando la formula di Bayes. Ne darò qui una versione molto semplificata e «intuitiva», mettendo intuitiva tra virgolette, in quanto abbiamo ampiamente constatato che per noi questi calcoli non sono affatto intuitivi. Si tratta, piuttosto, di educare la nostra intuizione, passo passo, attraverso una versione della dottrina bayesiana che conservi quanto più possibile alcune nostre intuizioni giuste. La formula è esposta in modo perfettamente rigoroso in molti trattati di teoria delle probabilità, ai quali rimando il lettore più smaliziato.
Dunque, si costruisce prima una tabella, esprimendo le percentuali con una cifra compresa tra zero e uno (una probabilità del 25% verrà scritta 0,25, una del 79% verrà scritta 0,79, e così via). Trascrivo i dati utilizzati nel 1966 in un classico articolo di R. E. Snyder (dal quale ho tratto il nostro esempio) basato sull'effettivo potere diagnostico della mammografia nell'individuare un tumore maligno:

Per semplicità, abbiamo qui supposto che la percentuale dei falsi positivi (casi con test positivo e malattia assente) sia il «complemento» di quella dei veri negativi (test negativo e malattia assente), cioè che la loro somma sia uno (100%). Lo stesso abbiamo fatto per i falsi negativi (casi di test negativo e malattia presente) e i veri positivi (numero in alto a sinistra). Nella realtà le cose non stanno mai proprio così, ma è inutile qui complicare ulteriormente i calcoli. I veri positivi sono quelli che illusoriamente esauriscono, nella nostra intuizione comune, tutto quanto si deve sapere sull'affidabilità del test. Infatti, nella formulazione del problema era stato indicato che il test era «affidabile al 79%».
Scagli la prima pietra colui, o colei, che aveva rifiutato di formulare una risposta prima di sapere anche quale era la percentuale di falsi positivi. A nessuno di noi viene in mente di richiedere questo ulteriore dato, eppure, come adesso constatiamo, si tratta di un dato capitale. Il modo migliore per definire la cifra in alto a sinistra, cioè la percentuale di veri positivi, è la «sensibilità» del test.
La tabella contiene tutti gli ingredienti per applicare la formula di Bayes, meno uno, che era stato però fornito esplicitamente nel testo del nostro problema: la probabilità della malattia indipendentemente dal risultato del test, cioè uno per cento, ovvero 0,01.
Un dato fondamentale, ai fini di questo calcolo, è il prodotto tra la sensibilità del test (veri positivi) e la probabilità di base, cioè quella che il paziente abbia la malattia con o senza il risultato del test. Chiamiamo alla buona, tra noi, questo dato fondamentale PP (probabilità pesata).
Nel nostro caso PP = (0,79) x (0,01) = 0,0079 (si noti che la probabilità così pesata è circa otto su mille).
Dobbiamo ora, secondo i dettami della dottrina bayesiana, ricavare un altro dato fondamentale. Esso risulta dal prodotto di due cifre: 1) la probabilità che, qualora il paziente non abbia veramente la malattia, il test risulti comunque positivo; 2) la probabilità di non avere la malattia, indipendentemente dal test. Dalla nostra tabella estraiamo il primo dato (falsi positivi), cioè 0,1 (dieci per cento). Ovviamente, il dato numero due è 0,99, ovvero il 99 per cento, che si ottiene «ribaltando» la probabilità di avere la malattia indipendentemente dal test (e questa era, appunto, l'uno per cento).
Moltiplicando 0,1 per 0,99 otteniamo 0,099. Intuitivamente possiamo pensare a questo dato come a un'altra probabilità «pesata»: la probabilità di un possibile «svarione» diagnostico pessimista (dovuto alla sensibilità non perfetta del test) viene moltiplicata per la (alta) probabilità, invece, «ottimista» di non avere la malattia, qualunque cosa ci dica il test. Chiamiamo di nuovo, tra noi, alla buona, questo dato SO (svarione compensato dall'ottimismo).
La legge di Bayes ci impone ora di combinare tutti questi dati nel modo seguente (la nostra intuizione qui ci aiuta poco, bisogna rieducarla pesantemente per «vedere» direttamente cosa dice questa formula):
probabilità effettiva della malattia, dato il test positivo = PP/PP+SO nel nostro caso, essendo PP = 0,0079 e SO = 0,099 otteniamo una probabilità finale esatta (o, come si dice in gergo, bayesiana) di 0,0739, ovvero, arrotondando, il 7%.


Tratto da “L’illusione di sapere” di Massimo Piattelli Palmarini, Saggi Mondadori

Massimo Piattelli Palmarini, studioso, ricercatore e collaboratore del “Times Literary Supplement” e della “Repubblica”, è autore di numerosi saggi tra i quali: Scienza come cultura (Mondadori 1992), la voglia di studiare (Mondadori 1993) e ritrattino di Kant a uso di mio figlio (Mondadori 1994). Attualmente è direttore del Dipartimento di Scienze Cognitive dell’Istituto San Raffaele di Milano.

 


Pagina inserita nel sito www.polesine.com il 5-02-2005

Cerca all'interno del sito
Testo da cercare
e / o MAIUSCOLO / minuscolo

 

  Vai al sito di ezeta.net  
 Phuket, la perla del Sud

Entra nel sito di Phuket