Home | Matematica | Simpson

Simpson

Ciò che rende la statistica interessante, per me, è che c’è qualche trabocchetto qua e là. Uno veramente carino è il “paradosso di Simpson“, al quale è difficile credere. Io stesso, pur se lo conosco e mi sono convinto con la forza bruta dei numeri che può davvero darsi questo paradosso, a livello istintivo continuo a sentirlo come “impossibile”. Qualche giorno fa ne ho scoperto per caso un altro, che non conoscevo: è di altro genere, ma non meno affascinante. E presenta anche il rischio di brutte conseguenze educative!
Ma di questo nuovo spero di aver tempo di parlarne in futuro. Per oggi mi dedico al paradosso di Simpson.

Immaginate che si voglia sapere quale sia il più efficace tra due trattamenti medici. Per capirlo si fanno, come insegna la scienza, degli esperimenti. Bene, vediamo i dati da un caso realmente studiato, e che riguardava i calcoli renali.
Si prova la cura su un gruppo di pazienti e vengono fuori questi risultati:
– per le persone con calcoli piccoli il trattamento A ha una maggiore percentuale di successi rispetto al trattamento B: 93% contro 87%
– per le persone con calcoli grandi il trattamento A ha una maggiore percentuale di successi rispetto al trattamento B: 73% contro 69%

E allora? dove sta il problema? Ovvio che il trattamento A è migliore. O, meglio, magari potrà essere il caso di replicare l’esperimento. Ma l’insegnamento che ci dà questo esperimento è incontrovertibile.

Uhm, forse non è così semplice…
In effetti, se mettiamo assieme tutte le persone che sono state “trattate”, scopriamo che ne complesso il trattamento B ha una maggiore percentuale di successi rispetto al trattamento A! Per la precisione, nel caso concreto la percentuale di successi del trattamento B fu del 83% a fronte di un 78% per il trattamento A.

Non ci sono errori di stampa. Per quanto possa apparire paradossale (non a caso si parla di paradosso), così è. E, ripeto, non sono dati inventati(*), ma si riferiscono a un esperimento fatto davvero. Che, poi, anche se fossero dati inventati, il paradosso resterebbe comunque.

Bella la statistica. Altro che il pollo di Trilussa, citato spesso da persone colte ma debolucce in matematica.

Semplice curiosità matematica? Eh, no. Immaginate di dover decidere se usare i trattamento A o B, con il paziente che avete di fronte a voi.

L’immagine che illustra questo articolo è © di Fioravante Patrone

(*) C. R. Charig, D. R. Webb, S. R. Payne, J. E. Wickham: Comparison of treatment of renal calculi by open surgery, percutaneous nephrolithotomy, and extracorporeal shockwave lithotripsy, Br Med J (Clin Res Ed) 292, 879–882, 1986.

PS (13/07/2014): mi sono imbattuto in un documento contenente un esempio il quale dimostra che… fumare allunga la vita! Vedasi le slide n.5 e 6. Basta dare un’occhiata ai dati disaggregati per età per capire al volo dove stia il “trucco”, al di là dei conti dettagliati.
Segnalo molto volentieri questa presentazione dell’uso della statistica in medicina, perché è anche interessante di per sé, al di là dell’esempio sul paradosso di Simpson:
La statistica in medicina: esempi, risultati e prospettive, di Anna Maria Paganoni (link al pdf aggiornato il 24/01/2016)

altro PS (25/02/2017): Bell’articolo su “stage migration” (e paradosso di Simpson), a cura della
Società Italiana di Statistica

Gentile utente, ti ricordiamo che puoi manifestare liberamente la tua opinione con un commento all'articolo, che verrà moderato dalla redazione prima della sua pubblicazione. Affinché il tuo contributo possa essere pubblicato, dovrà attenersi alla Policy di utilizzo del sito: evita gli insulti, le accuse senza fondamento e mantieniti in topic.

2 commenti

  1. non ho capito. perché B ha una percentuale di successi maggiore?

  2. Fioravante Patrone

    Apprezzo molto il commento di “angelo”.
    Perché, dal mio post era (volutamente) impossibile capire. O, per meglio dire, i soli dati forniti non rendevano evidente come si potesse realizzare la situazione paradossale descritta nel post.

    Il paradosso diventa meno… paradossale se si guardano “i numeri” e non solo le percentuali. In effetti, la chiave del paradosso sta proprio nella maggiore o minore grandezza dei “campioni” considerati.

    Riporto allora qui i dati dell’articolo originario del 1986:
    – calcoli piccoli: trattati 87 con il metodo A (con 81 successi, pari al 93%); trattati 270 con il metodo B (con 234 successi, cioè l’87%)
    – calcoli grandi: trattati 263 pazienti col metodo A (192 successi, pari al 73%), e 80 con il metodo B (55 successi, pari al 69%)

    A questo punto basta tirare le somme:
    – trattati in tutto 350 pazienti col metodo A, riportando 273 successi
    – trattati in tutto 350 pazienti col metodo B, riportando 289 successi

    Come detto, lo trovo “bello e impossibile”, a sentimento. Ma i numeri mostrano inequivocabilmente come questo paradosso possa verificarsi. E, come detto, servono i numeri per toccare con mano cosa avvenga.

Commenta l'articolo

Il tuo indirizzo e-mail non sarà pubblicato* Campi obbligatori *

*

Torna ad inizio pagina