In statistica tutte le parole sono importanti, e anche le virgole

Ho scoperto un nuovo blog di statistica, Understanding Uncertainty. È un progetto del Laboratorio di statistica dell’Università di Cambridge, e mi pare interessante e ben fatto.

L’articolo scovato ieri ve lo ripropongo integralmente. Lo condivido in pieno, in prosa e in poesia:

Essere preciso e pedante
è molto importante

The BBC reported last week that evidence for the Higgs Boson is “around the two-sigma level of certainty” and provides further explanation:

Particle physics has an accepted definition for a “discovery”: a five-sigma level of certainty. The number of standard deviations, or sigmas, is a measure of how unlikely it is that an experimental result is simply down to chance rather than a real effect”

This is nice and clear, but also wrong, as we have pointed out before in a previous blog by Kevin McConway.

The number of sigmas does not say ‘how unlikely the result is due to chance‘: it measures ‘how unlikely the result is, due to chance‘.

The additional comma may seem staggeringly pedantic (and indeed statisticians have been accused of being even more pedantic about language than lawyers). So what is the problem?

The first, incorrect, ‘how unlikely the result is due to chance‘ applies the term ‘unlikely’ to the whole phrase ‘the result is due to chance’, ie it says that the hypothesis that the Higgs Boson does not exist is unlikely, or equivalently it is likely the Higgs Boson exists.

The second, correct, ‘how unlikely the result is, due to chance‘ applies the term ‘unlikely‘ to the data, and just says that the data is surprising, if the Higgs Boson does not exist. It does not imply that it is necessarily likely that the Higgs Boson exists.

Take Paul the Octopus, who correctly predicted 8 football results in a row, which is unlikely (probability 1/256), due to chance. Is it reasonable to say that these results are unlikely to be due to chance (in other words that Paul is psychic)? Of course not, and nobody said this at the time, even after this 2.5 sigma event. So why do they say it about the Higgs Boson?

This is important – people have been wrongly condemned for murder because this comma was left out. The comma needs to be in there.

Why it’s important to be pedantic about sigmas and commas | Understanding Uncertainty

2 Risposte to “In statistica tutte le parole sono importanti, e anche le virgole”

  1. Che cosa significa un aumento del 13% del rischio di morte? « Sbagliando s’impera Says:

    […] pubblicato il 21 marzo 2012 sul blog Understanding Uncertainty di cui ho già parlato in un’altra occasione. L’ho trovato così bello che mi cimento per voi nella sua traduzione (con qualche minima […]

  2. Quando i giornali parlano di scienza a sproposito, di chi è la responsabilità? | Sbagliando s'impera Says:

    […] Se lo chiede David Spiegelhalter, un professore di statistica che dirige il Winton programme for the public understanding of risk dell’Università di Cambridge e di cui abbiamo già parlato in questo blog, qui e qui. […]


Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

%d blogger hanno fatto clic su Mi Piace per questo: