La pausa del pranzo (metadati 9)

Tre muratori, seduti su un muretto, addentano un panino a ora di pranzo. Una signora si ferma a chiacchierare:

– Che cosa fate da queste parti?, chiede.

Il primo, tutto ingrugnato, risponde:

– Metto un mattone sopra un altro maledetto mattone, lo fisso con la malta, e così per otto ore.

– E tu?, domanda la signora al secondo.

– Costruisco un muro, le dice quello semplicemente, con un sorriso sulle labbra.

– E tu?, chiede al terzo.

Quello si alza in piedi, e riempiendosi d’orgoglio, dice: – Erigo una cattedrale!

* * *

Una risposta diversa per ogni punto di vista e per ogni livello d’analisi: così funziona il nostro cervello, e così funziona l’analisi statistica.

La storia l’ho trovata qui.

I numeri portano sempre dolore

Togliti di mezzo, Matrix. Hai fatto il tuo tempo.

La profonda realtà dei numeri, quanto essi contribuiscano a tessere le nostre esistenze, quanto – per quanto dolorosa – la sensibilità ai numeri e la conoscenza quantitativa contribuiscano a farci umani: tutto questo è raccontato, con grandissima poesia, nei 9 minuti di questo film del regista ceco Robert Hloz girato in Corea.

Guardatelo con attenzione.

Mi ringrazierete.

Quando i giornali parlano di scienza a sproposito, di chi è la responsabilità?

Se lo chiede David Spiegelhalter, un professore di statistica che dirige il Winton programme for the public understanding of risk dell’Università di Cambridge e di cui abbiamo già parlato in questo blog, qui e qui.

understandinguncertainty.org

Leggi il seguito di questo post »

L’uovo di Galileo e il gesuita strapazzato

Il brano è uno dei più famosi del Saggiatore di Galileo Galilei, ma l’idea di scherzarci sopra e di cimentarmi nella parafrasi in italiano moderno dell’italiano secentesco del nostro è per me una tentazione troppo forte (come Oscar Wilde, «I can resist everything except temptation»).

wikimedia.org/wikipedia/commons

Leggi il seguito di questo post »

L’abbecedario dei diagrammi | FlowingData e Virtual Beauty

Questo video, che ho trovato su FlowingData, ma concepito da Jane Nisselson, la fondatrice e l’anima di Virtual Beauty, è l’aperitivo a un più vasto progetto sui diagrammi. È così bello che non posso evitare di segnalarvelo e di consigliarvi vivamente di interiorizzarlo e farlo vostro. Aiuterà il vostro senso critico a distinguere i diagrammi e i grafici vistosi ma inutili e sbagliati (sono onnipresenti), da quelli utili e belli (anzi: utili e perciò belli). Sono 3′ e 19″: più di un singolo spot televisivo, ma meno di una di quelle raffiche di spot che ti sparano nel prime time:

Ed ecco come lo commenta la stessa Jane Nisselson sul sito di Virtual Beauty:

Diagrams are everywhere — from the established conventions of highway signs to the newly emerging visualizations appearing on social networking websites.  Most people have a personal experience of diagrams whether drawing directions or figuring out how to operate a new computer. Yet very few people are familiar with how we read or construct diagrams.

This short film introduces the language of diagrams and their role in visual thinking and communication. As only a film can do, it reveals the vocabulary “in the wild” and in the context of making and using diagrams.

This pilot film is intended as a teaser for a larger examination diagrams — from patent offices and computer-produced assembly instructions to data visualizations and MRIs. Diagrams are an ideal subject for a popular film on a scientific topic because they are both accessible and ubiquitous, providing a great vehicle for initiating a broad public to an essential tool of communication and creativity across all disciplines in science and engineering.

Distinction: Visionary Grant award 2009, Gordon Research Conference, as part of The Scripps Research Institute’s Visualization in Science and Education Grant from NSF. Principal Investigator: Professor Jeff Nickerson of the Stevens Institute of Technology. The award is intended to seed new interdisciplinary research.

Presentation: Gordon Research Conference on Visualization in Science & Education (July 10-15, 2011).

The film is based on “Visualizing Thought” by Barbara Tversky. Published in “Topics in Cognitive Science” Volume 3, Issue 3, pages 499–535, July 2011.

Film Credits: Soundtrack: Pat Irwin. Edit: Alex Bingham. Camera: Claudia Christensen, Oren Eckhaus, Brian Jackson, Sean Sigler, Ian Vollmer.

Resto in attesa del seguito del progetto e vi terrò informati.

Nate Silver, il vincitore morale delle elezioni americane

Non sono né Barack Obama né Mitt Romney i vincitori delle elezioni americane, ma Nate Silver, l’uomo che vedete fotografato qui sotto.

Nate Silver

salon.com

Nate Silver ha meno di 35 anni (li compie il 13 gennaio del 2013) e una laurea in economia. Dopo la laurea, ha lavorato per quasi 4 anni alla KPMG. Un lavoro che lo annoiava profondamente, tanto da indurlo a sviluppare – durante l’orario d’ufficio – un software per prevedere le prestazioni e la carriera dei giocatori di baseball, PECOTA. Baseball e statistica erano le sue passioni fin dall’infanzia. Licenziatosi dalla KPMG, Silver si è mantenuto giocando a poker online, seguendo la strada che prima di lui aveva già seguito un precursore delle teorie sulla probabilità, Gerolamo Cardano. Nel 2007 cominciò a occuparsi anche di previsioni politiche, dapprima con lo pseudonimo di Poblano. Nel marzo del 2008 iniziò il suo blog, FiveThirtyEight.com (538 sono i collegi che eleggono il presidente degli Stati Uniti) e il 30 maggio 2008 Poblano rivelò la sua vera identità ai lettori. Nell’elezione del 2008 azzeccò la previsione del candidato vincitore i 49 Stati su 50. Il 25 agosto 2010 Silver e il suo blog migrarono al New York Times.

Nonostante la maggiore incertezza della campagna presidenziale di quest’anno, la mattina del 6 novembre Silver arrivò a prevedere per Obama una probabilità di vittoria del 90,9%, suscitando non poco scetticismo. Invece, ha fatto ancora meglio di 4 anni fa, anche se gli altri osservatori davano come “in bilico ” il risultato di 9 Stati, azzeccando tutti e 50 gli Stati più il District of Columbia.

538 prediction

salon.com

Sto leggendo il suo libro, The Signal and the Noise e ve ne parlerò tra poco. Nel frattempo, godetevi questo clip in cui spiega (seriamente) il suo metodo:

Qui lo spiega all’interno di una trasmissione comica (dovete accontentarvi del link).

Si possono prevedere i risultati delle olimpiadi?

La risposta è certamente affermativa. Ma come? I modi possono essere innumerevoli, dal famoso polpo Paul alle previsioni ragionate degli economisti (che come noto sono in grado di prevedere razionalmente un risultato e il suo contrario).

Fabio Radicchi, un giovane fisico romano, ha applicato un modello statistico. Il post di Samuel Arbesman dove ho trovato la notizia (“Universal Laws at the Olympics and Predictions for 2012“, Wired Science Blogs: Social Dimension, 25 luglio 2012) colloca il lavoro di Radicchi nell’ambito delle spiegazioni matematiche delle performance umane, di cui riporta esempi riferiti agli anni Settanta e Ottanta (qui e qui). Studiare i limiti delle performance umane sotto il profilo statistico è particolarmente interessante (per uno statistico, va da sé), perché ci stiamo per definizione concentrando su una coda della distribuzione (quella degli atleti migliori; io sto in quell’altra, naturalmente), mentre la statistica dà il meglio di sé quando si parla di medie e di distribuzioni normali. Esiste però un’intera branca della statistica, la teoria dei valori estremi, che studia proprio questi aspetti.

Medaglie d'oro

wired.com

Il ragionamento di Radicchi è abbastanza semplice da spiegare (l’articolo “Universality, Limits and Predictability of Gold-Medal Performances at the Olympic Games” si può scaricare liberamente): si ipotizza che il miglioramento relativo dei record obbedisca a una legge universale e che tenda al raggiungimento di un valore limite. Radicchi usa il medagliere olimpico (in primo luogo le medaglie d’oro, ma anche quelle d’argento e di bronzo, per 3 motivi:

  1. sono disponibili osservazioni per oltre un secolo (i primi giochi dell’era moderna si disputarono nel 1896);
  2. i dati sono dettagliati e regolarmente distribuiti nel tempo (ogni 4 anni);
  3. nella stragrande maggioranza delle discipline, la performance del vincitore della medaglia d’oro approssima piuttosto fedelmente il miglior risultato conseguibile in quel momento storico, data la rilevanza e il prestigio della manifestazione.

Sulla base di queste premesse, l’articolo si propone:

  1. di mostrare che i miglioramenti della performance obbediscono a una legge universale;
  2. di stimare i valori limite del miglioramento di performance;
  3. di prevedere i risultati (in termini di performance) delle olimpiadi di Londra.

* * *

Per quanto riguarda il primo aspetto, Radicchi mostra che i miglioramenti relativi nella performance del vincitore della medaglia d’oro in due edizioni consecutive delle olimpiadi tende ad avvicinarsi a un valore limite e che i miglioramenti stessi (non le prestazioni in termini assoluti) sono distribuiti normalmente. Radicchi registra questa regolarità in 55 discipline olimpiche.

Vediamo qui l’esempio, piuttosto chiaro, dei 400 m piani maschili.

Radicchi 1

plosone.org

Nel primo quadrante della figura (a) si presenta la stima migliore del valore limite (il record insuperabile per i 400 m piani maschili è stimato in 41′ e 62 centesimi). La significatività statistica del risultato è molto elevata e il secondo e terzo quadrante (b e c) mettono a confronto la distribuzione normale teorica (in nero) con quella misurata da Radicchi sui risultati effettivi. Infine, nel quarto quadrante si vede che il risultato non dipende dalle particolari edizioni dei giochi olimpici e che la distribuzione è stazionaria.

I risultati conseguiti sono particolarmente importanti perché sono generalizzati, cioè applicabili a un numero elevato di discipline olimpiche. Radicchi li spiega così:

At each new edition of the Games, gold-medal performances get, on average, closer to the limiting performance value. The average positive improvement observed in historic performance data can be motivated by several factors: as time goes on, athletes are becoming more professionals, better trained, and during the season have more events to participate in; the pool for the selection of athletes grows with time, and, consequently there is a higher level of competition; the evolution of technical materials favors better performances. On the other hand, there is also a non null probability that winning performances become worse than those obtained in the previous edition of the Games (i.e., relative improvement values are negative). All these possibilities are described by a Gaussian distribution that accounts for various, in principle hardly quantifiable, factors that may influence athlete performances: meteorological and geographical conditions, athletic skills and physical condition of the participants, etc.

* * *

L’applicazione dello stesso modello e delle stesse procedure di stima a una pluralità di discipline olimpiche permette a Radicchi di determinare per ognuna il valore limite e, al tempo stesso, di stimarne la bontà. La validità del modello è riscontrata per l’intera gamma delle corse (dai 100 m alla maratona), per i record che riguardano la distanza e l’altezza (i diversi tipi di salto in lungo e in alto) e nel nuoto.

Nella figura qui sotto qualche esempio: Per la maratona il limite è stimato in 5771,44 secondi (1h36’11” e 44 centesimi), per il salto in alto femminile in 8,12 m, per i 100 m maschili e femminili rispettivamente in 8,28″ e 9,12″.

radicchi 2

plosone.org

* * *

Infine, ecco le previsioni dei risultati in alcune discipline per Londra 2012, come emergono da modello di Radicchi:

Radicchi 3

plosone.org