Le password più diffuse

Mark Burnett è il massimo esperto di uso delle password. È l’autore di Perfect Passwords, un libro del 2005. In quell’occasione pubblicò una lista delle 500 password più diffuse (e quindi peggiori).

Il suo database ne contiene ormai 6 milioni e Burnett ha appena pubblicato la lista aggiornata delle 10.000 più diffuse. Di seguito le prime 10:

  1. password
  2. 123456
  3. 12345678
  4. 1234
  5. qwerty
  6. 12345
  7. dragon
  8. pussy
  9. baseball
  10. football

Anche da noi si è parlato di questa classifica: lo ha fatto Linkiesta con questo articolo, in cui si scherza sulla posizione e il significato di pussy.

Mark Burnett

Mark Burnett

La notizia vera, però, mi pare quella che, rispetto al precedente studio di Mark Burnett del 2005, “pussy” sia crollata dalla quinta all’ottava posizione. Che sia un effetto indiretto della caduta del berlusconismo? O è l’universale calo della libido?

Perché l’American Community Survey è importante

Negli Stati Uniti, il partito repubblicano sta combattendo una battaglia per l’abrogazione dell’American Community Survey, una rilevazione del Census Bureau che produce a cadenza annuale dati con un buon dettaglio territoriale.

L’American Community Survey è considerato universalmente (repubblicani esclusi, naturalmente) un grande successo e un modello da seguire. Se ne è discusso anche in Italia, come una prospettiva da adottare dopo il Censimento generale del 2011.

In questo video, il professor William Frey dell’Università del Michigan spiega perché abrogare l’American Community Survay sarebbe un errore.

La cassetta degli attrezzi dello scettico (Panicology 2)

Alla presentazione da parte dei media di storie che contengono informazione statistica o scientifica, a meno di essere creduloni, è facile reagire con il cinismo. Noi incoraggiamo piuttosto lo scetticismo. Per questo, vi proponiamo una cassetta degli attrezzi per l’interpretazione dei dati e delle informazioni in cui ci imbattiamo nella vita quotidiana.

  • Interesse particolare: Chi ha fatto quella specifica affermazione? Poteva avere un suo interesse? Ci ha detto tutto?
  • Espressioni ambigue: Dovrebbero far scattare subito un campanello d’allarme – soprattutto quelle fortemente connotate emotivamente, come “peste”, o quelle che sembrano indicare una strada senza ritorno verso la catastrofe, come “inevitabile”. È inevitabile che dopo il giorno venga la notte, ma non che ci sarà un attacco terroristico. Puoi essere in “irreparabile in ritardo” per una riunione iniziata un’ora fa, ma un’eruzione vulcanica, un terremoto o un’epidemia può essere “in ritardo” soltanto sulla base di un’argomentazione basata sul calcolo delle probabilità. Altre parole potrebbero avere un significato “tecnico” diverso da quello corrente. Quando le statistiche ufficiali parlano delle “forze di lavoro” contano tutti quelli che hanno lavorato almeno un’ora nella settimana di riferimento, e dunque un boom degli occupati potrebbe dipendere dall’impiego di studenti come baby-sitter o come barman una sera alla settimana. Voi lo considerate lavoro?
  • Rilevazioni e sondaggi: Chi li ha fatti? Sono attendibili? Hanno una motivazione ovvia? Chi li ha finanziati? Interi ambiti di studio possono diventare pericolosamente dipendenti dal finanziamento da parte di una sola fonte, sia essa commerciale, governativa o di un gruppo di pressione. I quesiti sono formulati in modo neutrale? Quanto è grande il campione? Troppo piccolo e i risultati saranno distorti; troppo grande e gli autori potrebbero cercare di persuadervi schiacciandovi sotto una mole di dati. La dimensione del campione e i margini d’errore sono pubblicati? Quando un produttore di cibo per gatti afferma che 4 gatti su 5 preferiscono il suo prodotto, lo ha fatto assaggiare solo a 5 gatti? Come sono stati raccolti i dati?
  • Dati: Confrontateli tra loro. Guardate a tutti i possibili effetti di un cambiamento, non soltanto a uno. Confrontate passato e presente. Confrontate tra loro i Paesi. E se non ci sono i dati per fare questi confronti così ovvi, chiedetevi il perché: qualcuno vi sta nascondendo qualche cosa?
  • Percentuali e valori assoluti: Chi ha una storia da raccontare o una tesi da sostenere sceglie sempre il modo più impressionante di presentare le cose.
  • Aneddoti e statistiche: I timori si diffondono per passaparola e per notizie televisive e di stampa che riprendono vicende individuali strazianti; le autorità spesso rispondono con statistiche roboanti. Un confronto sensato tra aneddoti e statistiche è molto difficile. In un certo senso, possono entrambi essere “veri”.
  • Grafici: Come i testi e le cifre, possono essere soggetti a errori o a distorsioni deliberate. Non date loro credito acriticamente soltanto perché tecnici all’apparenza.
  • Scala temporale: Questa è una cosa importante, che parole come “inevitabile” confondono. Il livello del mare sta salendo, ma in un arco temporale molto più lungo di quello della pianificazione urbanistica: quindi c’è tutto il tempo per adattarsi e porvi rimedio. Molte serie di dati hanno 3 componenti: una tendenza di lungo periodo, variazioni cicliche di più breve durata e le singole osservazioni (spesso erratiche). È importante esserne avvertiti, in modo da non cadere in inganno.
  • Perché adesso?: Chiedetevi perché la notizia viene divulgata proprio ora e se sarebbe stato altrettanto degna di pubblicazione in un diverso momento. Gli articoli sul riscaldamento globale sono più frequenti d’estate; quelli sui pericoli dei viaggi alla vigilia delle vacanze; i sondaggi sul sesso per San Valentino.
  • Disfattismo: State in guardia quando vi viene detto che a proposito di qualche cosa non c’è niente da fare: se così fosse, perché dircelo? Solo per allarmarci e per diffondere il panico?
  • Paure classiste: Diffidate dei timori legati a vantaggi di cui una qualche élite gode ma che si vogliono negare agli altri. Per esempio, quando si afferma che le crisi ambientali o sanitarie sono provocate o esacerbate dai voli low cost, dai cibi esotici, dall’automezzo privato, dalla scelta dei trattamenti sanitari, dall’istruzione universale e così via.
  • Scenari: Molti modelli di studio economici e scientifici producono una intera gamma di scenari futuri: accertatevi che quello che vi viene presentato non sia il solo scenario peggiore.
  • Considerate anche gli aspetti positivi: Non date per scontato che, se alcune cose vanno per il peggio, tutte seguano la stessa tendenza. Questo è il mestiere dei media sensazionalistici. Prendete il riscaldamento globale: è vero che tra 100 anni sarà più caldo, ma che cosa potrebbe aver escogitato l’intelligenza umana nel frattempo? Nuove fonti energetiche? Un metabolismo umano geneticamente modificato? Una fotosintesi più efficiente?  Fantascienza, direte. Certo, ma guardate che cosa è stato fatto negli ultimi 100 anni.
  • Il senso delle proporzioni: È un male se 100 persone muoiono di influenza aviaria, ma in un Paese di 50 milioni di abitanti è una frazione molto piccola. Quanti sono morti per altre cause?
  • Il senso del ridicolo: Cercate di tenere i piedi per terra, anche se i personaggi pubblici non lo fanno. Il ministro dell’interno tedesco Wolfgang Schaeuble insiste che il terrorismo islamico è la più grande minaccia alla stabilità tedesca. Vi sembra anche solo remotamente credibile o sta semplicemente cercando di dare importanza al suo ruolo nel governo?
L'urlo di Munch

wikipedia.org

* * *

In questo modo si conclude Panicology, il libro di Aldersley-Williams e Briscoe che ho recensito un paio di giorni fa. È, a parer mio, la parte migliore del libro e merita di essere meditata da tutti, indipendentemente dalla recensione (lo so che molti di voi, quando vedono che il post è una recensione, dicono «Che palle!» e cliccano su un’altra pagina). Sopra c’è la mia traduzione ma, poiché mi sono preso qualche libertà, propongo qui sotto ai più volonterosi l’originale.

For those not inclined to credulousness, it is easy to be cynical about the media in its presentation of stories involving statistical or scientific information. We would rather encourage skepticism. With this in mind, we offer this toolkit for the interpretation of data or information that come our way.

  • Vested interest: Ask yourself who has made a particular statement. Why might they have done this? Are we being told the whole story?
  • Weasel words: These should ring alarm bells – especially emotive ones such as “plague,” or ones that put us on a one-way trip to disaster such as “inevitable” and “overdue.” It is inevitable that night follows day, but it is not inevitable that there will be a terrorist attack.You can be overdue for a meeting that started an hour ago, but a volcanic eruption, an earthquake, or an outbreak of disease is only ever overdue based on arguments of probability. Other words may not have the obvious meaning. Government surveys of the “work force” count anyone who has worked one hour or more in a week, so a boost in the numbers working could be down to children babysitting or students spending an evening behind a bar. Is this what you consider work?
  • Surveys: Who conducted it? Are they credible? Do they have an obvious motive? Who paid them? Whole fields of study can become unhealthily dependent on funds from one source, whether that source is commercial, governmental, or charitable. Were the questions neutrally worded? How big is the sample? Too small, and the result may be skewed; too big, and the authors may be trying to use sheer weight of numbers to persuade you. Is the sample size and margin of error shown? When a pet food manufacturer says that four out of five cats prefer their product, did they only feed five cats? How were the data collected?
  • Figures: Try to compare figures. Look at as many of the effects of a change as possible, not just one. Compare the present with the past. Compare one country with another. If the data aren’t there to make the obvious comparison, ask yourself what is being obscured.
  • Percentages and actual numbers: People with a story to tell will choose the more impressive way of putting things.
  • Anecdote and statistics: Fears are spread by word of mouth, press, and television reports based on harrowing individual stories; authorities frequently counter these with broad statistics. Meaningful comparison between the two is hard. Both may be “true”.
  • Graphs and charts: Like words and figures, these may be subject to error or deliberate distortion. Don’t automatically believe them because they look technical.
  • Timeframe: This is an important factor that words like “inevitable” gloss over. Sea levels are rising, but over a longer period than housing planning cycles, so there is time to adapt. Many data series have a long-run trend, a shorter cyclical variation, and then (often erratic) individual data points. Be aware of each so as not to be tricked.
  • Why now: Ask yourself why the story is appearing now, and whether it would be equally newsworthy at another time. Global warming stories appear more in the summer. Travel fears play well as people set off on their holidays. Sex surveys are often released in time for Valentine’s Day.
  • Defeatism: Be wary when told there is nothing we can do about something. Why then are we being told about it? Is it merely to alarm us, or to put us in a state of fear?
  • Scare snobs: Distrust scares where an elite is trying to deny others advantages they already enjoy, for example environmental and health crises exacerbated by cheap flights, exotic food, private modes of transport, choice in medicine and education.
  • Scenarios: Many economic and scientific studies model a range of future scenarios. Make sure that the outcome described is not just the worst-case scenario.
  • Accentuate the positive: Don’t discount the possibility that even if some things are getting worse, others may get better-which negative newspaper stories make it their business to do. It will get warmer in 100 years, but what might human ingenuity have devised by then? New energy sources? Genetically modified human metabolism? Improved photosynthesis? Science fiction, you might say, and so it is-for now. But think what has been achieved over the last 100 years.
  • The big picture: It’s bad if 100 people die of bird flu, but in a country of 50million, this is very few. How many died of everything else?
  • A sense of proportion: Try to keep one, even if the top brass won’t. Germany’s Interior Minister Wolfgang Schaeuble, insists that Islamic terrorism is the single largest threat to Germany’s stability. Does this seem remotely credible, or is somebody just bigging himself up?

Rugarli, Bachtin e i metadati (7)

Il libro di Rugarli che ho appena recensito (Le galassie lontane) riporta una curiosa conversazione a tavola a proposito delle teorie di Michail Michajlovič Bachtin, che sono decisamente rilevanti per la frammentaria discussione che andiamo conducendo sul tema dei metadati (per le altre puntate seguite i link: prima, seconda, terza, quarta, quinta e sesta).

Bachtin

wikipedia.org

«La scoperta di Bachtin» Stanish tenne cattedra, «sta nell’aver messo il dito sulla inadeguatezza, sulla incompletezza delle parole. Le parole, contrariamente all’opinione più diffusa, non dicono niente di ciò che vorrebbero dire. O quasi niente. Sono fucilate che non colpiscono mai il bersaglio. Se affermo o scrivo “albero”, in realtà ho evocato una entità del tutto generica, perché di alberi, faggi, castagni, ciliegi, peri e così via, ve n’è un numero quasi infinito, e ciascuno perde o non perde le foglie, dà o non dà frutti commestibili, ha dimensioni, forme, colori assolutamente diversi. L’indeterminatezza non si esaurirebbe, se sostituissi al termine “albero” un termine più specifico, che so?, un termine come “acero”, perché gli aceri non sono eguali tra di loro. Il ragionamento dove porta? Non è che le parole siano da buttare via, niente affatto. Però è necessario sapere che esse alludono… che sono paragonabili a brevi accensioni di luce nella nebbia… e che guidano verso uno spazio congetturale, dove quello che manca, quasi tutto, deve essere aggiunto da chi ascolta o da chi legge. Spero di essere stato chiaro.» [p. 133]

La statistica dei maschi incinti

Anche in Italia, come del resto in tutta l’Unione europea, negli istituti nazionali di statistica si discute da anni sulla necessità di utilizzare a fini statistici i “dati amministrativi”, cioè l’informazione prodotta a fini di gestione nelle organizzazioni complesse. Nato come un tema da addetti ai lavori (le rilevazioni dirette, tramite intervista o questionario, sono costose per chi le conduce e anche per chi è chiamato a rispondere), è ormai parte del grandissimo tema dei big data e dell’apertura al pubblico dei dati detenuti dalle pubbliche amministrazioni.

Tutto bene, allora? Purtroppo no, perché i dati amministrativi sono “sporchi”: spesso prodotti e maneggiati da personale non specializzato, sono in genere sufficientemente buoni per gli scopi gestionali per cui sono inizialmente creati, ma non per generare statistiche affidabili.

Il tema è molto delicato, e per questo è tra quelli al centro dell’attenzione di Straight Statistics, un sito dedicato a migliorare la comprensione e l’uso delle statistiche e a ristabilire la fiducia dei cittadini nelle istituzioni che le producono.

Welcome to Straight Statistics

We are a campaign established by journalists and statisticians to
improve the understanding and use of statistics by government,
politicians, companies, advertisers and the mass media. By exposing
bad practice and rewarding good, we aim to restore public confidence
in statistics.

Numbers shape the world. Twisting them for political, business or
personal advantage is widespread – and often undetected.

L’ultimo “scandalo” riguarda i codici (di 3 o 4 lettere) che servono a classificare le condizioni dei pazienti ospedalieri e che sono utilizzati – oltre che per le statistiche – per contabilizzare le entrate e le uscite degli ospedali, per valutarne la performance e per analisi epidemiologiche. Sono di importanza vitale, ha dichiarato di recente il Royal College of Physicians (l’equivalente britannico dell’Ordine dei medici).

Ma una lettera pubblicata sul BMJ del 5 aprile 2012 (Hospital episode statistics – The importance of knowing context of hospital episode statistics when reconfiguring the NHS; una risposta,The riddle of the male obstetric patients: solved, è stata pubblicata il 24 aprile) getta un’ombra sull’accuratezza dei codici: nel 2009-2010, quasi 20.000 adulti risultano aver goduto di cure pediatriche ambulatoriali, mentre 3.000 pazienti sotto i 19 anni sarebbero stati ricoverati in cliniche geriatriche.

Ancora più sorprendente: ogni anno, dal 2003, tra i 15 e i 20.000 uomini sarebbero stati ricoverati in ostetricia, e altri 10.000 in ginecologia. Quasi 20.000 “eventi ostetrici” (nel gergo del servizio sanitario nazionale: si tratta per lo più di parti o aborti) hanno avuto un maschio come protagonista.

Evidentemente la pubblicità dell’uomo incinto – creata nel 1970 dall’agenzia di pubblicità Saatchi per lo Health Education Council e tuttora popolarissimo in Gran Bretagna (qui sotto) – era profetica, oltre che memorabile.

The Pregnant Man

flickr.com / Copyright Tutti i diritti riservati a dandaduk

Da molto tempo volevo intervenire sul sedicente “Centro studi della CGIA di Mestre”, auto-attribuitosi il prestigioso ruolo di autorevole think-tank, con la complicità dei nostri pigri giornalisti, cui non par vero di trovarsi spiattellata una gustosa storia ready-made il sabato pomeriggio (4 salti in padella!), per riempire le pagine angosciosamente semivuote dell’edizione domenicale.

Avatar di mazzettaMazzetta

Molti commentatori hanno rilevato come l’attuale attenzione dei media per i suicidi causati dalla crisi economica, non rifletta una realtà confermata dai dati. Non solo è assurdo legare un evento complesso come il suicidio a un unico motivo scatenante, ma i media e i politici sono andati più in là, falsando la realtà in maniera sconsiderata e dolosa, anche perché un dato invece certo è che il parlarne attivi fenomeni d’emulazione.

Merita il primo premio Mario Monti, per il suo discorso nel quale ha affermato di voler evitare all’Italia il gran numero di suicidi registrato in Grecia. Perché in Grecia non c’è alcun aumento statistico anomalo che segnali un’impennata dei suicidi per motivi economici e per di più perché i greci che si suicidano, sono percentualmente la metà degli italiani. Sarebbe quindi il caso di “fare la fine dei greci” in questo senso.

Tale improvvida uscita è stata probabilmente…

View original post 621 altre parole

Statistici per caso

Gli statistici sono considerati, non del tutto immeritatamente, persone noiose. Secondo un prezioso libretto pubblicato alcuni anni fa da Statistics Denmark [Hermann, Anne ed. StatisTics. Copenhagen: Statistics Denmark. 2005):

A statistician is … someone who doesn’t have the personality to be an accountant. [Unknown]

Nondimeno, anche gli statistici hanno le loro mitologie, i loro padri fondatori, i loro grandi uomini.

Uno di questi è lo statistico inglese George E. P. Box (le iniziali stanno per Edward Pelham), nato il 18 ottobre 1919 e (a quanto mi risulta) tuttora vivente. Se parlassi dei suoi contributi alla scienza statistica vi annoierei certamente. Ma Box è famoso anche al di fuori della cerchia degli addetti ai lavori, per avere scritto un frase profondissima nella sua apparente scanzonatezza:

Essentially, all models are wrong, but some are useful [Box, George E. P.; Norman R. Draper (1987). Empirical Model-Building and Response Surfaces, Wiley, p. 424]

George E. P. Box

wikipedia.org

Non che Box avesse mostrato fin dai tempi della scuola una spiccata vocazione per la statistica. Allo scoppio della 2ª guerra mondiale era studente di chimica, ma si arruolò volontario ed entrò nel genio. Come divenne statistico è lui stesso a raccontarlo, in un articolo scritto 70 anni dopo e intitolato, appunto, An Accidental Statistician:

[…] I was moved to a highly secret experimental station in the south of England. At the time they were bombing London every night and our job was to help to find out what to do if, one night, they used poisonous gas.
Some of England’s best scientists were there. There were a lot of experiments with small animals, I was a lab assistant making biochemical determinations, my boss was a professor of physiology dressed up as a colonel, and I was dressed up as a staff sergeant.
The results I was getting were very variable and I told my colonel that what we really needed was a statistician.
He said “we can’t get one, what do you know about it?” I said “Nothing, I once tried to read a book about it by someone called R. A. Fisher but I didn’t understand it”. He said “You’ve read the book so you better do it”, so I said, “Yes sir”.

Ma il caso non aveva ancora finito di giocare con Box, e di fargli incontrare i più grandi statistici dell’epoca: ancora dopo la guerra i suoi superiori la mandano a Cambridge a sottoporre un problema statistico a Ronald A Fisher.

Ronald Fisher

wikipedia.org

Dopo la guerra si lauera all’University College di Londra con Egon S.  Pearson.

Egon Pearson

swlearning.com

Nel 1956 John Tukey lo invita a Princeton per formare e dirigere lo Statistical Techniques Research Group (STRG).

John Tukey

wikipedia.org

Per complicare l’albero genealogico della statistica del 20º secolo, Box sposò la seconda delle 5 figlie di Ronald A Fisher (autrice anche di una biografia del padre, R.A. Fisher: The Life of a Scientist).

Joan Fisher Box

amazon.com

Egon Sharpe Pearson

Che cosa significa un aumento del 13% del rischio di morte?

Ho trovato questo bell’articolo di David Spiegelhalter, pubblicato il 21 marzo 2012 sul blog Understanding Uncertainty di cui ho già parlato in un’altra occasione. L’ho trovato così bello che mi cimento per voi nella sua traduzione (con qualche minima libertà).

David Spiegelhalter

understandinguncertainty.org

Secondo un articolo pubblicato di recente (Pan et al. “Red Meat Consumption and Mortality. Results From 2 Prospective Cohort Studies“. Archives of Internal Medicine. Published online March 12, 2012. doi:10.1001/archinternmed.2011.2287) un maggiore consumo di carni rosse è associato con maggiori rischi di mortalità totale, per malattie cardiovascolari e per cancro. La notizia è stata meravigliosamente ripresa dai giornali: ad esempio, il Daily Express ha scritto che ‘se la gente riducesse l’ammontare di carne rossa che consuma – bistecche e hamburger, per capirsi – a meno di mezza porzione al giorno, il 10% di tutti i decessi potrebbe essere evitato‘.

Red Meat

dailyexpress.co.uk

Caspita, sarebbe bellissimo trovare qualche cosa che riduce del 10% tutti i decessi. Purtroppo, non è questo che dice l’articolo scientifico. Le conclusioni principali sono che una porzione aggiuntiva di carne rossa al giorno, dove una porzione sono 85 g – un pezzo di carne delle dimensioni di un mazzo di carte, meno di un hamburger standard (il quarter pounder pesa 113,4 g) – è associata con un hazard ratio («rapporto di rischio») di 1,13, cioè con un rischio di morte aumentato del 13%. Ma che cosa vuol dire questo? Sicuramente il nostro rischio di morte è già del 100% e un rischio del 113% non sembra avere molto senso, no? Per capire veramente che cosa significa un hazard ratio di 1,13 dobbiamo fare qualche calcolo.

Prendiamo 2 amici, Carlo e Nando: tutti e 2 hanno 40 anni, lo stesso peso, lo stesso consumo di alcol, lo stesso tempo dedicato allo stare in forma fisica, la stessa storia medica familiare … ma non necessariamente lo stesso reddito, lo stesso grado di istruzione e lo stesso standard di vita. Carlo il carnivoro pranza nei giorni feriali, dal lunedì al venerdì, con un hamburger (diciamo un quarter pounder). Nando il normale non mangia mai carne a pranzo nei giorni feriali, ma per il resto dei pasti segue una dieta simile a quella di Carlo. Non ci stiamo occupando minimamente di Vincenzo il vegetariano, che la carne non la mangia mai.

Ognuno dei 2 fronteggia ogni anno un rischio di morire: il termine tecnico è hazard. Perciò un hazard ratio di 1,13 significa che, per 2 persone come Carlo e Nando, che sono simili salvo che per il maggior consumo di carne rossa, quello che ha il fattore di rischio (Carlo) ha ogni anno un rischio di morire più elevato del 13%, per tutto il periodo di osservazione (circa 20 anni).

Ma questo non significa che vivrà il 13% meno di Nando, anche se questo è il modo in cui molti hanno interpretato la cifra. E allora come influenza la durata della loro vita? Per saperlo dobbiamo ricorrere alle Interim Life Tables pubblicate dall’Office of National Statistics (in Italia le pubblica l’Istat e noi le chiamiamo Tavole di mortalità): potete trovarle qui, ma per avere dati comparabili con quelli inglesi dovete selezionare nel menu a sinistra l’ultimo anno pubblicato, il 2008).

Tavole di mortalità

understandinguncertainty.org

La figura mostra una parte delle tavole riferite ai maschi e al periodo 2008-2010 per Inghilterra e Galles. La colonna lx [perdonatemi, ma non so come si inseriscono i deponenti nell’editor di wordpress] mostra, su 100.000 nati maschi, quanti ci aspettiamo sopravvivano fino all’x-esimo compleanno (lo potete leggere nelle diverse righe). La colonna qx ci dice la quota di maschi che raggiungono l’età x che ci aspettiamo muoiano prima di aver raggiunto il loro (x+1)-esimo compleanno – questo è l’hazard (l’Istat lo chiama ‘probabilità di morte’). Ne consegue che dx è il numero di maschi che ci aspettiamo muoiano durante il loro x-esimo anno, dove dx = qx · lx: per esempio, su 100.000 nati-vivi maschi, ci aspettiamo che 503 muoiano durante il loro primo anno, ma soltanto 33 tra il primo e il secondo compleanno. La colonna intestata ex mostra la speranza di vita di qualcuno che abbia raggiunto il suo x-esimo compleanno – Spiegelhalter fa vedere come si calcola, ma io ve lo risparmio perché so che soltanto a farvi vedere il simbolo Σ mi abbandonereste e io invece voglio che seguiate il ragionamento principale fino alla fine. L’importante è sapere che dx ed ex sono legati da una precisa relazione matematica.

Se consultiamo le tavole originali dell’ONS, vediamo che un maschio di 40 anni può aspettarsi di viverne altri 40 (i numeri sono grosso modo gli stessi se consultiamo le tavole italiane dell’Istat). Attenzione, questo non vuol dire quanto a lungo ciascuno vivrà – può essere di più, può essere di meno, 40 anni è una media. [Per di più, è basata sull’hazard qx corrente – ma in effetti ci si può aspettare che le cose migliorino via via che invecchia (ad esempio, per i progressi della medicina). Tavole che prendono in considerazione possibili variazioni degli hazard si possono calcolare e si chiamano di coorte (invece che di periodo). L’ONS le pubblica qui. Secondo queste tavole, un uomo di 40 anni può aspettarsi di viverne altri 46.]

Bene. Usiamo per semplicità i valori di periodo. Poiché abbiamo detto che Nando il normale mangia una quantità media di carne rossa, gli assegneremo i valori dell’uomo medio. Possiamo vedere l’effetto di un hazard ratio di 1,13 moltiplicando per questo valore tutta la colonna qx e ricalcolando prima dx e poi il valore dell’aspettativa di vita a 40 anni: il nuovo valore, che possiamo associare a Carlo il carnivoro, è di 39 invece di 40. Quindi, secondo i risultati dell’articolo, il consumo extra di carne rossa è associato a – anche se non necessariamente causa di – la perdita di un anno di aspettativa di vita.

Un anno su 40, cioè circa una settimana all’anno, o ½ ora al giorno. Vale a dire, che un’abitudine inveterata a mangiare per tutta la vita un hamburger a pranzo è associata alla perdita di ½ ora al giorno, molto di più del tempo che ci si mette a mangiare un hamburger. E – come abbiamo detto nel post Microlives – ½ ora di aspettativa di vita è anche associato a 2 sigarette, a 2 pinte di birra ed essere sovrappeso di 5 kg.

Microvite

understandinguncertainty.org

Naturalmente, questo non significa che Carlo perderà esattamente quel tempo di vita. Anzi, non possiamo nemmeno contare sul fatto che Carlo muoia prima di Nando. Anzi è stato provato (Spiegelhalter ne parla qui) che se ipotizziamo che se un hazard ratio pari ad h è mantenuto costante per tutta le loro vite, la probabilità (per l’esattezza, gli odds) che Carlo muoia prima di Nando è esattamente pari ad h. E poiché gli odds sono definiti come p/(1-p), dove p è la probabilità che Carlo muoia prima di Nando, avremo:

p = h / (1 + h) = 1,13 / 2,13 = 0,53

Cioè c’è il 53% di probabilità che Carlo muoia prima di Nando, invece del 50%. Non poi un granché.

Un’altra cosa. Non possiamo neppure dire che la carne rossa è la causa diretta della perdita di speranza di vita: cioè, che se Carlo smettesse di ingozzarsi di hamburger, la sua speranza di vita aumenterebbe. Forse c’è un altro fattore, nascosto, che causa sia l’appetito per la carne rossa di Carlo, sia la sua diminuita speranza di vita.

Ad esempio, il reddito. Negli Stati Uniti, le persone a basso reddito sono associate sia a un maggior consumo di carne rossa, sia a una speranza di vita ridotta. Ma l’articolo di cui abbiamo parlato fino adesso, come abbiamo accennato all’inizio, non ha tenuto conto delle differenze di reddito …

* * *

Per quello che mi riguarda, recupererò quella mezz’ora dormendo un po’ meno la notte …

Il sesso, la spesa e le statistiche sulla felicità

Nella speranza di non violare troppe norme sui diritti d’autore, traduco per voi all’impronta questo articolo di Tim Hardford, comparso sul suo sito e sul Financial Times.

Tim Hardford

bbc.co.uk

* * *

“Quanto sei soddisfatto della tua vita in questi giorni?”

Scusa?

Su una scala da 0 a 10. Leggo il quesito dall’ultimo rapporto sulla felicità dell’Istituto nazionale di statistica. Eccone un altro: “Quanto eri felice ieri?” Su una scala da 0 a 10.

Non saranno mica quelle sciocchezze sull’economia della felicità, vero?

Chiaro che sì. “Quanto ti sentivi ansioso ieri?”

Su una scala da 0 a 10?

Già.

Non mi sentivo ansioso ieri, ma ora che me lo chiedi lo sono diventato. Quante altre domande mi devi fare?

Sono quattro in tutto. Questa è l’ultima: “In che misura senti che le cose che fai nella vita hanno valore?”

Perfetto. E immagino che la mia risposta sia destinata a rivoluzionare la politica economica e spianare la strada a un’alternativa al Pil come misura del benessere nazionale? Ti avverto che non tratterrò il fiato.

Ti aspetti troppo dalla tua risposta. Che peraltro non mi hai neppure dato.

Non intendevo la mia risposta in particolare, ma le nostre risposte nel complesso: quante persone hanno intervistato?

Ottantamila.

Ottantamila, càspita. E quanti milioni di euro hanno speso per andare in giro per il Paese a chiedere a 80.000 persone se il giorno prima si sentivano felici? È un esercizio statistico rivoluzionario, suppongo. Guarda, faccio io una domanda a te, adesso: “In che misura senti che le cose che il governo fa per misurare la felicità abbiano valore?”

Su una scala da 0 a 10?

Ma sta zitto, va!.

Direi, 4 su 10. Sospetto che sarà
utile soltanto un po’, ma immagino anche che non costi poi molto. Certamente, l’Istituto nazionale di statistica ha speso un sacco di tempo e denaro per intervistare un campione significativo di 80.000 persone su molti temi, ma aggiungere 4 quesiti non dev’essere costato molto.

Che cosa abbiamo imparato, allora, da questo allegro ed economico esercizio?

Non molto, per il momento, ma soltanto perché l’Istituto nazionale di statistica non ha ancora pubblicato un rapporto dettagliato. Sappiamo però che gli abitanti di Londra sono i più ansiosi del Paese e che i nord-irlandesi i più soddisfatti della loro vita in tutte e tre le dimensioni misurate. Le donne sono più contente degli uomini. Le persone di mezza età sono meno felici, più ansiose e meno propense a considerare la loro esistenza degna di essere vissuta.

E ti pare sorprendente?

Be’, non sapevo che i nord-irlandesi fossero dei cuorcontenti. Però che essere maschi di mezza età influisse negativamente sull’essere soddisfatti della propria vita in effetti si sapeva già, da ricerche precedenti. Quindi questa non è una novità.

E che altro sappiamo già della felicità, oltre che il fatto che non si compra con i soldi?

Veramente, una delle poche cose che sappiamo della felicità è che si compra con i soldi. In tutte le società i ricchi sono più felici dei poveri: è più probabile che dichiarino che la loro vita va “molto bene”.

Eppure ero convinto che gli studi sulla felicità dicessero che i soldi non comprano la felicità.

Ti riferisci al Paradosso di Easterlin. L’economista Richard Easterlin, negli anni Settanta, non riuscì a trovare evidenze statistiche che le società nel complesso si arricchissero al crescere della felicità. Ma è un paradosso perché invece gli individui ricchi tendono a essere più felici degli individui poveri. La componente sociale del Paradosso di Easterlin è tuttora oggetto di controversia.

Grazie a David Cameron e all’Istituto nazionale di statistica.

Be’, per il momento grazie a sondaggi condotti da privati come Gallup. Ma immagino che l’impegno dell’Istituto nazionale di statistica non potrà che esserci utile, alla fine.

E tuttavia pensi che l’Istituto nazionale di statistica  potrebbe fare meglio e di più.

Vorrei che ponesse dei quesiti più profondi, come quelli suggeriti da Alan Krueger and Daniel Kahneman.

Sono nomi che mi suonano familiari ….

Il primo presiede il Comitato dei consiglieri economici di Barack Obama, il secondo ha vinto il Nobel per l’economia. Ma prima del recente incarico istituzionale di Krueger, lui e Kahneman avevano messo in piedi un programma di ricerca che forniva molti più dettagli sui tipi di attività che rendono le persone infelici, come il tempo sprecato per andare in macchina o partecipare a riunioni.

Capisco. Qualche risultato prezioso da questa linea di ricerca?

Il sesso è divertente, fare la spesa è scocciante. Alle persone piace andare a pranzo insieme e stare in compagni d’altri. E infatti è stato bello passare del tempo con te: non sei felice della nostra conversazione?

Open data anche per il Comune di Firenze

Questa volta la segnalazione l’ho trovata su Cacao, che ringrazio:

Firenze la prima wikicittà

Grazie a un accordo tra l’amministrazione comunale di Firenze e l’associazione Wikitalia è nato il portale http://opendata.comune.fi.it/ . All’interno ci sono tutte le informazioni, liberamente consultabili, che riguardano la vita della città. Dalle spese dell’amministrazione alle opere pubbliche in cantiere, dall’istruzione al turismo, per un totale di 180 aree tematiche. Ogni giorno viene inserito un dato nuovo. L’idea è del sindaco Matteo Renzi.
(Fonte: Corrierecomunicazioni.it)

A me piace particolarmente la sezione Geoportale.