Si possono prevedere i risultati delle olimpiadi?

La risposta è certamente affermativa. Ma come? I modi possono essere innumerevoli, dal famoso polpo Paul alle previsioni ragionate degli economisti (che come noto sono in grado di prevedere razionalmente un risultato e il suo contrario).

Fabio Radicchi, un giovane fisico romano, ha applicato un modello statistico. Il post di Samuel Arbesman dove ho trovato la notizia (“Universal Laws at the Olympics and Predictions for 2012“, Wired Science Blogs: Social Dimension, 25 luglio 2012) colloca il lavoro di Radicchi nell’ambito delle spiegazioni matematiche delle performance umane, di cui riporta esempi riferiti agli anni Settanta e Ottanta (qui e qui). Studiare i limiti delle performance umane sotto il profilo statistico è particolarmente interessante (per uno statistico, va da sé), perché ci stiamo per definizione concentrando su una coda della distribuzione (quella degli atleti migliori; io sto in quell’altra, naturalmente), mentre la statistica dà il meglio di sé quando si parla di medie e di distribuzioni normali. Esiste però un’intera branca della statistica, la teoria dei valori estremi, che studia proprio questi aspetti.

Medaglie d'oro

wired.com

Il ragionamento di Radicchi è abbastanza semplice da spiegare (l’articolo “Universality, Limits and Predictability of Gold-Medal Performances at the Olympic Games” si può scaricare liberamente): si ipotizza che il miglioramento relativo dei record obbedisca a una legge universale e che tenda al raggiungimento di un valore limite. Radicchi usa il medagliere olimpico (in primo luogo le medaglie d’oro, ma anche quelle d’argento e di bronzo, per 3 motivi:

  1. sono disponibili osservazioni per oltre un secolo (i primi giochi dell’era moderna si disputarono nel 1896);
  2. i dati sono dettagliati e regolarmente distribuiti nel tempo (ogni 4 anni);
  3. nella stragrande maggioranza delle discipline, la performance del vincitore della medaglia d’oro approssima piuttosto fedelmente il miglior risultato conseguibile in quel momento storico, data la rilevanza e il prestigio della manifestazione.

Sulla base di queste premesse, l’articolo si propone:

  1. di mostrare che i miglioramenti della performance obbediscono a una legge universale;
  2. di stimare i valori limite del miglioramento di performance;
  3. di prevedere i risultati (in termini di performance) delle olimpiadi di Londra.

* * *

Per quanto riguarda il primo aspetto, Radicchi mostra che i miglioramenti relativi nella performance del vincitore della medaglia d’oro in due edizioni consecutive delle olimpiadi tende ad avvicinarsi a un valore limite e che i miglioramenti stessi (non le prestazioni in termini assoluti) sono distribuiti normalmente. Radicchi registra questa regolarità in 55 discipline olimpiche.

Vediamo qui l’esempio, piuttosto chiaro, dei 400 m piani maschili.

Radicchi 1

plosone.org

Nel primo quadrante della figura (a) si presenta la stima migliore del valore limite (il record insuperabile per i 400 m piani maschili è stimato in 41′ e 62 centesimi). La significatività statistica del risultato è molto elevata e il secondo e terzo quadrante (b e c) mettono a confronto la distribuzione normale teorica (in nero) con quella misurata da Radicchi sui risultati effettivi. Infine, nel quarto quadrante si vede che il risultato non dipende dalle particolari edizioni dei giochi olimpici e che la distribuzione è stazionaria.

I risultati conseguiti sono particolarmente importanti perché sono generalizzati, cioè applicabili a un numero elevato di discipline olimpiche. Radicchi li spiega così:

At each new edition of the Games, gold-medal performances get, on average, closer to the limiting performance value. The average positive improvement observed in historic performance data can be motivated by several factors: as time goes on, athletes are becoming more professionals, better trained, and during the season have more events to participate in; the pool for the selection of athletes grows with time, and, consequently there is a higher level of competition; the evolution of technical materials favors better performances. On the other hand, there is also a non null probability that winning performances become worse than those obtained in the previous edition of the Games (i.e., relative improvement values are negative). All these possibilities are described by a Gaussian distribution that accounts for various, in principle hardly quantifiable, factors that may influence athlete performances: meteorological and geographical conditions, athletic skills and physical condition of the participants, etc.

* * *

L’applicazione dello stesso modello e delle stesse procedure di stima a una pluralità di discipline olimpiche permette a Radicchi di determinare per ognuna il valore limite e, al tempo stesso, di stimarne la bontà. La validità del modello è riscontrata per l’intera gamma delle corse (dai 100 m alla maratona), per i record che riguardano la distanza e l’altezza (i diversi tipi di salto in lungo e in alto) e nel nuoto.

Nella figura qui sotto qualche esempio: Per la maratona il limite è stimato in 5771,44 secondi (1h36’11” e 44 centesimi), per il salto in alto femminile in 8,12 m, per i 100 m maschili e femminili rispettivamente in 8,28″ e 9,12″.

radicchi 2

plosone.org

* * *

Infine, ecco le previsioni dei risultati in alcune discipline per Londra 2012, come emergono da modello di Radicchi:

Radicchi 3

plosone.org

Obituary: Sally Ride (26 maggio 1951-23 luglio 2012)

Di Sally Ride avevamo parlato – per la verità in modo molto leggero – in un post di qualche tempo fa, che ieri ho riproposto, dopo essere venuto a conoscenza della sua scomparsa.

Sally Ride

sallyridescience.com

Oggi torno sull’argomento con più serietà, perché il necrologio ufficiale – pubblicato sul suo sito Sally Ride Science – mette in luce 2 aspetti della sua vita, uno poco noto e uno del tutto privato fino a ieri, che mi sembra valga la pena sottolineare:

  1. Dopo aver lasciato la NASA nel 1987, Sally è tornata a insegnare, prima a Stanford e poi all’UCSD (University of California San Diego, noto a noi Apple-isti della prima ora per UCSD Pascal) e nel 2001 ha fondato la propria società, Sally Ride Science, per perseguire la vera passione della sua vita: «inspiring young people, especially girls, to stick with their interest in science, to become scientifically literate, and to consider pursuing careers in science and engineering.»
    «The company creates innovative classroom materials, classroom programs, and professional development training for teachers.»
    «Long an advocate for improved science education, Sally co-wrote seven science books for children—To Space and Back (with Sue Oakie); and Voyager; The Third Planet; The Mystery of Mars; Exploring Our Solar System; Mission Planet Earth; and Mission Save the Planet (all with Tam O’Shaughnessy). Sally also initiated and directed NASA-funded education projects designed to fuel middle school students’ fascination with science, including EarthKAM and GRAIL MoonKAM.»
    Secondo il New York Times (“American Woman Who Shattered Space Ceiling“): «In 2003, Dr. Ride told The Times that stereotypes still persisted about girls and science and math — for example the idea that girls had less ability or interest in those subjects, or would be unpopular if they excelled in them. She thought peer pressure, especially in middle school, began driving girls away from the sciences, so she continued to set up science programs all over the country meant to appeal to girls — science festivals, science camps, science clubs — to help them find mentors, role models and one another. “It’s no secret that I’ve been reluctant to use my name for things,” she said. “I haven’t written my memoirs or let the television movie be made about my life. But this is something I’m very willing to put my name behind.”»
  2. Con grande discrezione e sottile understatement, il necrologio ci informa che Sally lascia «Tam O’Shaughnessy, her partner of 27 years». Nessuno, fuori dalla cerchia dei parenti e degli amici più intimi, lo sapeva, perché la discrezione e la riservatezza di Sally erano proverbiali.
    Tam, che lavora alla Sally Ride Science come Chief Operating Officer and Executive Vice President for Content, aveva incontrato Sally su un campo da tennis quando erano entrambe ragazze:
    «Sally Ride and Tam O’Shaughnessy became friends at the age of 12 when they both played tennis. While their lives took different paths, they stayed in contact over the years. Ride went to Stanford University, earned a BS, an MS, and a PhD in physics, and became the first American woman to fly in space; O’Shaughnessy became a professional tennis player and later earned a BS and an MS in biology from Georgia State University and a PhD in school psychology from the University of California–Riverside.»
    Sally non aveva mai parlato della sua sessualità. Nell’articolo del New York Times già citato si dice: «Dr. Ride was known for guarding her privacy. She rejected most offers for product endorsements, memoirs and movies, and her reticence lasted to the end. […] In 1983, writing in The Washington Post, Susan Okie, a journalist and longtime friend, described Dr. Ride as elusive and enigmatic, protective of her emotions. “During college and graduate school,” Dr. Okie wrote, “I had to interrogate her to find out what was happening in her personal life.”»
    La sorella di Sally, Bear Ride, ha dichiarato a BuzzFeeD (“First Female U.S. Astronaut, Sally Ride, Comes Out In Obituary“): «We consider Tam a member of the family. […] I hope it makes it easier for kids growing up gay that they know that another one of their heroes was like them. […] Sally didn’t use labels. Sally had a very fundamental sense of privacy, it was just her nature, because we’re Norwegians, through and through.»
    Nel medesimo articolo, Chad Griffin, presidente della Human Rights Campaign, afferma: «For many Americans, coming out will be the hardest thing they ever do. While it’s a shame that Americans were not able to experience this aspect of Sally while alive, we should all be proud of the fact that like many LGBT Americans, she proudly served her country, had a committed and loving relationship, and lived a good life. […] The fact that Sally Ride was a lesbian will further help round out Americans’s understanding of the contributions of LGBT Americans to our country. Our love and condolences go out to her partner.»
    Per effetto del DOMA (Defense of Marriage Act) Tam non può essere riconosciuta erede di Sally.
Sally Ride e Tam O'Shaughnessy

Flickr/The American Library Association

 

Il baseball, il copyright e Wikipedia

La storia la racconta Robinson Meyer, scrittore e musicista che vive nei pressi di Chicago, sull’edizione online di The Atlantic del 18 luglio 2012: MIT Economist: Here’s How Copyright Laws Impoverish Wikipedia. In Italia l’ha ripresa Luca De Biase sul suo blog: Abhishek Nagaraj e il copyright:

Secondo l’economista del Mit Abhishek Nagaraj il copyright peggiora l’informazione disponibile per le conoscenze condivise universalmente. (Atlantic).

Non stupisce: probabilmente il copyright è connesso proprio a un concetto contrario a quello dell’accesso universale: è un sistema che insiste sull’idea che l’accesso a informazioni speciali e di speciale valore meriti una barriera alla circolazione e un pagamento che ne sostenga la produzione, ma creando una condizione per cui chi se lo può permettere mantiene a distanza in termini di conoscenze da chi non se lo può permettere o non riesce a capirne il valore.

La valutazione politica di questa situazione non può che essere diversa per le diverse sensibilità. Ma indubbiamente Nagaraj ha trovato un modo per descriverla in modo molto concreto.

Ecco, Luca De Biase mi perdonerà (o forse no, perché è la seconda volta in poche settimane che dissento da lui), ma mi sembra che non abbia colto fino in fondo il senso dell’articolo di Robinson Meyer e della ricerca di Abhishek Nagaraj (se sono io che sbaglio, chiedo scusa in anticipo con il capo coperto di cenere).

Robinson Meyer riconosce ab initio, nelle prime frasi del suo articolo, che la faccenda del copyright è ingarbugliata e richiederebbe una conoscenza enciclopedica (forse più quella del demone di Laplace che di Aristotele). Ma proprio per questo – sostiene – in primo luogo non funziona; in secondo è troppo complessa per essere riconducibile alle diverse sensibilità politiche (come le chiama De Biase):

Everyone knows that the flow of information is complex and tangled in society today — so thank goodness for copyright law! Truly, no part of our national policy is as coherent, in the interest of the public or as updated for the Internet age as that gleaming tome in the US Code.
Not.
Unless you’re reppin’ the MPAA, you probably know that the modern copyright regime doesn’t work. You don’t have to believe in radical copyleftism — or even progressivism — to understand this. But it’s hard to know how the current body of law governing copyright and intellectual property affects individual works, simply because of the way communication, and ideas in general, work. One thing connects to another, and pulling apart the causes from the effects requires an Aristotle-like familiarity with contemporary culture.

Proprio per la complessità della questione (anche se il giudizio negativo sul fatto che l’attuale normativa statunitense sul copyright non funziona è nettissimo) Robinson Meyer sta ben attento a sottolineare che il valore della ricerca di Abhishek Nagaraj sta proprio nel fatto di essere circoscritta a Wikipedia e al rapporto tra qualità delle conoscenza e esistenza o meno delle limitazioni imposte dal copyright.

But one MIT economist, Abhishek Nagaraj, who recently presented his work at Wikimania, has found a way to test how the copyright law affects one online community — Wikipedia — and how digitized, public domain works dramatically affect the quality of knowledge.

Abhishek Nagaraj

mit.edu

La storia della ricerca di Abhishek Nagaraj (giovanissimo studente di PhD del second’anno) è affascinante e trae spunto dalla digitalizzazione e pubblicazione, nel 2008, da parte di Google di molte riviste americane, tra cui l’autorevole Baseball Digest, dedicato (lo dice il nome stesso) ai giocatori di baseball e riccamente illustrato.

Basball Digest

theatlantic.com

Google ha digitalizzato tutti i numeri del Baseball Digest da luglio del 1945 al 2008. Ma attenzione, per effetto di una clausola della legge statunitense sul copyright tutti gli articoli antecedenti il 1964 sono entrati nel pubblico dominio, mentre quelli successivi a quella data sono ancora protetti dalla tutela del copyright. La ricerca di Abhishek Nagaraj si è concentrata sul quarantennio fino al 1984 e si è sviluppata in questi passi fondamentali:

  1. Su Wikipedia opera un gruppo di tifosi di baseball che cura la redazione e l’aggiornamento dei campioni di baseball. Questi non hanno impiegato molto a scoprire la nuova fonte, rappresentata dai numeri digitalizzati di Baseball Digest. Il risultato, misurato da Abhishek Nagaraj, è che gli articoli sui campioni All-Stars riferiti al periodo 1945-1984 sono aumentati in media di 5.200 parole per articolo. Questo mette in evidenza con sufficiente chiarezza che i redattori di Wikipedia hanno ampiamente utilizzato il nuovo materiale.
  2. A questo punto Abhishek Nagaraj ha suddiviso il materiale di Baseball Digest in 2 parti: i numeri fino al 1964, ormai “fuori diritti” (gruppo di controllo, nel linguaggio degli esperimenti clinici), e quelli del ventennio successivo, tuttora tutelati (gruppo di trattamento).
  3. Confrontando i due insiemi, Abhishek Nagaraj è stato in grado di misurare gli effetti del sussistere o meno del copyright sugli articoli sui campioni di baseball pubblicati su Wikipedia, in termini di lunghezza del testo, numero di immagini e traffico generato.
  4. La lunghezza degli articoli (in generale aumentato, come si è detto) non appare influenzata dall’esistenza o meno della tutela del copyright: questo perché è piuttosto agevole aggirarla semplicemente parafrasando il testo.
  5. Non così per le immagini. Prima della digitalizzazione di Baseball Digest, gli articoli riferiti al primo ventennio presentavano in media 0,183 immagini per articolo e quelli del secondo ventennio 0,158. Dopo la digitalizzazione, la frequenza delle immagini è aumentata sensibilmente, ma con una fondamentale differenza nei due gruppi: nel primo, quello dove le immagini erano di dominio pubblico, sono salite a 1,15 immagini per articolo in media; nel secondo, dove le immagini erano sotto copyright, si rilevano 0,667 immagini per articolo. Pertanto, la presenza del copyright scoraggia l’uso dell’immagine in poco meno della metà dei casi.
  6. Tutto questo ha anche avuto un effetto sensibile sul traffico generato e sulla popolarità delle pagine. Gli articoli pre-1964 che erano già “popolari” (nel 10% più consultato) hanno visto un incremento di popolarità del 70%; ma anche quelli del 10% meno popolare hanno comunque visto crescere la loro popolarità del 15%. Inoltre, gli articoli pre-1964 sono stati “corretti” più di frequente. Entrambi questi effetti sono comprensibili, dal momento che è noto che gli algoritmi di Google premiano le voci in cui sono presenti immagini e che sono state aggiornate più di recente.
  7. Abhishek Nagaraj – che è uno statistico serio – ha sottoposto i suoi risultati a una serie di controlli (dal talento dei giocatori, al loro essere mancini, alla durata della loro carriera) per escludere che questi fattori possano avere influito sui risultati del suo esperimento.

Queste le sue conclusioni:

Copyright law affects to some degree what information makes its way onto Wikipedia, but what it more strongly affects is how we use that information once it’s there. In other words, digitizing any knowledge increases an article’s text, but only digitizing public domain images makes articles more frequently updated and visited.

Abhishek Nagaraj mette a disposizione sul web le slide della sua presentazione e vi consiglio vivamente di andarle a guardare, per seguire meglio il suo esperimento.

5+1 usi alternativi della pellicola d’alluminio

La pellicola d’alluminio, oltre all’uso ovvio di avvolgerci i cibi per conservarli o per cuocerli al cartoccio, può essere usata in mille altri modi. Qui di seguito 5 che ho trovato sull’Huffington Post:

  1. Conservare i pennelli sempre pronti a dipingere senza lavarli
  2. Tenere gli animali domestici lontano dai mobili
  3. Affilare le forbici
  4. Tenere pulito il ferro da stiro
  5. Lucidare le cromature.
Pellicola d'alluminio

huffpost.com / Flickr photo by public domain photos

Ecco l’articolo originale: 5 Other Uses For Aluminum Foil.

  1. Paint Brush Saver. One of the worst parts of painting is cleaning the brushes, especially if you know you’ll need them the next day. Instead of washing the brushes, wrap them up tightly in aluminum foil and stick them in your refrigerator. They may be a little cool to the touch, but they’ll be ready to go.
  2. Keep Pets Off Furniture. As much as we love our animals, there are certain pieces of furniture they shouldn’t go near. When you can’t be at home to shoo them away, try this trick: Place a sheet of aluminum on top of the couch, table or seat. The sound of the crinkling foil will remind them that this isn’t the best place to hang out.
  3. Sharpen Scissors. Sure, we should routinely sharpen our shears professionally, but that means a. Finding a pro who can do that and b. Making time for that appointment. Instead, take the DIY route: Just use the blunt scissors to cut through a few sheets of aluminum foil.
  4. Keeping Your Iron Clean. You can use a piece of aluminum foil to remove the starchy build-up on your iron. To do it? Just run the iron over a sheet of foil. The heat will transfer the starch to the foil sheet, leaving you with a nice clean iron.
  5. Shine Up Chrome. To restore chrome items back to their original shine, bring out the foil. Just wad it up into a ball, dip it in water and buff the chrome to remove rust, dirt and dullness. Similarly, you can use aluminum foil to restore silver items…check out the video to see how.

Ma il mio uso alternativo preferito per l’alluminio è per eliminare l’annerimento dell’argento senza sprecare un microgrammo d’argento (che sarebbe pur sempre un metallo prezioso, anche se non ci facciamo più sopra le malattie che ci fecero gli spagnoli fino a rovinarsi). L’annerimento dell’argento è l’effetto di una reazione chimica, in cui lo zolfo (elemento molto attivo e onnipresente nell’ambiente, e in particolare l’acido solfidrico, gas dal caratteristico odore d’uova marce, si combina con l’argento formando un sale nero, molto stabile e insolubile in acqua). Certo, lo si può rimuovere meccanicamente, ma in tal modo si perde il contenuto d’argento del sale stesso.

Meglio sfruttare la chimica, e in particolare il fatto che l’alluminio, metallo più attivo dell’argento, sottrae lo zolfo dal solfuro d’argento, lasciando solfuro d’alluminio e argento metallico puro. Ma poiché – come già sapeva Lavoisier – a e nulla si distrugge, in questo modo si consuma alluminio.

3 Ag2S + 2 Al = 6 Ag + Al2S3

Per attivare la reazione è necessaria un po’ di energia e un catalizzatore: il modo tradizionale di farlo (quanto meno quello che ho sempre utilizzato io) è di prendere una vecchia pentola d’alluminio: questo perché, come abbiamo detto, nella reazione si forma solfuro d’alluminio, un sale incolore e instabile, che esposto all’umidità dell’atmosfera si idrolizza trasformandosi in ossidi o idrossidi d’alluminio e acido solfidrico – quello della puzza d’uova marce. Il che, in pratica, porta a quei bucherelli che costellano le vecchie pentole d’alluminio… Quanto all’energia e al catalizzatore, basta mettere la pentola d’alluminio sul fuoco, dopo averla riempita d’acqua, deporre sul fondo gli oggetti d’argento da pulire e un cucchiaino di sale da cucina e uno di bicarbonato di sodio come catalizzatori.

Per salvare la pentola d’alluminio, e per oggetti piccoli, può bastare un pezzo di pellicola d’alluminio e un recipiente di vetro o plastica, come s’illustra nel filmato qui sotto:

4 errori da non fare nello scrivere un curriculum

In realtà, si tratta di errori molto comuni in tutte le forme di comunicazione scritta, e non soltanto per il curriculum.

Le prime due sono valide anche per l’italiano, le altre valgono soltanto per l’inglese.

  1. Non usate le forme passive.
    Ve lo ricordate, spero, dai tempi di scuola. I verbi transitivi hanno una forma attiva e una passiva. Nella forma attiva l’attenzione è sulla persona che fa un’azione. Nella forma passiva, invece, l’attenzione è sull’oggetto o sulla persona che subisce l’azione. In un curriculum (o anche in una comunicazione scritta che propugna un progetto o un’attività), voi volete attirare l’attenzione del capo su quello che sapete e volete fare. Quindi l’attenzione dev’essere sul soggetto attivo.

    No: «Il progetto Questoequello è stato realizzato dal mio gruppo.»
    Sì: «Il mio gruppo ha realizzato il progetto Questoequello.»

  2. Attenzione alla struttura della frase negli elenchi.
    È facile, quando si scrive in forma di elenco o di lista, perderne di vista la struttura. Il risultato è un’impressione di generale sciatteria.

    No:

    • Responsabile di …
    • Capo-progetto di …
    • Ha guidato il gruppo …

    Sì:

    • È stato responsabile di …
    • È stato  capo-progetto di …
    • Ha guidato il gruppo …

  3. Attenzione alle parole omofone.
    In inglese ce ne sono molte, e sbagliarne lo spelling vi qualifica immediatamente come una persona incompetente: non solo perché non sa l’inglese, ma perché non ha neanche il sospetto di poter sbagliare e l’umiltà di andare a controllare. Due cattive qualità che nessuno vorrebbe avere nei suoi collaboratori.
    Un esempio? They’re / there / their. Siete sicuri di sapere la differenza e quando usare ciascuna delle 3 forme?
  4. Attenzione alle differenze tra plurali, possessivi e genitivi sassoni.
    Facile apparentemente, ma spesso insidioso.
    Anche qui pochi esempi:

    My dogs / My dog’s
    It’s relocation / Its relocation.

Qui l’articolo originario: Four mistakes you probably don’t know you’re making in your resume | TechRepublic.

I 100 anni di Woody Guthrie

Lo festeggiamo con questo documentario della BBC, realizzato nel 1988.

Bello. Curiosa però la scelta della musica di Brian Eno per la sigla.

Birra e chiesa dividono l’America

Birra e religione possono andare insieme? Sì, secondo una vecchia boutade: «Everybody needs to believe in something. I believe I’ll have another beer.»

Homer Simpson

2spare.com

È riportata di frequente sulle t-shirt e da molti attribuita a Homer Simpson (che probabilmente l’ha detta).

Ma è abbastanza certo che la battuta sia stata originariamente scritta e pronunciata da W. C. Fields (William Claude Dukenfield, 1880-1946), in genere in questa piccola variante: «Everybody’s got to believe in something. I believe I’ll have another drink.»

Con altrettanta sicurezza si può affermare che W. C. vestiva meglio di Homer.

In occasione dell’Indipendence Day, il 4 luglio, che i cittadini americani passano tradizionalmente tra cerimonie religiose, barbecue innaffiati di birra e fuochi d’artificio, floatingsheep.org – un sito creato e gestito da un gruppo di giovani geografi di diverse università statunitensi e inglesi – ha analizzato la geografia dei tweet contenenti, rispettivamente, la parola “church” (chiesa) o la parola “beer” (birra).

L’iniziativa nasce all’interno del progetto Dolly (Data On Local Life and You: Bringing Local Geodata to the People – questi sono proprio ossessionati dalle pecore), volto a costruire un sito web per condividere e rappresentare cartograficamente statistiche ufficiali e dati derivanti dalle interazioni sociali, per consentire ai cittadini di meglio analizzare i luoghi in cui vivono e operano. Il progetto sta costruendo un database che raccoglie tutti i tweet georeferenziati a partire da dicembre del 2011 (siamo nell’ordine dei 5 milioni di messaggi al giorno).

Poiché il progetto Dolly non è ancora operativo, per celebrare il 4 luglio e per darci un primo assaggio delle sue potenzialità gli estrosi geografi di floatingsheep.org hanno raccolto tutti i tweet inviati tra il 22 e il 28 giugno dal territorio degli Stati Uniti continentali (esclusi Alaska e Hawaii, per capirci), a condizione che fossero georeferenziati (sono tuttora un’esigua minoranza, tra l’1 e il 3% di tutti i tweet inviati, ma si tratta pur sempre di circa 10 milioni di messaggi). Poi hanno estratto quelli contenenti la parola church (17.686 tweet, per la metà inviati domenica 24) o beer (14.405 tweets più uniformemente distribuiti durante la settimana).

Vediamo subito la mappa, prima di entrare in qualche dettaglio tecnico.

Beer vs. Church

floatingsheep.org

Come forse riuscite a leggere, si tratta delle frequenze relative dell’occorrenza dei due termini a livello di contea.

L’uso della georeferenziazione dei tweet presenta dei problemi (un articolo fondamentale lo trovate qui). È importante sottolineare che nell’analisi sono stati utilizzati i dati relativi al luogo da cui il messaggio è stato inviato (spesso da terminali dotati di GPS) e non quelli registrati nel profilo dell’utente, e che nel 90% dei casi questo consente una precisione geografica al livello del comune (dell’agglomerato urbano) o migliore.

A livello di contea, Los Angeles ha il primato per il numero di tweet rilevanti registrati. Dallas è la città più religiosa (chiesa batte birra 178 a 83), San Francisco la più birrosa (191 a 46). Naturalmente, trattandosi di tweet (149 caratteri), l’occorrenza della parola chiesa non è garanzia dell’intenzione religiosa del mittente (“@pamela vorrei visitare la tua chiesa dalla cupole gemelle”), né viceversa (“@donegidio per fioretto mi asterrò dalla birra per 6 mesi”). Malgrado questi limiti, l’analisi consegna una geografia definita in modo impressionante. in cui si individua chiaramente la Bible Belt negli Stati del sud e una netta prevalenza della birra nel New England, sulla East Coast e nel Midwest.

C’è dunque un beer divide negli Stati Uniti? Per approfondire la questione, i geografi di floatingsheep.org hanno utilizzato il test I di Moran per misurare l’auto-correlazione spaziale. I risultati sono statisticamente molto significativi. Senza entrare troppo nei dettagli, la mappa sottostante mostra quali contee con un numero elevato di tweet con la parola chiesa sono vicine a contee con le stesse caratteristiche (in rosso), e quali contee a prevalenza di birra sono prossime a contee con le stesse caratteristiche (in blu). La divisione tra nord e sud è nettissima, a segnalare la riconoscibilità di pratiche profondamente radicate anche quando le si rileva con riferimento alle tecnologie di comunicazione più aggiornate.

Birra e chiesa: Moran's I

floatingsheep.org

E balza agli occhi la rassomiglianza con la mappa dei risultati elettorali del 2008 (in blu le contee dove hanno vinto i democratici, in rosso quella a maggioranza repubblicana).

Mappa elettorale 2008 per contea

Mark Newman, umich.edu

De Rita premier?

Oggi (10 luglio 2012) Giuseppe De Rita ha pubblicato su Il corriere della sera un articolo che reputo molto equilibrato e importante.

Giuseppe De Rita

premiomazzotti.it

Potete andarlo a leggere alla fonte (L’altro fronte dell’economia – Corriere.it), ma per vostra comodità l’ho anche riprodotto in una pagina di questo blog.

Forecasting and Tomorrow’s Jobs Report | Jared Bernstein | On the Economy

Jared Bernstein è un economista del lavoro statunitense ed è attualmente tra i consulenti di Barack Obama. Potete trovare qui una sua biografia un po’ meno sintetica.

Jared Bernstein

reuters.com

Ha un blog – On the Economy: Facts, Thoughts and Commentary by Jared Bernstein – da cui ho tratto l’articolo che segue (pubblicato il 5 luglio 2012, alla vigilia della pubblicazione dei dati di giugno sull’occupazione negli USA, e ripreso da Salon.com).

Forecasting and Tomorrow’s Jobs Report

I had a chat with a friend the other day – a prominent academic economist whose name I won’t disclose so he doesn’t get shunned in the faculty room – wherein we bemoaned the state of a) micro-theory (predicts implausible elasticities that never show up in the data; marginal product theory – a core premise – looking ever more suspect*) and b) macro-theory (a terrible muddle these days, as Paul K stresses).

But we agreed that econometrics still rules. Sure, there are those who practice eCONomeTRICKS, but “we regard them with scorn” (extra points for those who can source that quote without Google—even more points for those who can identify why it fits in an econometrics post).

I used to have decent econometrics – statistical analysis of economic data – chops, especially for a former musician/social worker, but alas, no more. I can still reliably run reduced form regressions and the Kalman Filter using the structural (or “state-space”) model I associate with Andrew Harvey (see previous link). But I simply haven’t kept up with the cutting edge stuff, though luckily, I know folks who have.

All of which brings me to the fool’s errand of forecasting employment growth for tomorrow’s jobs report. The consensus is for about 100K. I run a couple of models. At this point in the month, I run a regression of the log changes in payrolls on the lagged quarterly payroll growth, the monthly average of 4-wk UI claims, and the ADP (again, all in log changes) and forecast one month ahead (using the actual UI and ADP data for June).

I also try to tease out the longer term trend using the Kalman filter on the NSA data – this is a very good way to get at the underlying recent trend, which right now is running at around 90K, which is actually close to what I get with the standard time series regression noted above. So that’s about what I expect tomorrow, though given the confidence interval of 100K around these data along with the monthly revisions, the firm birth/death modeling – well, I don’t know anyone who has a great track record on this one.

However, that’s less a critique of econometrics than a warning about realistic expectations when forecasting high-frequency data.

Jared Bernstein

salon.com

Poche mie considerazioni:

  1. Beati i cittadini di paesi (che non sono moltissimi, temo) in cui un consulente del governo può permettersi di avere un blog e di dire liberamente la sua “senza filtro” e senza doversi nascondere dietro un nom de plume.
  2. l’asterisco nel primo capoverso rinvia a questa gustosa nota:
    The great Joe Stiglitz gave a talk recently at the LSE on his new book on inequality (I also interviewed Joe the other day).  Anyway, a bit into the interview, he tells the LSE students, and I’m paraphrasing, “You know, that marginal product theory you’re learning around wage setting—it’s not true…you still have to learn it, but it doesn’t really work.”
  3. Paul K è chiaramente Paul Krugman.
  4. eCONomeTRICKS è un gioco di parole.
  5. Ho dovuto usare Google, ma “we regard them with scorn” è un verso della canzone The Folk Song Army di Tom Lehrer.
  6. Per la cronaca, il dato pubblicato oggi è + 80.000.

10 trucchi per sembrare meno stupidi

Puoi anche essere un genio, ma il rischio di fare la figura del cretino è in agguato.

Calvin Sun sul blog 10 Things ha pubblicato oggi (6 luglio 2012) un decalogo per evitare figuracce:

  1. Conoscere a menadito la propria materia
  2. Anticipare il proprio interlocutore
  3. Non fingere di sapere la risposta
  4. Giocare l’ignoranza a proprio vantaggio
  5. Mettere in luce quanto si sa e si è fatto
  6. Fare domande di conferma (e incorporarvi i dubbi)
  7. Includere le ipotesi e i limiti di applicabilità nella risposta
  8. Ricordarsi che «certamente» può ritorcersi contro di voi
  9. Dire piuttosto «Sarei sorpreso se…» (la risposta del Capitano Renault)
  10. Avere a portata di mano dati e citazioni rilevanti.
La cena dei cretini

movieplayer.it/

10 things you can do to keep from looking stupid | TechRepublic

1: Know the material

As obvious as it sounds, nothing does more to prevent problems than knowing the subject you are discussing. The more you know, and the more insight you can provide based on your own experience, the less likelihood that you will misspeak or state an incorrect position. Even more important, knowing the material will give you confidence, and that confidence will show in the tone of your voice and in your body language. Do you know how to reduce the chances of being burned while working with a particular product? Don’t be afraid to share that knowledge.

2: Think three steps ahead of the other person(s)

This point relates to the first one. Not only must you know what you’re talking about, you also must anticipate the most likely questions you will get and prepare answers. In other words, you must do more than simply repeat information. You must be able to analyze it and show how it relates to the objectives and concerns of your listeners. If you are talking about a software implementation, what are the most likely areas where a problem will occur? What combination of hardware and software will be the most difficult to troubleshoot? If you have these answers, your listeners will appreciate your information more.

3: Don’t fake an answer

No matter how much you prepare, you might get a question for which you don’t know the answer. In such a case, resist the urge to guess. You might be right, but the chances are greater that you will be wrong, and an initial wrong answer followed by a correction will be worse than stating that you do not know the answer. Of course, if the question involves a complicated situation, people will be more understanding of your inability to answer than if you lack an answer to a basic question.

At the same time, try to answer what you can. If the question involves the interaction of multiple software products, for example, answer what you can about the individual products, then simply state that explaining the way they interact would take additional analysis.

4: Put a positive spin on lack of knowledge

Even though you might not know the answer, try to avoid saying so. Instead, try the old standard “That’s a good question.” Then explain the issues involved. If the answer will vary depending on different sets of circumstances or system configurations, you could talk about one specific circumstance or configuration and explain that one in detail. Then caution your listener that the results might be different in other circumstances.

5: Mention what steps you already took

Let’s say that you are a level one help desk analyst and you are escalating an issue to level two or beyond. When discussing the issue with the next analyst, make it clear what initial troubleshooting steps you already took and that they failed to work. If you don’t, that level two person might think that you neglected those steps and will think that you are incompetent. Better to be in front of the situation and explain what you already did than to have to react to the other analyst’s questions.

6: Incorporate alternatives when you ask a confirming question

If you are unclear about something you heard, incorporate into your question the possible alternatives. The person who is explaining might not be aware of those other alternatives and mistakenly believe your question is stupid.

For instance, suppose someone is explaining that a supplier is based in Arlington, and that person is aware of only the Arlington in Virginia. If you were to ask, “Do you mean Arlington, VA?” that person, and possibly others, might consider it a stupid question. If you instead ask, “Do you mean Arlington, Virginia, Texas, or Massachusetts?” you subtly make it clear that your question is not stupid at all. In the same way, rather than asking, “Do we need PowerPoint to run the presentation?” consider instead “Do we really need PowerPoint or just the viewer?”

7: Be clear in your answer about assumptions and limitations

Any answer you give will depend on specific facts and circumstances. Therefore, be clear about them, because in other cases the answer might be different.

For example, let’s say that you are vendor management person for your IT organization, and an issue has arisen with a vendor. Suppose someone in the organization asks you about the timeframe your company has in which to sue a vendor, and you know the answer. In giving it, you probably would want to qualify your answer to say, “In state X, the time limit to sue is y years, but in other states it might be different.”

8: Remember that “definitely [not]” can come back to haunt you

As soon as you say something “definitely” will or won’t happen, events will prove you wrong. As a result, you will end up with the proverbial egg on your face. A better alternative to “definitely will happen” is a response such as, “It might not happen, but the chances of that are really small.” An alternative to “definitely won’t happen,” might be, “It’s possible but extremely unlikely.”

9: Consider the Captain Renault “would be shocked” response

In the immortal movie Casablanca, Captain Renault declared that he was, “shocked, shocked I tell you” to find that gambling was occurring at Rick’s Café. You can use this dialog yourself to avoid looking foolish.

While the previous answers of “possible but unlikely” are better than the “definitely” or “definitely not,” they still carry an element of uncertainty. For that reason, my own preference is to answer so that the answer does have certainty. However, the certainty is not about the result, but about my reaction if the result is different. It also lets people know that you’re already aware that you might get egg on your face, so if you’re wrong, you don’t look quite as foolish.

So, for example, in response to the question “Does this Microsoft product have security issues?” I might answer, “If it doesn’t, I would be shocked.” If I am positive that a project will be late, I might say, “If this project comes in on time, I will be shocked.”

10:  Have data and citations in writing

If you are using data to support your points, have that data with you in writing or least have a citation to it. That way, you are not seen as making up numbers. Furthermore, people who disagree with you also have to disagree with data that came from someone other than you. Having the data and the citations gives you added credibility.