Finalizzare

La parola abusata di oggi, finalizzare, viene utilizzata con il seguente significato, che cito come di consueto dal Vocabolario Treccani:

Condurre a compimento […]. Apportare modifiche a qualche cosa al fine di renderla più rispondente al suo scopo, o comunque di migliorarla, di affinarla: […] una macchina, un motore, uno strumento; […] un metodo, una tecnica; […] il tuo stile.

Tutto bene allora? No, perché è vero che ho trascritto, in parte, un lemma del Vocabolario Treccani, ma è quello riferito al verbo perfezionare.

Sempre a detta del Vocabolario Treccani, il significato di finalizzare è completamente diverso:

Ordinare, rivolgere a un fine determinato un’azione, un’attività o un’istituzione: finalizzare una ricerca.

E come è possibile che, disponendo di un verbo che significa esattamente quello che si intende dire, e che già i Romani utilizzavano in questa accezione (ad esempio, “Occorre perfezionare la bozza di contratto”) si preferisca dire e scrivere “Occorre finalizzare la bozza di contratto.” E badate bene che, a rigore, il rischio è quello di dire esattamente il contrario di quello che si intende: perché “Occorre perfezionare la bozza di contratto” fa riferimento a un contratto il cui oggetto e i cui contenuti sono sufficientemente definiti e vanno sistemati nella forma, nelle clausole e nel linguaggio giuridico; mentre “Occorre finalizzare la bozza di contratto” fa piuttosto pensare a un contenitore già curato sotto il profilo della forma, delle clausole e del linguaggio giuridico, ma da riempire di un oggetto e di contenuti specifici.

Come è possibile, ci chiedevamo? La tentazione è quella di dire: perché la cultura cattolica di cui siamo intrisi ci induce a pensare che la perfezione non è di questo mondo e, di conseguenza, ci ripugna anche solo l’idea di utilizzare un verbo che possa farci pensare che la perfezione esista, anche solo limitatamente al linguaggio tecnico.

Soltanto una tentazione, però. Perché temo che la verità sia più banale. Questa:

Finalize: [verb, with object] complete or agree on a finished and definitive version of: efforts intensified to finalize plans for post-war reconstruction. [Oxford English Dictionary]

Finalize: [transitive verb] 1. to put in final or finite form (soon my conclusion will be finalized — D. D. Eisenhower); 2. to give final approval to (finalizing the papers prepared by his staff — Newsweek). [Merriam-Webster]

Fatemi la cortesia, usate perfezionare. Per aiutarvi a ricordare, una canzone di Enya, Cursum perficio:

Albicocca, anzi mugnaga

Agli albori di questo blog, oltre 5 anni fa, ho scritto un post melanconico e compiaciuto sull’assenza di sapore delle albicocche. Se vi va di rileggerlo lo trovate qui.

Ci torno sopra perché quello che è successo ieri, se credessi ai miracoli, lo chiamerei miracolo. Ma ai miracoli non ci credo, come immagino ormai i più assidui sapranno, e ho una spiegazione quasi razionale. Quella che nel nel post del 2007 ho chiamato “l’albicocca che ricordo, che deliziava la mia giovinezza” non era un artifizio retorico, ma esisteva veramente, all’inizio del filare centrale che bipartiva la poca terra davanti alla casa dei nonni. I filari furono espiantati e l’albicocco con loro (era anche vecchio e malandato). ma mio zio sosteneva di averne conservato un albero, e molti anni fa innestò con quello 2 piante. Non ebbero mai fortuna: malate da sempre di gommosi, trascurate, senza mai un trattamento… Non le avevo mai viste produrre un’albicocca.

Ieri, nel bel mezzo dell’anticiclone africano Caronte, o Minosse, o Scoreggia del demonio, 38 gradi all’ombra (per fortuna c’era un sole che spaccava le pietre), l’alberello superstite di albicocche esibiva un gran numero di frutti piccoli, coperti di cocciniglia ma rosso mattone una volta lavati e dal sapore indimenticabile e indimenticato della mia gioventù.

Ricorderete che l’albicocca prende il nome dal latino praecócum, variante di praecócem, perché matura prima della pesca, attraverso l’arabo al-barquq o al-berquq. Saprete altresì che la pesca si chiama così per la sua ascendenza persiana.

Restava per me un mistero perché in dialetto modeno-mantovano l’albicocca, soprattutto quella piccola e saporita (quelle grando e patatose si chiamano baricocui) si chiami mügnaga. L’ho appreso oggi qui:

Come forse pochi ormai sanno, specialmente fra i giovani, questa parola indica in quasi tutti i dialetti lombardi, con piccole differenze fonetiche e grafiche, l’albicocca. Va anche detto che in italiano antico esisteva l’armenìaca, con lo stesso significato. Il termine, scomparso nella lingua nazionale, perdura nelle parlate locali, come nel valtellinese armignäga, nel lodigiano mügnaga, nel bergamasco bignaga, nel bresciano ambrognaga, nell’emiliano mügnaga ecc. Resta da capire da dove derivi questa strana parola che ha avuto così larga fortuna. Occorre rifarsi a una regione dell’Asia anteriore, l’Armenia, dalla quale questo frutto ci è pervenuto. In latino, infatti, si diceva: Prunus Armeniaca ossia “susina proveniente dall’Armenia”. Dal latino si è quindi passati all’italiano armenìaca e da qui ai vari termini che indicano l’albicocca in molti dialetti. L’esito più meridionale di questa parola è quello abruzzese, dove l’albicocca è chiamata menacë, rifatto sul plurale armenìace. Certo non è facile capire che la nostra mugnaga e l’abruzzese menacë sono la stessa parola derivata da un termine assai antico che continua a vivere ancorché sotto forme apparentemente diverse. A conferma del fatto che le lingue non muoiono, ma si trasformano.

Mugnaga

wikimedia.org

Olimpico e olimpionico

Un post che avrei voluto scrivere io e invece l’ha scritto Dario Cavedon, e io riporto integralmente:

GIOVEDÌ 26 LUGLIO 2012

Olimpiadi di lingua Italiana – lezione zero: olimpico e olimpionico

I Giochi della XXX Olimpiade (notare l’uso della numerazione romana) cominceranno domani a Londra, ma già sono cominciati su tutti i principali media i giochi degli strafalcioni olimpici della lingua Italiana. Atleti sul campo (della vergogna): un po’ tutti i giornalisti italiani. Ho quindi deciso di scrivere questo post, in cui rivelerò uno degli errori più diffusi, per cui il Divino Poeta Dante Alighieri potrebbe gareggiare senza temer rivali nella specialità “piroetta tripla in tomba”.

Qual è la differenza tra olimpico e olimpionico?

So che questo tema è già stato affrontato da moltissimi altri blogger, in moltissimi altri post, ma non a sufficienza. Non si spiegherebbe altrimenti che stamane alla radio la giornalista RAI – evito di menzionarne il nome – abbia definito la squadra italiana “olimpionica”.

I lettori abituali di questo blog – dato il loro altissimo livello culturale – possono smettere di leggere qui, già sanno la risposta alla domanda di cui sopra. I lettori occasionali farebbero bene a proseguire.

olimpiònico agg. e s. m. (f. –a) [dal gr. ᾿Ολυμπιόνικος agg., ᾿Ολυμπιονίκης s. m. (lat. Olympionīces), comp. di ᾿Ολύμπια «gare di Olimpia, giochi olimpici» e tema di νικάω «vincere»] (pl. m. –ci). – Nell’antica Grecia, vincitore nei giochi olimpici (in questo senso anche, secondo l’accento latino, olimpionìco). Nell’uso moderno, vincitore (e, al femm., vincitrice) in una o più gare alle olimpiadi (fonte: www.treccani.it).

“Olimpionico” è quindi la fusione di 2 parole: “Olimpia” e “Nike”, che vuol dire appunto “vincere, vittoria”. Quindi un “olimpionico” è una persona che ha vinto una medaglia d’oro alle Olimpiadi.

olìmpico agg. [dal lat. Olympicus, gr. ᾿Ολυμπικός] (pl. m. –ci). – 
1. 
a. Del monte Olimpo (v. olimpo), concepito nella mitologia greca come sede degli dèi: le divinità o., soprattutto le divinità dei tempi omerici, contrapposte sia alle divinità che avevano sede nell’Ade (come Plutone e Persefone), sia agli dèi il cui culto, orgiastico e misterico, fu introdotto in Grecia in tempi posteriori (come Dioniso e Demetra). [snip]b. Per estens., che si riferisce alle olimpiadi moderne: giochi o.; campione o. (più com. olimpionico); primatotitolo o.; fiaccola o. (v. fiaccola); stadio o., destinato allo svolgimento delle varie gare olimpiche. (fonte:www.treccani.it).

“Olimpico” è quindi tutto ciò che riguarda le Olimpiadi, non solo chi ha vinto i Giochi Olimpici.

Proprio dal significato della parola “Nike” deriva il nome di una famosa azienda di magliette. Pensateci, quando dovrete ricordarvi la differenza tra le due parole.

Riepilogando:

Piscina olimpionica: sbagliato! (hai mai visto una piscina vincere le Olimpiadi??)
Piscina olimpica: giusto!

Campione olimpionico: sbagliato! (“olimpionico” già sottointende la vittoria alle Olimpiadi, non si deve ripetere con “campione”)
Campione olimpico: giusto! 


Lo so, purtroppo questo post resterà sconosciuto alla maggior parte della popolazione italiana, e alla totalità dei giornalisti sportivi italiani. 

Link:

Olimpionico su Treccani.it
Olimpico su Treccani.it

Sul sito di Dario ferve la discussione …

Loriano Macchiavelli – Strage

Macchiavelli , Loriano (1990). Strage. Torino: Einaudi. 2010. ISBN 9788858402535. Pagine 594. 6,99 €

Strage

amazon.com

Libro consigliato da un amico, lettore raffinato e intensivo, in genere affidabile. Quindi, l’ho immediatamente comprato e mi sono messo a leggere la sera stessa, interrompendo tutte le altre letture. D’altra parte, lo afferma anche il distico in rima baciata:

Amico fidato,
Romanzo acquistato.

Invece, l’ho trovato una delusione. Provo ad abbozzare un minimo d’analisi critica, anche per fare chiarezza a me stesso.

Il primo punto, per me, è che trovo la scrittura di Macchiavelli troppo piatta, convenzionale, di genere. Sembra a volte di leggere un Giallo Mondadori o un Segretissimo: anche per le scene di sesso e violenza. Capisco che ammettendolo mi sono rivelato da solo per l’esteta che sono, esponendomi alle critiche di chi mi dice (l’hanno detto l’amico fidato di cui sopra e un’amica che ho incontrato a cena) che questo è un libro di fantapolitica sulla strage di Bologna e quindi va letto cercandoci qualche spunto di avvicinamento alla verità “politica” o “politico-culturale” di quella strage, e non le belle lettere. Non sono per nulla d’accordo. Se era quello l’intento del libro, allora Macchiavelli averebbe dovuto scrivere un saggio (avendone le capacità e il respiro). Un romanzo, secondo me, deve avere anche una ragion d’essere artistica. Esempi ce ne sono: in questo blog ho citato più d’una volta Nelle mani giuste di Giancarlo De Cataldo.

Secondo punto: ma qual è poi la tesi di Macchiavelli? Che i mandanti della strage erano mafia+eversione di destra+banda della Magliana+massoneria+Andreotti? Che le cause prossime (e le responsabilità penali) sono difficili da sbrogliare? Che Dalla Chiesa era un santo peccatore? Mah, si può dire di tutti gli episodi dal 1969 in avanti (almeno per quello che ne so e ne ricordo io). Anzi, non è che la valigia esplosiva della strage di Bologna era la terza bomba di piazza Fontana di cui s’erano perse le tracce?

A riprova del fatto che il romanzo mi ha lasciato freddo, non ho sentito la necessità di appuntarmi nemmeno una frase.

Si possono prevedere i risultati delle olimpiadi?

La risposta è certamente affermativa. Ma come? I modi possono essere innumerevoli, dal famoso polpo Paul alle previsioni ragionate degli economisti (che come noto sono in grado di prevedere razionalmente un risultato e il suo contrario).

Fabio Radicchi, un giovane fisico romano, ha applicato un modello statistico. Il post di Samuel Arbesman dove ho trovato la notizia (“Universal Laws at the Olympics and Predictions for 2012“, Wired Science Blogs: Social Dimension, 25 luglio 2012) colloca il lavoro di Radicchi nell’ambito delle spiegazioni matematiche delle performance umane, di cui riporta esempi riferiti agli anni Settanta e Ottanta (qui e qui). Studiare i limiti delle performance umane sotto il profilo statistico è particolarmente interessante (per uno statistico, va da sé), perché ci stiamo per definizione concentrando su una coda della distribuzione (quella degli atleti migliori; io sto in quell’altra, naturalmente), mentre la statistica dà il meglio di sé quando si parla di medie e di distribuzioni normali. Esiste però un’intera branca della statistica, la teoria dei valori estremi, che studia proprio questi aspetti.

Medaglie d'oro

wired.com

Il ragionamento di Radicchi è abbastanza semplice da spiegare (l’articolo “Universality, Limits and Predictability of Gold-Medal Performances at the Olympic Games” si può scaricare liberamente): si ipotizza che il miglioramento relativo dei record obbedisca a una legge universale e che tenda al raggiungimento di un valore limite. Radicchi usa il medagliere olimpico (in primo luogo le medaglie d’oro, ma anche quelle d’argento e di bronzo, per 3 motivi:

  1. sono disponibili osservazioni per oltre un secolo (i primi giochi dell’era moderna si disputarono nel 1896);
  2. i dati sono dettagliati e regolarmente distribuiti nel tempo (ogni 4 anni);
  3. nella stragrande maggioranza delle discipline, la performance del vincitore della medaglia d’oro approssima piuttosto fedelmente il miglior risultato conseguibile in quel momento storico, data la rilevanza e il prestigio della manifestazione.

Sulla base di queste premesse, l’articolo si propone:

  1. di mostrare che i miglioramenti della performance obbediscono a una legge universale;
  2. di stimare i valori limite del miglioramento di performance;
  3. di prevedere i risultati (in termini di performance) delle olimpiadi di Londra.

* * *

Per quanto riguarda il primo aspetto, Radicchi mostra che i miglioramenti relativi nella performance del vincitore della medaglia d’oro in due edizioni consecutive delle olimpiadi tende ad avvicinarsi a un valore limite e che i miglioramenti stessi (non le prestazioni in termini assoluti) sono distribuiti normalmente. Radicchi registra questa regolarità in 55 discipline olimpiche.

Vediamo qui l’esempio, piuttosto chiaro, dei 400 m piani maschili.

Radicchi 1

plosone.org

Nel primo quadrante della figura (a) si presenta la stima migliore del valore limite (il record insuperabile per i 400 m piani maschili è stimato in 41′ e 62 centesimi). La significatività statistica del risultato è molto elevata e il secondo e terzo quadrante (b e c) mettono a confronto la distribuzione normale teorica (in nero) con quella misurata da Radicchi sui risultati effettivi. Infine, nel quarto quadrante si vede che il risultato non dipende dalle particolari edizioni dei giochi olimpici e che la distribuzione è stazionaria.

I risultati conseguiti sono particolarmente importanti perché sono generalizzati, cioè applicabili a un numero elevato di discipline olimpiche. Radicchi li spiega così:

At each new edition of the Games, gold-medal performances get, on average, closer to the limiting performance value. The average positive improvement observed in historic performance data can be motivated by several factors: as time goes on, athletes are becoming more professionals, better trained, and during the season have more events to participate in; the pool for the selection of athletes grows with time, and, consequently there is a higher level of competition; the evolution of technical materials favors better performances. On the other hand, there is also a non null probability that winning performances become worse than those obtained in the previous edition of the Games (i.e., relative improvement values are negative). All these possibilities are described by a Gaussian distribution that accounts for various, in principle hardly quantifiable, factors that may influence athlete performances: meteorological and geographical conditions, athletic skills and physical condition of the participants, etc.

* * *

L’applicazione dello stesso modello e delle stesse procedure di stima a una pluralità di discipline olimpiche permette a Radicchi di determinare per ognuna il valore limite e, al tempo stesso, di stimarne la bontà. La validità del modello è riscontrata per l’intera gamma delle corse (dai 100 m alla maratona), per i record che riguardano la distanza e l’altezza (i diversi tipi di salto in lungo e in alto) e nel nuoto.

Nella figura qui sotto qualche esempio: Per la maratona il limite è stimato in 5771,44 secondi (1h36’11” e 44 centesimi), per il salto in alto femminile in 8,12 m, per i 100 m maschili e femminili rispettivamente in 8,28″ e 9,12″.

radicchi 2

plosone.org

* * *

Infine, ecco le previsioni dei risultati in alcune discipline per Londra 2012, come emergono da modello di Radicchi:

Radicchi 3

plosone.org

Obituary: Sally Ride (26 maggio 1951-23 luglio 2012)

Di Sally Ride avevamo parlato – per la verità in modo molto leggero – in un post di qualche tempo fa, che ieri ho riproposto, dopo essere venuto a conoscenza della sua scomparsa.

Sally Ride

sallyridescience.com

Oggi torno sull’argomento con più serietà, perché il necrologio ufficiale – pubblicato sul suo sito Sally Ride Science – mette in luce 2 aspetti della sua vita, uno poco noto e uno del tutto privato fino a ieri, che mi sembra valga la pena sottolineare:

  1. Dopo aver lasciato la NASA nel 1987, Sally è tornata a insegnare, prima a Stanford e poi all’UCSD (University of California San Diego, noto a noi Apple-isti della prima ora per UCSD Pascal) e nel 2001 ha fondato la propria società, Sally Ride Science, per perseguire la vera passione della sua vita: «inspiring young people, especially girls, to stick with their interest in science, to become scientifically literate, and to consider pursuing careers in science and engineering.»
    «The company creates innovative classroom materials, classroom programs, and professional development training for teachers.»
    «Long an advocate for improved science education, Sally co-wrote seven science books for children—To Space and Back (with Sue Oakie); and Voyager; The Third Planet; The Mystery of Mars; Exploring Our Solar System; Mission Planet Earth; and Mission Save the Planet (all with Tam O’Shaughnessy). Sally also initiated and directed NASA-funded education projects designed to fuel middle school students’ fascination with science, including EarthKAM and GRAIL MoonKAM.»
    Secondo il New York Times (“American Woman Who Shattered Space Ceiling“): «In 2003, Dr. Ride told The Times that stereotypes still persisted about girls and science and math — for example the idea that girls had less ability or interest in those subjects, or would be unpopular if they excelled in them. She thought peer pressure, especially in middle school, began driving girls away from the sciences, so she continued to set up science programs all over the country meant to appeal to girls — science festivals, science camps, science clubs — to help them find mentors, role models and one another. “It’s no secret that I’ve been reluctant to use my name for things,” she said. “I haven’t written my memoirs or let the television movie be made about my life. But this is something I’m very willing to put my name behind.”»
  2. Con grande discrezione e sottile understatement, il necrologio ci informa che Sally lascia «Tam O’Shaughnessy, her partner of 27 years». Nessuno, fuori dalla cerchia dei parenti e degli amici più intimi, lo sapeva, perché la discrezione e la riservatezza di Sally erano proverbiali.
    Tam, che lavora alla Sally Ride Science come Chief Operating Officer and Executive Vice President for Content, aveva incontrato Sally su un campo da tennis quando erano entrambe ragazze:
    «Sally Ride and Tam O’Shaughnessy became friends at the age of 12 when they both played tennis. While their lives took different paths, they stayed in contact over the years. Ride went to Stanford University, earned a BS, an MS, and a PhD in physics, and became the first American woman to fly in space; O’Shaughnessy became a professional tennis player and later earned a BS and an MS in biology from Georgia State University and a PhD in school psychology from the University of California–Riverside.»
    Sally non aveva mai parlato della sua sessualità. Nell’articolo del New York Times già citato si dice: «Dr. Ride was known for guarding her privacy. She rejected most offers for product endorsements, memoirs and movies, and her reticence lasted to the end. […] In 1983, writing in The Washington Post, Susan Okie, a journalist and longtime friend, described Dr. Ride as elusive and enigmatic, protective of her emotions. “During college and graduate school,” Dr. Okie wrote, “I had to interrogate her to find out what was happening in her personal life.”»
    La sorella di Sally, Bear Ride, ha dichiarato a BuzzFeeD (“First Female U.S. Astronaut, Sally Ride, Comes Out In Obituary“): «We consider Tam a member of the family. […] I hope it makes it easier for kids growing up gay that they know that another one of their heroes was like them. […] Sally didn’t use labels. Sally had a very fundamental sense of privacy, it was just her nature, because we’re Norwegians, through and through.»
    Nel medesimo articolo, Chad Griffin, presidente della Human Rights Campaign, afferma: «For many Americans, coming out will be the hardest thing they ever do. While it’s a shame that Americans were not able to experience this aspect of Sally while alive, we should all be proud of the fact that like many LGBT Americans, she proudly served her country, had a committed and loving relationship, and lived a good life. […] The fact that Sally Ride was a lesbian will further help round out Americans’s understanding of the contributions of LGBT Americans to our country. Our love and condolences go out to her partner.»
    Per effetto del DOMA (Defense of Marriage Act) Tam non può essere riconosciuta erede di Sally.
Sally Ride e Tam O'Shaughnessy

Flickr/The American Library Association

 

Il baseball, il copyright e Wikipedia

La storia la racconta Robinson Meyer, scrittore e musicista che vive nei pressi di Chicago, sull’edizione online di The Atlantic del 18 luglio 2012: MIT Economist: Here’s How Copyright Laws Impoverish Wikipedia. In Italia l’ha ripresa Luca De Biase sul suo blog: Abhishek Nagaraj e il copyright:

Secondo l’economista del Mit Abhishek Nagaraj il copyright peggiora l’informazione disponibile per le conoscenze condivise universalmente. (Atlantic).

Non stupisce: probabilmente il copyright è connesso proprio a un concetto contrario a quello dell’accesso universale: è un sistema che insiste sull’idea che l’accesso a informazioni speciali e di speciale valore meriti una barriera alla circolazione e un pagamento che ne sostenga la produzione, ma creando una condizione per cui chi se lo può permettere mantiene a distanza in termini di conoscenze da chi non se lo può permettere o non riesce a capirne il valore.

La valutazione politica di questa situazione non può che essere diversa per le diverse sensibilità. Ma indubbiamente Nagaraj ha trovato un modo per descriverla in modo molto concreto.

Ecco, Luca De Biase mi perdonerà (o forse no, perché è la seconda volta in poche settimane che dissento da lui), ma mi sembra che non abbia colto fino in fondo il senso dell’articolo di Robinson Meyer e della ricerca di Abhishek Nagaraj (se sono io che sbaglio, chiedo scusa in anticipo con il capo coperto di cenere).

Robinson Meyer riconosce ab initio, nelle prime frasi del suo articolo, che la faccenda del copyright è ingarbugliata e richiederebbe una conoscenza enciclopedica (forse più quella del demone di Laplace che di Aristotele). Ma proprio per questo – sostiene – in primo luogo non funziona; in secondo è troppo complessa per essere riconducibile alle diverse sensibilità politiche (come le chiama De Biase):

Everyone knows that the flow of information is complex and tangled in society today — so thank goodness for copyright law! Truly, no part of our national policy is as coherent, in the interest of the public or as updated for the Internet age as that gleaming tome in the US Code.
Not.
Unless you’re reppin’ the MPAA, you probably know that the modern copyright regime doesn’t work. You don’t have to believe in radical copyleftism — or even progressivism — to understand this. But it’s hard to know how the current body of law governing copyright and intellectual property affects individual works, simply because of the way communication, and ideas in general, work. One thing connects to another, and pulling apart the causes from the effects requires an Aristotle-like familiarity with contemporary culture.

Proprio per la complessità della questione (anche se il giudizio negativo sul fatto che l’attuale normativa statunitense sul copyright non funziona è nettissimo) Robinson Meyer sta ben attento a sottolineare che il valore della ricerca di Abhishek Nagaraj sta proprio nel fatto di essere circoscritta a Wikipedia e al rapporto tra qualità delle conoscenza e esistenza o meno delle limitazioni imposte dal copyright.

But one MIT economist, Abhishek Nagaraj, who recently presented his work at Wikimania, has found a way to test how the copyright law affects one online community — Wikipedia — and how digitized, public domain works dramatically affect the quality of knowledge.

Abhishek Nagaraj

mit.edu

La storia della ricerca di Abhishek Nagaraj (giovanissimo studente di PhD del second’anno) è affascinante e trae spunto dalla digitalizzazione e pubblicazione, nel 2008, da parte di Google di molte riviste americane, tra cui l’autorevole Baseball Digest, dedicato (lo dice il nome stesso) ai giocatori di baseball e riccamente illustrato.

Basball Digest

theatlantic.com

Google ha digitalizzato tutti i numeri del Baseball Digest da luglio del 1945 al 2008. Ma attenzione, per effetto di una clausola della legge statunitense sul copyright tutti gli articoli antecedenti il 1964 sono entrati nel pubblico dominio, mentre quelli successivi a quella data sono ancora protetti dalla tutela del copyright. La ricerca di Abhishek Nagaraj si è concentrata sul quarantennio fino al 1984 e si è sviluppata in questi passi fondamentali:

  1. Su Wikipedia opera un gruppo di tifosi di baseball che cura la redazione e l’aggiornamento dei campioni di baseball. Questi non hanno impiegato molto a scoprire la nuova fonte, rappresentata dai numeri digitalizzati di Baseball Digest. Il risultato, misurato da Abhishek Nagaraj, è che gli articoli sui campioni All-Stars riferiti al periodo 1945-1984 sono aumentati in media di 5.200 parole per articolo. Questo mette in evidenza con sufficiente chiarezza che i redattori di Wikipedia hanno ampiamente utilizzato il nuovo materiale.
  2. A questo punto Abhishek Nagaraj ha suddiviso il materiale di Baseball Digest in 2 parti: i numeri fino al 1964, ormai “fuori diritti” (gruppo di controllo, nel linguaggio degli esperimenti clinici), e quelli del ventennio successivo, tuttora tutelati (gruppo di trattamento).
  3. Confrontando i due insiemi, Abhishek Nagaraj è stato in grado di misurare gli effetti del sussistere o meno del copyright sugli articoli sui campioni di baseball pubblicati su Wikipedia, in termini di lunghezza del testo, numero di immagini e traffico generato.
  4. La lunghezza degli articoli (in generale aumentato, come si è detto) non appare influenzata dall’esistenza o meno della tutela del copyright: questo perché è piuttosto agevole aggirarla semplicemente parafrasando il testo.
  5. Non così per le immagini. Prima della digitalizzazione di Baseball Digest, gli articoli riferiti al primo ventennio presentavano in media 0,183 immagini per articolo e quelli del secondo ventennio 0,158. Dopo la digitalizzazione, la frequenza delle immagini è aumentata sensibilmente, ma con una fondamentale differenza nei due gruppi: nel primo, quello dove le immagini erano di dominio pubblico, sono salite a 1,15 immagini per articolo in media; nel secondo, dove le immagini erano sotto copyright, si rilevano 0,667 immagini per articolo. Pertanto, la presenza del copyright scoraggia l’uso dell’immagine in poco meno della metà dei casi.
  6. Tutto questo ha anche avuto un effetto sensibile sul traffico generato e sulla popolarità delle pagine. Gli articoli pre-1964 che erano già “popolari” (nel 10% più consultato) hanno visto un incremento di popolarità del 70%; ma anche quelli del 10% meno popolare hanno comunque visto crescere la loro popolarità del 15%. Inoltre, gli articoli pre-1964 sono stati “corretti” più di frequente. Entrambi questi effetti sono comprensibili, dal momento che è noto che gli algoritmi di Google premiano le voci in cui sono presenti immagini e che sono state aggiornate più di recente.
  7. Abhishek Nagaraj – che è uno statistico serio – ha sottoposto i suoi risultati a una serie di controlli (dal talento dei giocatori, al loro essere mancini, alla durata della loro carriera) per escludere che questi fattori possano avere influito sui risultati del suo esperimento.

Queste le sue conclusioni:

Copyright law affects to some degree what information makes its way onto Wikipedia, but what it more strongly affects is how we use that information once it’s there. In other words, digitizing any knowledge increases an article’s text, but only digitizing public domain images makes articles more frequently updated and visited.

Abhishek Nagaraj mette a disposizione sul web le slide della sua presentazione e vi consiglio vivamente di andarle a guardare, per seguire meglio il suo esperimento.