“Torture the data, and it will confess to anything.” – Ronald Coase

Ottobre 2001. Alla fine della stagione sportiva, gli Oakland Athletics, squadra di baseball americano che milita nella Major League Baseball, sono una squadra finita. Non sono riusciti a passare il turno nelle fasi finali, tutti i loro migliori giocatori se ne sono andati o stanno per farlo e i tifosi come la dirigenza sono rassegnati ad un periodo di vacche magre.
Settembre 2002. Gli Oakland Athleltics, con un budget lontano anni luce dalle grandi squadre della lega, sono il team rivelazione del campionato, vantano il record appena raggiunto per la più lunga striscia di vittorie e sembrano uno dei grandi favoriti per la vittoria finale.
Non andò così, furono eliminati al primo turno della post season, ma quella squadra e il modo con cui fu costruita sono entrati nella storia ed ha cambiato per sempre il mondo dello sport americano e non solo.

Billy Beane

Ma tranquilli, questo articolo non parla di baseball. La cosa interessante di questa storia(raccontata anche nel bel film, Moneyball) è come quella squadra riuscì a farlo. L’illuminata dirigenza degli Oakland Athletics applicò per la prima volta un metodo basato sulle rilevazioni statistiche e sui puri numeri. Piuttosto che comprare giocatori blasonati, dagli stipendi elevati, mise insieme un gruppo di giocatori complementari, che garantivano statisticamente un certo numero di punti a partita e in questo modo raggiunsero i risultati detti sopra. Detta in altre parole, utilizzarono i big data.

 

Ma cosa sono i big data?
Secondo la definizione di wikipedia, ragionevolmente corretta, i big data sono “raccolte di dati così estesi in termini di volume, velocità e varietà da richiedere tecnologie e metodi analitici specifici per l’estrazione di valore”. Il caso delle rilevazioni statistiche negli sport professionistici è un buon esempio, ma ovviamente l’ espressione big data è di respiro molto più ampio e riguarda soprattutto noi.
Secondo Dino Pedreschi dell’università di Pisa e direttore del SoBigData, una delle realtà italiane più importanti in questo campo, siamo tutti “pollicini digitali”. Continuiamo a lasciare in ogni momento, di ogni giorno delle nostre vite, briciole d’informazione. Briciole costituite dai nostri spostamenti, prontamente localizzati dagli smartphone che abbiamo in tasca e dai gps nelle auto, dai report delle nostre chiamate, delle mail che mandiamo, dai messaggi che inviamo. Ma non solo. Le nostre ricerche su Google, i prodotti che acquistiamo sui grandi store online o anche quando andiamo al supermercato, senza contare tutto il contenuto che volutamente scegliamo di condividere ogni volta che twittiamo qualcosa, che mettiamo like su facebook, che condividiamo foto e video.
I Big Data aprono possibilità completamente nuove in ambito di comprensione della nostra società e sono uno dei campi più attivi e dalle migliori prospettive dell’informatica moderna.

Big-Data-1

I big data esistono da ben prima dell’avvento di interne t(si pensi ad esempio ai grandi database di strutture pubbliche, ospedali, banche etc…) ma è solo negli ultimi anni, spinti anche dal proliferare di smartphone e soprattutto social media(che sulla raccolta di informazioni hanno basato tutto il loro business) che il tema è diventato uno dei punti centrali della ricerca scientifica e industriale. Da una parte, il rendersi conto dell’enorme potere informativo di queste grandi quantità di byte è stato uno dei motori che ha spinto lo sviluppo del calcolo ad alte prestazioni: dovendo infatti, trattare con efficacia grandi quantità di informazioni si è infatti reso necessario l’uso di architetture hardware molto potenti, spesso sviluppate appositamente. Dall’altra, si sta lavorando molto sull’aspetto dell’analisi dei dati raccolti, spesso organizzando challenge, sfide aperte per aziende e gruppi di ricercatori, volte a valorizzare l’immenso contenuto dei Big Data.
Il vero motivo del perché nascono tutte queste challange, tutti questi tentativi per trovare nuove idee con cui sfruttare il patrimonio informativo, è da ricercare fondamentalmente nella necessità di rispondere ad una specifica domanda. I dati ce li abbiamo, la potenza necessaria per trattarli pure, ma concretamente cosa ci facciamo?

 

Abbiamo già citato una loro possibile applicazione nella gestione di società (non solo sportive), ma passando ad esempi di più ampio respiro i big data rappresentano uno strumento sostanzialmente nuovo per comprendere il tessuto fine della nostra società. E’ possibile tracciare atlanti della mobilità, ricavati dai segnali dei telefoni e dei gps delle auto, per capire come funzionano i flussi di movimento delle persone su un certo territorio e come evolvono nel tempo. L’analisi del grafo dei link di Facebook può darci un idea concreta della nostra struttura sociale e di come il nostro sia effettivamente un mondo “piccolo” e globalizzato. A livello epidemiologico significa avere meccanismi per comprendere come si diffondono le malattie e prevedere nuovi focolai per le epidemie.
E non solo. Qual’è il trend della vita in un certo luogo? La felicità è contagiosa? E l’obesità? Quali persone si trovano in un posto nel corso della giornata, tra abitanti visitatori occasionali, e pendolari?
Secondo Stephen Hawking questo sarà il secolo della complessità sociale. Si sono fatti passi da gigante nel comprendere i fenomeni celesti, le reazioni chimiche, etc, eppure sappiamo molto poco sul come e sul perché si diffondano fiducia, benessere, crisi economica, opinioni e così via. I big data sono lo strumento fondamentale per affrontare questa sfida.

bigdata

C’è una dimensione etica completamente nuova che la prospettiva dei big data apre. Come abbiamo visto, i big data sono una sorta di grande osservatorio con cui guardare la società, gli usi e le abitudini, ma al centro della lente per la prima volta ci sono le singole persone con i loro diritti, la loro storia, con le loro informazioni private e sensibili. Il passo non è così lungo dal monitorare i flussi di traffico o le vendite su larga scala dei prodotti nei supermercati allo spiare incondizionatamente tutto e tutti, anche per motivi in apparenza nobili. Lo scandalo datagate, scatenato dalle rivelazioni di Edward Snowden ne è un esempio. In generale dovremmo, come società, ancor prima che come singoli individui, renderci conto di quanto possa essere pericoloso in quest’ottica concentrare troppe informazioni in poche mani, come tra l’altro avviene al giorno d’oggi dove la gran parte dei dati è in mano a poche società private. Sono questioni importanti che vanno sicuramente affrontate con la giusta serietà e consapevolezza, però al contempo non dovremmo nemmeno farci intimorire troppo dagli scenari più funesti, perché il futuro passa inesorabilmente da qui.



Players è un progetto gratuito.

Se ti piace quello che facciamo, puoi supportarci (o offrirci una birra) comprando musica, giochi, libri e film tramite i link Amazon che trovi negli articoli, senza nessun costo aggiuntivo.

Grazie!
, , , ,
Similar Posts
Latest Posts from Players

Comments are closed.