Se ne parla più o meno diffusamente da qualche anno, sia nel mondo dell’impresa che nelle università. Ci troviamo di fronte ad un nuovo paradigma o semplicemente ad un nuovo modo di processare informazioni già esistenti?

Il termine Big Data appartiene a due grandi campi scientifici: il primo dedicato alla gestione di una consistente mole di dati, e alle tecnologie coinvolte, l’atro dedicato all’analisi di queste informazioni. Questi due campi possono essere chiamati big data management e big data analytics. 
big data
Negli ultimi anni – complice la diffusione delle tecnologie per dispositivi mobili, dell’esplosione del cloud computing, delle reti sociali e dell’internet delle cose – abbiamo condiviso in rete una serie smisurata di informazioni, in forma caotica e poco strutturata. Il compito del biga data management è stato assicurare la loro conservazione; ora tocca al big data analytics comprendere come utilizzarle.
Gli analisti si trovano di fronte ad un diamante grezzo, occorre un altro diamante per estrarre qualcosa. Il diamante per il taglio prende il nome di statistica, e permette di trarre informazioni utili da un insieme di dati, perché questi presentano quella che è definita come regolarità statistica.
Per questo motivo i big data si sono trasformati nella nuova forza motrice della società dell’informazione, e la capacità di trarre informazioni da essi permette di prendere decisioni in maniera rapida e precisa, adattandosi e migliorando.
Per estrarre informazioni utili bisogna quindi ricorrere a metodi legati alla statistica e al machine learning. Questi – con estrema semplificazione – possono essere raggruppati in due categorie: metodi per trovare correlazioni tra dati, e metodi per fare previsioni sulla base di essi. La statistica ha privilegiato quest’ultimo aspetto, mentre il movimento Big Data privilegia la raccolta di correlazioni. Il motivo è molto semplice, e può essere spiegato con un esempio.
Poniamo di trovarci di fronte ad una categoria di persone intente a comprare del vino. La statistica farebbe delle previsioni sulla probabilità di comprare un determinato tipo di vino in un determinato momento della giornata, mentre al movimento Big Data interessa solo sapere se una determinata persona possiede le caratteristiche di tutti quelli che amano un determinato tipo di vino.
big Data_1
Grazie alle tecnologie citate qui sopra sembra relativamente facile raccogliere informazioni sui nostri gusti e preferenze, ma noi essere umani non siamo monodimensionali, quindi, mentre il numero di dati da analizzare cresce in maniera esponenziale, non si può dire lo stesso per le informazioni utili agli analisti. E’ impossibile quindi elaborare un profilo dettagliato di ogni singolo essere umano, dei suoi gusti e delle sue propensioni verso un determinato prodotto, però è importante stare attenti alle informazioni che vengono rilasciate.
L’aspetto più importante legato ai Big Data riguarda infatti la gestione della privacy. Come già anticipato, ogni giorno – attraverso la rete – condividiamo migliaia di informazioni, che se aggregate e analizzate permettono di tracciare un profilo più o meno dettagliato di noi stessi. La cosa importante è quindi rendersi consapevoli della nostra attività online, dal semplice testo scritto all’immagine del gattino con i glitter.
Il tono di questo articolo non vuole essere allarmistico, l’obiettivo è solo far prendere consapevolezza di tutte le informazioni che si condividono in rete.
L’analisi dei Big Data permette di migliorare le prestazioni di alcuni processi, e ci sarebbero molti ambiti nei quali potrebbero essere impiegati in maniera profittevole.

Per comprendere ancora meglio la questione ci affidiamo a Rudy Bandiera, che mi ha anticipato di qualche ora sul tema:
https://www.facebook.com/rudybandieracom/videos/10150629751869984/