Il data mining è un processo aziendale che permette di analizzare una grande quantità di dati per scoprire le eventuali relazioni significative tra di essi. Questo processo permette di interrogare un database, attraverso un software di analisi, e scavare nei dati in tempo reale. Per un’azienda di vendita retail, per esempio, si potrebbero scoprire interessanti statistiche sull’andamento delle vendite e i trend rispetto ai cicli temporali anche in una singola regione o provincia, ottenendo così dei benefici reali.

Uno strumento del genere è stato lanciato da Google il 25 Maggio e si chiama “Google Correlate”: un tool capace di scoprire i trend più collegati ad una attività in generale e dunque all’universo semantico di riferimento. Ci sono già strumenti simili come Google Trends e Google Insights for Search, ma con questi è possibile inserire una parola e vedere il trend: invece con il nuovo tool è possibile inserire un trend, inerente qualsiasi attività nel mondo, e vedere quali termini di ricerca sono collegati a quella tendenza. In altre parole, il sistema di Google Trends, ma al contrario.

Oggi, grazie a Google Correlate, lanciato in Google Labs, se si è interessati ad un’attività o ad una occupazione, si possono caricare una serie di dati e visualizzare un elenco di termini di ricerca la cui popolarità corrisponde a quella tendenza nel mondo reale. In qualche modo, in via del tutto ipotetica, si possono anticipare e influenzare le "queries" future intorno a un trend. Google però sottolinea che la correlazione (tra un trend e una parola chiave o il contrario) non è detto che sia necessariamente sintomo di un rapporto causa-effetto.

E per il futuro?

L’attività di “search” sul motore di ricerca, attraverso Google Correlate, è un’incredibile risorsa di “data mining”, come detto all’inizio, che permette di progredire in ambiti quali l’economia, la salute e altri importanti settori; solo che, assicura Google, c’è bisogno di fare attenzione alla tutela dei dati personali. Attraverso questo sistema non sarà importante capire cosa cerca una persona singola, ma quello che milioni di anonime “queries” suggeriscono a Google nel tempo; i modelli osservati nella mole enorme dei dati, possono essere molto significativi per quel che riguarda le popolazioni di grandi dimensioni.

Vi consigliamo i fumetti diffusi da Google che spiegano, in un modo simpatico e intuitivo, il nuovo progetto: comic.