La mappa dei dialetti su Twitter
Se i social network sono lo specchio virtuale della nostra società non possono non riflettere anche le differenze tra le migliaia e migliaia di lingue e dialetti locali, più o meno diffusi. Se siamo in grado di distinguere la provenienza di qualcuno dal suo accento, è possibile farlo anche da come scrive?
È questa l'idea alla base della ricerca condotta da Jacob Eisenstein dell'università Carnegie Mellon di Pitsburgh in Pennsylvania, che ha preso sotto esame 9500 utenti che utilizzano Twitter ma solo tramite cellulare, per poterli rintracciare geograficamente tramite il GPS. Prendendo in esame ben 380mila messaggi e un vocabolario di 5216 parole, Eisenstein ha stabilito una correlazione tra il luogo fisico d'origine dei messaggi ed il linguaggio utilizzato, stabilendo che è possibile, con un determinato margine di errore, conoscere la provenienza geografica dei tweet semplicemente dal modo in cui sono scritti. Lo stesso che accade nel mondo reale con i dialetti, grazie ai quali generalmente intuiamo le radici del nostro interlocutore dalle inflessioni e dai toni che usa.
L'idea di base è molto interessante ed insieme al progetto del genoma della cultura mondiale portato avanti da Google rappresenta uno dei vantaggi che l'utilizzo della tecnologia può apportare allo studio della lingua, incontrando l'interesse di ricercatori o semplici curiosi. I maniaci della privacy sostengono che queste informazioni carpite dal linguaggio possano essere un piatto ghiotto per gli onnipresenti operatori pubblicitari, sempre avidi di dati personali, anche perchè possono essere reperiti senza che l'utente ne sia consapevole. Secondo Eisenstein però il margine d'errore può arrivare fino a 300 miglia, pertanto le informazioni disponibili appaiono abbastanza generiche, utili solo a studiosi ed appassionati della storia del linguaggio e delle sue diversificazioni.