Opinioni
10 Agosto 2018
17:52

Un algoritmo per assicurare la parità di genere su Wikipedia

L’uomo, a quanto pare, non basta. Per raggiungere la parità di genere servono le macchine. Un algoritmo, per la precisione, in grado di “leggere” Wikipedia e individuare le donne citate ma che non hanno una voce all’interno dell’enciclopedia online, per poi creare questa voce e popolarla con informazioni base.
A cura di Marco Paretti

L'uomo, a quanto pare, non basta. Per raggiungere la parità di genere servono le macchine. Un algoritmo, per la precisione, in grado di "leggere" Wikipedia e individuare le donne citate ma che non hanno una voce all'interno dell'enciclopedia online, per poi creare questa voce e popolarla con informazioni base. È l'idea di una start-up di San Francisco, Primer, basata su una dato tristemente reale: le biografie femminili presenti su Wikipedia rappresentano appena il 18 percento del totale. Così per diminuire questo gap di genere deve intervenire un algoritmo.

Si chiama Quicksilver ed è stato "addestrato" su 30.000 voci di Wikipedia e 3 milioni di frasi relative ad articoli scientifici. Ora è in grado di analizzare voci scientifiche e citazioni, individuare i nomi di scienziati, verificarne la presenza o meno sul portale ed eventualmente scrivere una bozza della relativa voce. In una mattina il software è stato in grado di individuare 40.000 ricercatori "anonimi", famosi tanto quelli citati da Wikipedia ma non ancora presenti all'interno dell'enciclopedia. "Quicksilver fa quello che un essere umano potrebbe fare se avesse la capacità di leggere 500 milioni di news, 39 milioni di articoli scientifici e tutta Wikipedia, per poi riuscire a scrivere 70mila voci d'enciclopia" ha spiegato John Bohannon, direttore scientifico di Primer.

Sul sito di Primer sono state pubblicate 100 voci relative ad altrettanti scienziati che dimostrano come l'algoritmo sia in grado di compilare una breve biografia con tanto di riferimenti e collegamenti alle fonti. Si tratta di un elenco composto da uomini e donne, ma nel quale queste ultime sono presenti in numero maggiore proprio a causa della grande disparità nelle voci presenti nell'enciclopedia. L'idea è quella di utilizzare questo software per segnalare le mancanze e fornire agli editor umani un punto di partenza per popolare il sito: il software non pubblicherà automaticamente le voci su Wikipedia.

Giornalista dal 2002 specializzato in nuove tecnologie, intrattenimento digitale e social media, con esperienze nella cronaca, nella produzione cinematografica e nella conduzione radiofonica. Caposervizio Innovazione di Fanpage.it.
Wikipedia Italia chiude le sue pagine contro la direttiva europea sul copyright
Wikipedia Italia chiude le sue pagine contro la direttiva europea sul copyright
Facebook ha censurato una notizia: secondo l'algoritmo era un messaggio politico
Facebook ha censurato una notizia: secondo l'algoritmo era un messaggio politico
Facebook apre alle immagini di nudo artistico:
Facebook apre alle immagini di nudo artistico: "Modificheremo l'algoritmo"
Più che un giornale
Il media che racconta il tempo in cui viviamo con occhi moderni