video suggerito
video suggerito
Opinioni

Un algoritmo per assicurare la parità di genere su Wikipedia

L’uomo, a quanto pare, non basta. Per raggiungere la parità di genere servono le macchine. Un algoritmo, per la precisione, in grado di “leggere” Wikipedia e individuare le donne citate ma che non hanno una voce all’interno dell’enciclopedia online, per poi creare questa voce e popolarla con informazioni base.
A cura di Marco Paretti
19 CONDIVISIONI
Immagine

L'uomo, a quanto pare, non basta. Per raggiungere la parità di genere servono le macchine. Un algoritmo, per la precisione, in grado di "leggere" Wikipedia e individuare le donne citate ma che non hanno una voce all'interno dell'enciclopedia online, per poi creare questa voce e popolarla con informazioni base. È l'idea di una start-up di San Francisco, Primer, basata su una dato tristemente reale: le biografie femminili presenti su Wikipedia rappresentano appena il 18 percento del totale. Così per diminuire questo gap di genere deve intervenire un algoritmo.

Si chiama Quicksilver ed è stato "addestrato" su 30.000 voci di Wikipedia e 3 milioni di frasi relative ad articoli scientifici. Ora è in grado di analizzare voci scientifiche e citazioni, individuare i nomi di scienziati, verificarne la presenza o meno sul portale ed eventualmente scrivere una bozza della relativa voce. In una mattina il software è stato in grado di individuare 40.000 ricercatori "anonimi", famosi tanto quelli citati da Wikipedia ma non ancora presenti all'interno dell'enciclopedia. "Quicksilver fa quello che un essere umano potrebbe fare se avesse la capacità di leggere 500 milioni di news, 39 milioni di articoli scientifici e tutta Wikipedia, per poi riuscire a scrivere 70mila voci d'enciclopia" ha spiegato John Bohannon, direttore scientifico di Primer.

Sul sito di Primer sono state pubblicate 100 voci relative ad altrettanti scienziati che dimostrano come l'algoritmo sia in grado di compilare una breve biografia con tanto di riferimenti e collegamenti alle fonti. Si tratta di un elenco composto da uomini e donne, ma nel quale queste ultime sono presenti in numero maggiore proprio a causa della grande disparità nelle voci presenti nell'enciclopedia. L'idea è quella di utilizzare questo software per segnalare le mancanze e fornire agli editor umani un punto di partenza per popolare il sito: il software non pubblicherà automaticamente le voci su Wikipedia.

19 CONDIVISIONI
Immagine
Giornalista dal 2002 specializzato in nuove tecnologie, intrattenimento digitale e social media, con esperienze nella cronaca, nella produzione cinematografica e nella conduzione radiofonica. Caposervizio Innovazione di Fanpage.it.
autopromo immagine
Più che un giornale
Il media che racconta il tempo in cui viviamo con occhi moderni
api url views