video suggerito
video suggerito

Sviluppati i primi software capaci di leggere il labiale

Il progetto Deep Mind di Google e studiosi di Oxford hanno realizzato i primi software capaci di leggere il labiale di una persona.
A cura di Daniele Gambetta
5 CONDIVISIONI
Deepmind_google-578-80

Deep Mind è una compagnia inglese che si occupa di sviluppo di intelligenza artificiale, fondata nel 2010 e poi acquistata da Google nel 2014. L'azienda è già nota per aver portato a termine vari progetti all'avanguardia nel campo, come il programma AlphaGo, che nell'ottobre 2015 riuscì per la prima volta a battere un giocatore umano professionista ad una partita di Go. Ora un team di ricercatori di Google ha realizzato un algoritmo in grado di leggere il labiale di una persona con un livello di precisione molto più alto di quello medio per gli esseri umani.

Le reti neurali artificiali sono tecnologie che, simulando i meccanismi di apprendimento umano, imparano i concetti osservando e studiando grosse moli di dati, mettendole in relazione tra loro. In questo caso, per creare una tecnologia capace di leggere il labiale, gli scienziati hanno allenato il loro software usando 5.000 ore di filmati della BBC per un totale di oltre 118.000 frasi, in modo che l'intelligenza artificiale imparasse autonomamente. L'algoritmo ha ottenuto ottimi risultati: utilizzando 200 frasi scelte a caso come test, il software ha letto correttamente le parole nel 46,8 percento dei casi, contro il 12,4 percento del lettore umano.

A inizio mese un gruppo di ricerca di Oxford ha pubblicato un lavoro simile, chiamato LipNet, capace di una precisione del 93,4 percento. Tuttavia mentre LipNet ha imparato a leggere il labiale da frasi pronunciate da volontari,  il progetto di Google utilizzava video di trasmissioni televisive, includendo così una varietà di linguaggio più ricca rispetto al progetto di Oxford.

Come in tutti i casi di risultati nell'intelligenza artificiale, è difficile delineare pienamente tutte le possibili applicazioni. Ogni passo in questa direzione porta ad una potenziale sostituzione delle macchine al posto dell'uomo in svariati settori. In questo caso specifico si potrebbero sviluppare sistemi in grado di migliorare la comprensione dei comandi vocali direttamente leggendo le labbra dell'utente, oltre che fornire un supporto di aiuto a disabili. Ovviamente non si può negare che anche questa tecnologia mostra il suo lato oscuro, se pensiamo a come potrebbe permettere intercettazioni da lontano senza bisogno di microfoni.

5 CONDIVISIONI
autopromo immagine
Più che un giornale
Il media che racconta il tempo in cui viviamo con occhi moderni
api url views