Google sta lavorando su dettatura e assistente vocale per chi ha disturbi del linguaggio I software per la dettatura e gli assistenti digitali hanno fatto passi da gigante negli ultimi 10 anni, ma non riescono ancora a capire chi ha oggettivi impedimenti nell’espressione, come persone con disabilità, malattie invalidanti o disturbi dell’aparato fonatorio.

A cura di Lorenzo Longhitano

Gli algoritmi di riconoscimento vocale utilizzati da smartphone e smart speaker per capire quello che dicono gli utenti si sono dimostrati parecchio utili, ma sono lontani dall'essere perfetti. In particolare, software per la dettatura e assistenti digitali non riescono ancora a capire chi ha oggettivi impedimenti nell'espressione, come persone con disabilità, malattie invalidanti o disturbi dell'aparato fonatorio; Google sta lavorando per risolvere il problema, e negli scorsi giorni ha annunciato il debutto pubblico di Project Relate, un programma di studio nel quale chiederà agli utenti interessati da queste condizioni di contribuire con degli audio da inviare all'azienda, offrendo in cambio un riconoscimento vocale tarato al meglio sulle caratteristiche individuali di ciascun parlante.

Assistenti vocali e sistemi di dettatura si basano sulla medesima tecnologia: algoritmi che analizzano le forme d'onda catturate dai microfoni installati sui dispositivi per tradurle in fonemi, poi in sillabe, e infine in parole e frasi di senso compiuto. Il modo in cui funzionano questi algoritmi è grazie a un addestramento che li aiuta a formare le corrispondenze tra i suoni e le lettere che corrispondono loro, motivo per cui non sono particolarmente adatti a gestire variazioni troppo ampie rispetto alle pronunce più utilizzate. Se gli accenti regionali troppo marcati possono generare confusione negli algoritmi, la situazione si aggrava nel caso di persone con difficoltà di espressione del linguaggio: il sistema non dispone di abbastanza dati per formarsi un modello di comprensione adeguatamente preciso.

L'iniziativa lanciata in queste ore parte da un'app dallo scopo duplice. Da una parte chiederà agli utenti di registrare una serie di frasi preimpostate, che entreranno in una banca dati mirata a realizzare modelli di riconoscimento vocale tarati sulle esigenze particolari di questa categoria di persone. Dall'altra metterà a disposizione tre funizoni: una funzione di ascolto che trascrive quello che viene pronunciato, in modo simile a una dettatura in tempo reale; una funzione di ripetizione che dopo aver ascoltato quanto detto lo fa rileggere da un motore di sintesi vocale; una funzione di assistenza che richiama le funzionalità dell'Assistente Google potenziate però dagli algoritmi di Projet Relate. Sfortunatamente per ora il sistema funziona solamente in lingua inglese, ma l'idea è di renderlo compatibile anche con gli altri idiomi.