Come fa l'assistente vocale Alexa a diventare sempre più accurato nel comprendere ciò che gli viene detto? Gli algoritmi di intelligenza artificiale che animano il software Amazon imparano da soli a migliorarsi, ma hanno bisogno anche di un aiuto dall'esterno: lo ha raccontato Bloomberg in un'inchiesta nella quale ha rivelato e spiegato come i comandi che inviamo al dispositivo a volte vengano messi a disposizione di un team di persone che li ascolta per aiutare il sistema a farsi più preciso.

Chi usa uno dei dispositivi Amazon Echo probabilmente già sa che i gadget iniziano a registrare clip audio solo dopo aver compreso il comando di attivazione, e che queste registrazioni vengono stoccate sui server della società sotto forma di file audio per essere analizzate successivamente (per riascoltarle o cancellarle basta seguire la nostra guida); quel che forse non era chiaro è che a effettuare l'analisi non sono solo algoritmi, ma anche persone dislocate in tutto il mondo il cui lavoro — riporta Bloomberg — consiste nell'ascoltare fino a 1000 clip per 9 ore al giorno, catalogandole e correggendo a posteriori i risultati del riconoscimento vocale quando necessario.

I dati da analizzare sono prelevati casualmente dall'intera banca dati del sistema e inviati agli impiegati (si tratta di dipendenti Amazon ma anche di personale proveniente da società appaltatrici). Alcuni hanno il compito di trascrivere i comandi vocali e compararli con il risultato ottenuto da Alexa; altri hanno il compito di annotare il rumore di fondo, come conversazioni o programmi televisivi in corso. Catalogare queste informazioni aiuta enormemente gli algoritmi a comportarsi meglio col tempo, molto di più rispetto a quanto non sia possibile facendo fare a loro tutto il lavoro.

Tra le clip analizzate capita però che ce ne siano alcune registrate a partire da un'attivazione spontanea dei dispositivi — i quali a volte sentono la parola Alexa o Echo anche quando non è stata pronunciata. Alcuni dipendenti ad esempio hanno raccontato a Bloomberg di aver assistito a conversazioni private e a potenziali crimini, ma che per policy sono comunque tenuti a non interferire mai. Il problema di privacy che deriva dall'impiegare persone per ascoltare le conversazioni di altri in effetti si risolve solo in un modo: fare sì che le informazioni che i dipendenti sentono non siano per loro pertinenti.

Per questo motivo, precisa Amazon, le clip che ciascuno sente sono rese anonime e irrintracciabili da chi ascolta; tutti i dati inoltre viaggiano su connessioni crittografate e gli accessi agli account sono protetti da sistemi di autenticazione a più fattori. Questo però non impedisce al sistema di compiere degli errori di quando in quando, né agli utenti di essere ad esempio risconosciuti a partire da informazioni che rilasciano negli stessi audio che Alexa registra. Non è un sistema perfetto insomma, motivo per cui lo stesso gruppo sta tentando di passare ad algoritmi di machine learning più raffinati e capaci di correggersi da soli. Prima di allora però passerà del tempo.

La risposta di Amazon:

“Amazon prende sul serio privacy e sicurezza delle informazioni personali dei clienti. Annotiamo solo un numero estremamente minimo di interazioni da un gruppo di clienti selezionati in modo casuale, al fine di migliorare l’esperienza del cliente. Queste informazioni ci aiutano, ad esempio, ad addestrare i nostri sistemi di riconoscimento vocale e di comprensione del linguaggio naturale, in modo che Alexa possa capire meglio le richieste dei clienti e assicurare che il servizio funzioni bene per tutti. Abbiamo sistemi di sicurezza rigorosi a livello tecnico e operativo, e tolleranza zero per gli abusi dei nostri sistemi. I dipendenti non hanno accesso diretto alle informazioni che permettono di identificare la persona o l’account le cui interazioni sono coinvolte in questa attività. Tutte le informazioni sono trattate con la massima riservatezza e, per proteggerle, usiamo sistemi di autenticazione a più livelli per limitare l’accesso, servizi di crittografia e audit sul nostro sistema di controllo; al tempo stesso, i clienti possono sempre cancellare le proprie interazioni in qualsiasi momento”.