Google spiega il lavoro dei revisori umani che ascoltano le conversazioni vocali dall'Assistente

Google spiega il lavoro dei revisori umani che ascoltano le conversazioni vocali dall’Assistente

Google difende il proprio impegno nel creare prodotti che funzionino per tutti, per un'ampia varietà di lingue, accenti e dialetti. Per questo, delle clip audio raccolte dall'Assistente vengono raccolte, analizzate e trascritte da revisori umani con salvaguardie per proteggere la privacy degli utenti.

Scritto da

Simone Ziggiotto

12 Luglio 2019

Gli assistenti digitali negli altoparlanti intelligenti sono sempre in ascolto del comando di attivazione per poi rilevare la frase da analizzare e gestire. Non è un segreto che le frasi, dopo il comando di attivazione, vengono registrate e archiviate, al sicuro, nell’account degli utenti, che sono poi liberi di rimuoverle quando vogliono. E’ ora emerso dal sito belga VRT (via Wired.com e 9to5google) che Google ha delle persone in tutto il mondo, in carne ed ossa, che si occupano di trascrivere le clip audio raccolte per migliorare i sistemi di riconoscimento vocale del suo Assistente. Tra le frasi analizzate dalla fonte – circa 1000 – non risultano esserci solo quelle registrate dopo il riconoscimento del comando di attivazione, tuttavia, ma anche frasi di conversazioni che non contengono una richieste fatte direttamente all’Assistente. In una prima risposta, Google ha detto che le clip audio sono raccolte in forma anonima. Tuttavia, VRT ha detto che la privacy degli utenti è a rishio perchè alcune clip audio possono contenere informazioni sensibili come nomi, indirizzi e ulteriori informazioni personali. Per spiegare come stanno le cose, David Monsees, Product Manager di Google Ricerca, in un post sul blog aziendale è intervenuto.

Google nel suo blogpost ha spiegato che, nell’impegno di "creare prodotti che funzionino per tutti", investe risorse "significative" per garantire che la sua tecnologia vocale funzioni per un’ampia varietà di lingue, accenti e dialetti. Questo consente a prodotti come l’Assistente Google di comprendere le richiesthe degli utenti, non importa in quale lingua parlano. Come parte del lavoro per sviluppare la tecnologia vocale per più lingue, Google collabora con esperti linguistici di tutto il mondo che comprendono le sfumature e gli accenti di una lingua specifica, quindi esaminano e trascrivono una piccola serie di domande per aiutare la società di Mountain View a comprendere meglio tali lingue. Si tratta di "una parte fondamentale del processo di costruzione della tecnologia vocale ed è necessaria per creare prodotti come l’Assistente Google" ha detto Monsees.

Uno di questi revisori linguistici ha "violato le nostre norme sulla sicurezza dei dati facendo filtrare dati audio olandesi riservati" ha detto Monsees, riferendosi a quelle circa 1000 cli audio sopra menzionate. "I nostri team di sicurezza e risposta alla privacy sono stati attivati â€‹â€‹su questo tema, stanno indagando e prenderemo provvedimenti" ha aggiunto Monses, "Stiamo conducendo una revisione completa delle nostre salvaguardie in questo spazio per evitare che una cattiva condotta come questa possa ripetersi."

Confermando, quindi, che delle clip audio vengono raccolte, analizzate e trascritte da revisori umani, Google assicura di prendere "un’ampia gamma di salvaguardie per proteggere la privacy degli utenti durante l’intero processo di revisione". Google spiega che gli esperti linguistici a cui si rivolge riesaminano solo lo 0,2% di tutti i frammenti audio, che non sono associati agli account utente come parte del processo di revisione e i revisori non sono tenuti a trascrivere conversazioni in background o altri rumori e solo a trascrivere parti indirizzate a Google.

Google ricorda che il suo Assistente invia l’audio ai server della società solo dopo che il dispositivo ha rilevato che si sta interagendo con l’Assistente, ad esempio pronunciando "Ehi Google" o attivando fisicamente l’Assistente Google, ad esempio premendo il pulsante dedicato su alcuni smrtphone o sul telecomando dei televisori compatibili. Un indicatore colorato (come i punti lampeggianti sulla parte superiore di un Google Home o un indicatore sullo schermo del tuo dispositivo Android o la luce che si accende sul telecomando del TV) si attiva ogni volta che il dispositivo comunica con Google per soddisfare la richiesta.

E fino a qui non ci sono problemi, nel senso che è risaputo che una clip audio registrata grazie al richiamo dell’Assistente arriva a Google (come lo stesso avviene quando si interagisce con Alexa, con gli audio che vengono analizzati, sempre in forma anonima, da Amazon).

Tuttavia, Google ha spiegato che "raramente" i dispositivi con l’Assistente Google integrato possono sperimentare ciò che viene chiamato un "falso consenso". Ciò significa che il dispositivo rileva qualche rumore o parola in sottofondo che il software interpreta come la hotword (la chiave di attivazione, come "Ok Google" o "Hey Google"), quindi registra l’audio che imediatamente segue. Google ha detto di avere pero’ "un certo numero di protezioni per impedire che si verifichino accettazioni di falsi positivi".

"Costruire prodotti per tutti è una parte fondamentale del nostro DNA su Google" ha commentato Monses. "Manteniamo elevati standard di privacy e sicurezza nello sviluppo del prodotto e manteniamo i nostri partner agli stessi standard. (…) Lavoriamo costantemente per migliorare il modo in cui spieghiamo le nostre impostazioni e le nostre pratiche sulla privacy alle persone e esamineremo le opportunità per chiarire ulteriormente come vengono utilizzati i dati per migliorare la tecnologia vocale".

Google, in chiusura, ricorda nel suo blogpost che fornisce agli utenti strumenti per gestire e controllare i dati memorizzati nel loro account e che è possibile disattivare completamente la memorizzazione dei dati audio sul proprio account Google o scegliere di eliminare automaticamente i dati dopo ogni 3 mesi o 18 mesi.