Microsoft migliora il riconoscimento vocale per telefoni

 

Utilizzando un nuovo metodo che imita le funzioni del cervello, i ricercatori Microsoft dicono di aver raddoppiato la velocità con cui le frasi vengono riconosciute e i risultati vengono restituiti sullo schermo dal suo sistema di riconoscimento vocale

Scritto da Simone Ziggiotto il 18/06/13 | Pubblicata in Microsoft | Archivio 2013

 

Utilizzando un nuovo metodo che imita le funzioni del cervello, i ricercatori Microsoft dicono di aver raddoppiato la velocità con cui le frasi vengono riconosciute e i risultati vengono restituiti sullo schermo dal suo sistema di riconoscimento vocale. E' stata anche migliorata la precisione del 15 per cento.

Per tentare di limitare il grande vantaggio che i rivali Google e Apple hanno nel mercato della telefonia mobile, Microsoft sta migliorando il suo servizio per di riconoscimento vocale per le persone che parlano per scrivere i loro messaggi di testo o usano la loro voce per cercare nel web.

Windows Phone 8 Steve Balmer

I ricercatori Microsoft dicono che hanno messo a punto un nuovo sistema per aumentare la precisione del riconoscimento vocale e hanno migliorato la velocità in cui viene eseguito il calcolo dei dati per dare all'utente la migliore esperienza d'uso possibile. Applicando le cosiddette "reti neurali profonde" per il riconoscimento vocale, i ricercatori Microsoft sostengono che gli utenti degli Stati Uniti, per la composizione di un messaggio di testo o la ricerca tramite Bing con le loro voci, vedranno i risultati due volte più velocemente di come sono stati abituati con la tecnologia precedente di Microsoft. E i ricercatori dicono che la precisione è migliorata del 15 per cento.

"Per una frase normale, si avrà una parola in meno da correggere", ha detto Michael Tjalve, un senior program manager nel gruppo della tecnologia vocale di Microsoft. Test interni di Microsoft hanno rilevato che il tasso di parole errate è sceso dal 16 per cento al 13,5 per cento. Il tasso di errori rimane comunque variabile in funzione dei rumori di fondo e della qualità del microfono del telefono cellulare.

Inoltre, la velocità con cui il discorso è tradotto in testo è quasi istantaneo, ha detto Microsoft. Una frase che solitamente impiega un secondo o più per essere elaborata e visualizzata sullo schermo ora sarà in grado di apparire sul display di un telefono non appena la persona smetterà di parlare.

Microsoft ha rifiutato di confrontare la velocità e la precisione del riconoscimento vocale con i sistemi rivali di Apple e Google, dicendo spesso che le aziende hanno approcci diversi per lo sviluppo dei sistemi di riconoscimento vocale.

La precisione e la velocità di renderging possono sembrare migliorie di piccola entità ma, nel mondo della ricerca vocale, sono miglioramenti significativi. E per i clienti che utilizzano il riconoscimento vocale sui loro telefoni, tra cui i ricercatori Microsoft, è un altro passo verso un'esperienza di utilizzo più facile.

Per ottenere questi miglioramenti, Microsoft ha sostituito il modello acustico nella sua tecnologia di riconoscimento vocale. In un articolo, cinque ricercatori Microsoft hanno spiegato che l'utilizzo di reti neurali profonde per il riconoscimento vocale aiuta a minimizzare la variabilità nel discorso che spesso ha provocato errori nella tecnologia precedente di Microsoft.

Microsoft ha iniziato il processo di aggiornamento alla nuova tecnologia per i data center negli Stati Uniti nel mese di aprile e prevede di completarlo entro le prossime settimane. La società non ha detto quando prevede di lanciare la tecnologia fuori dai confini statunitensi.

Ecco un video di Microsoft che spiega la sua prossima tecnologia di riconoscimento vocale:

 

Ultime notizie

 
 

Notizie per Categoria

 
 

Seguici

 

Promozioni Consigliate

 
Vuoi restare aggiornato ?