Fastweb

Google migliora il riconoscimento vocale su Gboard, portandolo in locale

Facebook Social #facebook #foto Facebook testa uno strumento per trasferire le foto nel cloud Trasferire le foto da Facebook ad un servizio di archiviazione online. Il nuovo strumento del social network viene testato oggi in Irlanda
ISCRIVITI alla Newsletter
Inserendo l'indirizzo email autorizzi Fastweb all'invio di newsletter editoriali. Se non desideri più ricevere la newsletter, è sufficiente cliccare sul link presente in calce alle mail per richiederne la cancellazione. Condizioni di utilizzo.
Google migliora il riconoscimento vocale su Gboard, portandolo in locale FASTWEB S.p.A.
Google Gboard
Smartphone & Gadget
A cominciare dai telefoni Pixel, una serie di miglioramenti di Google per la funzione di riconoscimento vocale

La funzione dettatura (speech to text) è una di quelle cose che abbiamo dato per scontato per anni, sebbene sia una delle più utilizzate. È un processo complicato, tuttavia, al punto che il lavoro di conversione viene eseguito in remoto e il risultato finale viene inviato ai nostri dispositivi. Ma Google ha elaborato un modo per ridurre il processo al punto da poterlo eseguire localmente, e i frutti di quel lavoro stanno arrivando su Gboard.

Il modello che Gboard utilizza tradizionalmente per il riconoscimento vocale occupa circa due gigabyte. Quando si tocca l'icona del microfono, il discorso registrato viene inviato ai server di Google per essere convertito in testo, quindi il testo viene rimandato indietro. Oggi però, Google è stata in grado di addestrare un modello più piccolo, altrettanto efficace, utilizzando la tecnologia dei traduttori di rete neurale ricorrente. Questo modello è in grado di funzionare sui dispositivi con la stessa accuratezza di quelli basati su server, ma occupa 450 megabyte di spazio di archiviazione – uno spazio ancora non abbastanza piccolo da poter essere archiviato localmente sulla maggior parte degli smartphone.

Attraverso un processo chiamato quantizzazione del modello, Google è riuscita a ridurre ulteriormente le dimensioni del modello, portando a un pacchetto che occupa solo circa 80 megabyte. Questo aumenta anche la velocità di trascrizione. Il nuovo modello funziona anche a livello di caratteri, quindi il testo trascritto apparirà lettera per lettera, piuttosto che a parole intere alla volta come fa ora.

La funzionalità avanzata di sintesi vocale sarà inizialmente esclusiva per i dispositivi Pixel in lingua inglese, al momento non vi sono indicazioni su quando arriverà altrove. Google è "fiducioso" che sarà disponibile "in più lingue e attraverso più ampi domini di applicazione" molto presto.

13 marzo 2019

Fonte: androidpolice.com

Ti piace
questo
articolo?
Iscriviti alla nostra Newsletter

Riceverai settimanalmente le notizie più
interessanti sul mondo della tecnologia!

Inserendo l'indirizzo email autorizzi Fastweb all'invio di newsletter editoriali. Se non desideri più ricevere la newsletter, è sufficiente cliccare sul link presente in calce alle mail per richiederne la cancellazione. Condizioni di utilizzo.
TAGS: #google #gboard #pixel

© Fastweb SpA 2019 - P.IVA 12878470157
ChiudiChiudi Questo sito usa cookies di profilazione, propri e di terzi, per adeguare la pubblicità alle tue preferenze.
Clicca qui per maggiori informazioni o per conoscere come negare il consenso. Se chiudi questo banner o accedi ad altri elementi della pagina acconsenti all'uso dei cookies.