Google, una formula matematica per migliorare le traduzioni

Google, una formula matematica per migliorare le traduzioni

Big G ha sviluppato una tecnica che genera automaticamente dizionari e tabelle di frasi che convertono una lingua in un'altra
Google, una formula matematica per migliorare le traduzioni FASTWEB S.p.A.

Una nuova tecnica matematica potrebbe migliorare le traduzioni automatiche di Google. Chiunque abbia provato BabelFish o Google Translate sa che forniscono servizi di traduzione utili ma non perfette. Il problema è che le traduzioni iniziali si basano su dizionari che devono essere compilati da esperti umani e questo richiede tempo e fatica. Da qui l’idea: confrontare un corpus di parole di una lingua con lo stesso corpus di parole tradotte in un altro idioma: parole e frasi che condividono proprietà statistiche simili sono considerati equivalenti. 

Il ricercatore di Big G Tomas Mikolov e i colleghi hanno sviluppato una tecnica che genera automaticamente dizionari e tabelle di frasi che convertono una lingua in un'altra. Il nuovo metodo non si fonda su versioni in diverse lingue di uno stesso documento ma utilizza tecniche di data mining (l'insieme di tecniche e metodologie che hanno per oggetto l'estrazione di un sapere o di una conoscenza a partire da grandi quantità di dati) per creare un modello della struttura di una lingua che poi viene paragonato alla struttura di un'altra lingua. Il nuovo approccio è semplice: si basa sul fatto che ogni lingua descrive un insieme simile di idee e le parole che vi appartengono devono necessariamente essere simili. Per esempio, la maggior parte dei linguaggi avrà parole per animali comuni come cane, gatto, mucca e così via. E queste parole saranno usate nello stesso modo in frasi come 'il gatto è un animale più piccolo del cane'.

Il nuovo trucco è rappresentare un'intera lingua usano le relazioni fra le parole. L'insieme di tutte le relazioni può essere pensato come un insieme di vettori che vanno da una parola all'altra. Negli ultimi anni, i linguisti hanno scoperto che è possibile gestire questi vettori matematicamente. Per esempio, l'operazione 're'-' uomo' + ' donna' risulta in un vettore che è simile a 'regina'. Si è scoperto che diversi linguaggi condividono similitudini in questo spazio vettoriale: il processo di conversione da una lingua all'altra si riduce allora a trovare la trasformazione matematica che converta uno spazio vettoriale nell'altro. Un problema linguistico diventa quindi di tipo matematico e gli studiosi di Google hanno trovato una opportuna applicazione che colleghi i due spazi vettoriali. "Il nostro metodo e' estremamente efficace:  abbiamo raggiunto finora una precisione del 90% nelle traduzioni fra inglese e spagnolo", ha commentato Mikolov.

30 settembre 2013 

La Redazione
Condividi
Ebook
Sicurezza in Rete: cosa c'è da sapere
Scarica subito l'eBook gratuito e scopri cosa bisogna assolutamente sapere per proteggere i propri dispositivi e i propri dati quando si utilizza la Rete
scarica l'ebook
ChiudiChiudi Questo sito usa cookies di profilazione, propri e di terzi, per adeguare la pubblicità alle tue preferenze.
Clicca qui per maggiori informazioni o per conoscere come negare il consenso. Se chiudi questo banner o accedi ad altri elementi della pagina acconsenti all'uso dei cookies.

Iscriviti alla
newsletter del
Digital Magazine di
Fastweb

Riceverai ogni settimana le notizie più interessanti sul mondo della tecnologia!
Iscriviti

Grazie per esserti iscritto!

Abbiamo inviato una mail all'indirizzo che hai indicato: per completare l'iscrizione alla newsletter del Digital Magazine di FASTWEB clicca sul link all'interno della mail