NLP

Che cos'è e come funziona il riconoscimento del linguaggio naturale

Con il passare del tempo, i computer e gli altri dispositivi informatici sono diventati sempre più bravi a riconoscere il nostro linguaggio. Ecco come
Che cos'è e come funziona il riconoscimento del linguaggio naturale FASTWEB S.p.A.

Apparentemente, si tratta di una delle operazioni più semplici che possiamo compiere. Anche perché lo facciamo da quando abbiamo qualche mese di vita sino a che non moriamo. Al contrario, si tratta di una delle azioni più complesse e, secondo molti, è ciò che ci distingue dal resto del regno animale. Stiamo parlando del linguaggio e della nostra capacità di comunicare in maniera articolata con altri individui della nostra specie. Certo, anche altre specie animali comunicano tra loro, ma il livello di astrazione e complessità del linguaggio umano non ha pari.

Eppure, per noi, si tratta di un'operazione semplicissima. Più o meno come bere un bicchier d'acqua o camminare. Merito di diversi adattamenti del cervello, che ci hanno reso capaci di articolare suoni in maniera ricca e, soprattutto, di comprenderli in maniera piuttosto semplice e veloce. A dimostrare quanto la comprensione del linguaggio sia però complicata ci pensano, oltre che gli animali, i computer. Nonostante siano in grado di compiere operazioni matematiche di gran lunga più complesse di quelle che possiamo svolgere noi, i PC hanno ancora difficoltà a cogliere tutte le sfumature del linguaggio umano. Soprattutto quando si fa ricorso a varie figure retoriche.

Parlare con uno smartphone

Un gap, però, che potrebbe essere presto chiuso grazie al massiccio utilizzo di algoritmi di intelligenza artificiale che alimentano il cosiddetto Natural Language Processing. Vediamo insieme di cosa si tratta.

Cos'è il NLP

Detta in parole molto semplici, ma in realtà la cosa è tutt'altro che semplice, il NLP è quella tecnologia che ci permette per esempio di usare i comandi vocali con i moderni assistenti digitali come Google Assistant, Amazon Alexa o Apple Siri. Noi pronunciamo delle parole e l'assistente le interpreta per capire quale comando gli stiamo dando. Giorno dopo giorno questi assistenti ci sembrano sempre più intelligenti, perché riescono a capire i nostri comandi anche quando non pronunciamo proprio le parole esatte del comando stesso.

Gli assistenti, in pratica, man mano che vengono "allenati" e affinati riescono sempre di più a comprendere il nostro linguaggio naturale che, a differenza dei rigidi comandi usati dai programmatori software per far fare qualunque cosa alle loro app, non è sempre uguale a sé stesso. In questo modo possiamo usare la voce come interfaccia di comunicazione con l'hardware e il software dell'assistente digitale, come usiamo il mouse e la tastiera per interfacciarci con un computer.

Assistente vocale

Come funziona il NLP

Adesso passiamo alle cose difficili: come funzionano gli algoritmi di Natural Language Processing. L'obiettivo di questi algoritmi è chiaro: fare in modo, ad esempio, che l'assistente digitale accenda la luce del salotto sia quando pronunciamo "Accendi la luce in salotto", sia quando pronunciamo "Accendi la luce del salotto", o "Accendi la luce salotto", "Accendi luce salotto", ma anche "Accenderesti la luce in salotto, per favore" e "Puoi accendere la luce in salotto?" e così via. Ma l'algoritmo deve anche capire le differenze tra "Accendi la luce in salotto" e "Accendi le luci in salotto". E, ancora, deve essere in grado di capire la differenza tra il comando "Luce accesa in salotto" e la domanda "La luce del salotto è accesa".

Le parole d'ordine nel complesso mondo degli algoritmi di NLP, oggi, sono tre: tokenizzazione, stemming e lemmatizzazione. Con tokenizzazione si intende la capacità di dividere il parlato in frasi e singole parole, distinguendo quindi quali parole appartengono ad una frase principale e quali appartengono alle secondarie. In questo modo è possibile comprendere un comando correlato ad una condizione, come "Se fuori ci sono meno di 15 gradi allora accendi il riscaldamento a 20 gradi". Non è una cosa semplice, perché ogni lingua e ogni dialetto posiziona le parole in modo diverso all'interno di una frase e anche la cadenza e l'accento possono ingannare (persino l'ascoltatore umano).

Allenamento NLP

Lo stemming è invece un processo di riduzione di una forma flessa al suo tema, cioè la parte della parola che rimane dopo aver tolto la desinenza. Ad esempio, "voc" è il tema, contemporaneamente, di "voce", "vocale", "vocìo", "vocifera" e così via. La lemmatizzazione è quel processo che permette di arrivare dalla forma flessa a quella canonica, cioè al suo lemma. Il lemma è la forma che troviamo nei dizionari: il lemma di "mangiato" è "mangiare", il lemma di "cotto" è "cuòcere".

NLP: a cosa serve oggi

Usando la tokenizzazione, lo stemming e la lemmatizzazione gli algoritmi di NLP riescono ad interpretare un normale discorso estrapolando le singole parole, individuando sesso e numero di nomi e aggettivi, i tempi e i modi dei verbi e capendo in quante frasi va diviso il discorso e come sono collegate tra loro queste frasi. Allo stato attuale, però, il Natural Language Processing applicato all'elettronica di largo consumo riesce ancora ad elaborare solo frasi corte e poco complesse, mentre riesce già a capire bene se nomi e aggettivi sono al singolare o al plurale, al maschile o al femminile.

Chatbot

Gli algoritmi che abbiamo appena descritto, e molti altri insieme a loro, vengono già usati in una miriade di tecnologie che usiamo tutti i giorni. A partire dalla ricerca su Google, che ci offre risultati sempre più espansi grazie alla capacità di capire cosa stiamo effettivamente cercando, in base alle parole che abbiamo usato per cercarlo. Anche i servizi di traduzione online, come Google Translate, usano questi algoritmi ma per ricomporre nella nostra lingua le frasi che, se tradotte parola per parola, sarebbero incomprensibili.

Gli assistenti digitali sono un altro esempio, quello in cui vedremo i maggiori sviluppi nei prossimi anni. Un esempio ulteriore sono i chatbot, cioè i risponditori automatici che troviamo in sempre più siti Web come primo filtro per l'accesso al servizio assistenza: interpretano le nostre parole per cercare di capire quale problema dobbiamo risolvere, se è possibile risolverlo direttamente online o se è necessario l'intervento di un operatore in carne ed ossa.

copyright CULTUR-E
Condividi
Ebook
Sicurezza in Rete: ne sai abbastanza?
Strumenti utili, suggerimenti pratici e tutto quello che devi assolutamente sapere per proteggere davvero i tuoi dispositivi e i tuoi dati personali quando sei connesso
scarica l'ebook

Iscriviti alla
newsletter del
Digital Magazine di
Fastweb

Riceverai ogni settimana le notizie più interessanti sul mondo della tecnologia!
Iscriviti

Grazie per esserti iscritto!

Abbiamo inviato una mail all'indirizzo che hai indicato: per completare l'iscrizione alla newsletter del Digital Magazine di FASTWEB clicca sul link all'interno della mail