login LOGIN
CHIUDI chiudi
Il mio profilo

mostra
Hai dimenticato la password?
Inserisci l'indirizzo email di registrazione per reimpostare la password.
Segui le istruzioni che ti abbiamo inviato per posta elettronica.

Che cosa è e come funziona la RAG

Ascolta l'articolo

La sigla RAG significa Retrieval Augmented Generation e indica delle tecniche che arricchiscono in tempo reale l’addestramento dei modelli di linguaggio

Intelligenza artificiale Shutterstock

In Breve (TL;DR)

  • La RAG (Retrieval Augmented Generation) è una tecnica che potenzia i modelli linguistici integrando in tempo reale informazioni esterne tramite ricerche mirate, superando i limiti dell’addestramento iniziale.
  • I processi RAG si dividono in due fasi: offline (raccolta, parsing, chunking, indicizzazione) per organizzare i dati, e online (retrieval, generazione, citazione delle fonti) per produrre risposte precise e aggiornate.
  • Grazie alla RAG, chatbot come ChatGPT e Gemini possono accedere a dati recenti e specifici, migliorando l’affidabilità in ambiti come customer service, documentazione tecnica e supporto decisionale.

In questo momento storico diverse realtà stanno studiando come implementare la RAG AI nei loro sistemi. Ma che cos’è la RAG? E in che modo potenzia le funzionalità dei tool di intelligenza artificiale?

La sigla RAG fa riferimento a una serie di tecniche che permettono di arricchire in tempo reale la conoscenza dei Large Language Models LLM. Ed è proprio grazie alla RAG e la RAG Graph che i chatbot AI oggi sono in grado di rispondere alle domande degli utenti in maniera completa e profonda. A prescindere dal fatto siano stati addestrati o meno in merito all’argomento trattato.

Cos’è la RAG e quando è nata

Shutterstock

Prima di entrare nel merito delle caratteristiche, il funzionamento e gli obiettivi della RAG è sicuramente utile rispondere a una domanda basilare: cosa significa la sigla RAG?

Ebbene, l’acronimo RAG sta per Retrieval Augmented Generation e può essere tradotto come Generazione Potenziata da Ricerca. La RAG, infatti, è una tecnica che effettivamente si pone l’obiettivo di potenziare le capacità di ricerca degli strumenti di intelligenza artificiale generativa.

I Large Language Models di tool come ad esempio ChatGPT, Copilot o Gemini sostengono delle conversazioni in linguaggio naturale facendo riferimento alla gigantesca quantità di informazioni con cui sono stati addestrati e che compongono la loro rete neurale.

Ma queste informazioni, da sole, rischierebbero comunque di non essere sufficienti per rispondere alle domande dell’utente. La funzione RAG e, più in generale, le componenti di retrieval ovviano ai limiti dell’addestramento, abilitando una ricerca in in tempo reale.

La Retrieval Augmented Generation, o RAG, è una tecnica attraverso cui i tool AI riescono ad accedere alle informazioni di cui hanno bisogno sul web.

Ad esempio, è proprio grazie a funzioni RAG che l’AI è in grado di accedere a Internet e cercare tutte quelle informazioni assenti nelle singole banche dati, ma necessarie a rispondere in maniera adeguata ai prompt ricevuti.

La storia della RAG, proprio come quella dell’AI, è molto più antica di quanto non si potrebbe immaginare. I primi concetti alla base della RAG attuale risalgono ai primi studi sui sistemi di generazione automatica delle risposte e sono attestati attorno ai primi anni ’70 del Novecento.

Detto ciò, la definizione di Retrieval Augmented Generation sarebbe stata coniata soltanto nel 2020, da parte di un team di ricercatori di Facebook che stavano cercando nuove vie per trasmettere nuove conoscenze a modelli linguistici di grandi dimensioni.

Nel paper “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks” Patrick Lewis e il suo gruppo di lavoro spiegavano l’intuizione di sviluppare un database esterno al modello, a cui il sistema era in grado di accedere ove necessario.

Come funzionano i processi RAG offline

Shutterstock

Una volta capito che cosa è la RAG, è possibile entrare nel merito del suo funzionamento, che viene generalmente articolato in processi specifici: quelli offline da una parte, quelli online dall’altra.

I processi offline sono la raccolta dati, il parsing, il chunking e l’indicizzazione. La prima cosa da fare per imparare come implementare RAG di questo tipo consiste nel formare il corpo di documenti a cui il sistema dovrà attingere in fase di retrieval.

Il parsing può essere paragonato a una procedura di formattazione, attraverso cui i diversi documenti raccolti, spesso eterogenei, vengono prima processati e poi indicizzati.

Il chunking è invece una fase necessaria alla gestione di documenti particolarmente lunghi e complessi, che vengono divisi in spezzoni di testo singolo. Il chunking crea dunque nuovi documenti più omogenei, semplificando la lettura e la gestione soprattutto nel caso dei database vettoriali.

I processi RAG off-line sono la raccolta dati, il parsing, il chunking e l’indicizzazione, con algoritmi variabili a seconda del sistema utilizzato.

Anche se c’è sempre da tenere a mente il rischio che il singolo chunk, ovvero il nuovo documento estratto e tagliato dall’originale, sia più difficile da comprendere vista l’assenza di contesto.

Infine, l’indicizzazione raccoglie i diversi documenti o i diversi chunk e li immagazzina all’interno di un database. I Large Language Models usano la RAG per rintracciare le informazioni contenute nel database attraverso un algoritmo. E gli algoritmi sono generalmente variabili, in base al sistema di indicizzazione utilizzato.

In questo senso è utile menzionare anche il concetto di RAG graph: una procedura che permette alla RAG AI di andare oltre la lettura di semplice testo e di utilizzare anche i grafi di conoscenza come fonte di informazioni.

Come funzionano i processi RAG online

Shutterstock

I processi RAG offline descritti nei capoversi precedenti sono dei processi una tantum, considerato che vanno svolti soltanto in determinati momenti di aggiornamento della banca dati.

I processi RAG online si attivano invece ogni volta che lo strumento si attiva e possono essere suddivisi in RAG dinamico, retrieval, aumento del prompt, generazione e rivelazione delle fonti.

La funzione di RAG dinamico, presente soltanto in alcuni sistemi, ha la responsabilità di decidere se e quando attivare i processi successivi. Il retrieval, o recupero, è invece l’effettiva fase di ricerca di informazioni.

Esistono diverse tecniche che si attivano in questa fase, con l’obiettivo di migliorare l’output: dalla query rewriting, che affina la fase di ricerca, al reranking, che filtra i risultati ottenuti scartando quelli meno significativi.

I processi RAG on-line sono il retrieval, l’aumento del prompt, la generazione della risposta e la rivelazione delle fonti.

La fase successiva è quella di effettiva implementazione, che tiene conto anche delle altre informazioni di contesto di cui già disponeva il modello di linguaggio. Una fase che per certi versi potrebbe essere paragonata al prompt engineering, anche se dal punto di vista della macchina.

Si arriva così alla generazione della risposta che, anche in base al prompt originale dell’utente, può essere arricchita da una condivisione delle fonti consultate per arrivare al risultato generato.

Le potenzialità dei processi RAG on-line sono ancora tutte da scoprire, ma, tra prime applicazioni testate, è possibile citare quelle che integrano la conoscenza di una manualistica di base: si pensi in tal senso alle operazioni di customer service, ma anche a quelle di comunicazione interna.

Per saperne di più: Intelligenza Artificiale: cos'è e cosa può fare per noi

Domande frequenti (FAQ)

  • Che cos'è la RAG e in che modo potenzia le funzionalità dei tool di intelligenza artificiale?
    La RAG, acronimo di Retrieval Augmented Generation, è una tecnica che arricchisce la conoscenza dei Large Language Models permettendo ai chatbot AI di rispondere in modo completo alle domande degli utenti, anche su argomenti non specificamente addestrati.
  • Qual è la storia della RAG e quando è stata definita?
    La RAG ha radici negli anni '70, ma il termine è stato coniato nel 2020 da un team di ricercatori di Facebook. Si basa sull'accesso in tempo reale a informazioni esterne ai modelli AI per arricchire le risposte.
  • Come funzionano i processi RAG offline?
    I processi offline includono la raccolta dati, il parsing, il chunking e l'indicizzazione per preparare il sistema all'accesso e all'utilizzo delle informazioni esterne necessarie.
  • Cosa sono i processi RAG online e come si suddividono?
    I processi online includono il retrieval, l'aumento del prompt, la generazione della risposta e la rivelazione delle fonti. Si attivano ogni volta che il sistema è in uso e migliorano l'output delle risposte AI.
A cura di Cultur-e
Addestramento IA non consentito: É assolutamente vietato l’utilizzo del contenuto di questa pubblicazione, in qualsiasi forma o modalità, per addestrare sistemi e piattaforme di intelligenza artificiale generativa. I contenuti sono coperti da copyright.
Whatsapp
Segui le ultime notizie sul nostro canale Whatsapp
Immagine principale del blocco
Segui le ultime notizie sul nostro canale Whatsapp
Fda gratis svg
Iscriviti al canale gratuito

Iscriviti
all'area personale

Per ricevere Newsletter, scaricare eBook, creare playlist vocali e accedere ai corsi della Fastweb Digital Academy a te dedicati.