login LOGIN
CHIUDI chiudi
Il mio profilo

mostra
Hai dimenticato la password?
Inserisci l'indirizzo email di registrazione per reimpostare la password.
Segui le istruzioni che ti abbiamo inviato per posta elettronica.

Google presenta DiffusionGemma l’AI che genera testo più velocemente

Ascolta l'articolo

Google presenta Diffusion Gemma, un modello AI con una nuova tecnologia per generare testo più rapidamente rispetto agli LLM tradizionali. Ecco come funziona

DiffusionGemma Google DeepMind

In Breve (TL;DR)

  • Google ha presentato DiffusionGemma, un modello AI che genera il testo in parallelo invece di scrivere una parola alla volta, aumentando velocità ed efficienza.
  • Il modello è open source, può funzionare anche in locale e migliora attività come scrittura, programmazione e modifica dei testi.

Google ha presentato ufficialmente DiffusionGemma, una nuova famiglia di modelli linguistici open source che rivoluziona radicalmente il modo in cui l'intelligenza artificiale generativa crea un testo.

A differenza dei chatbot tradizionali come ChatGPT, Claude o Gemini che formulano le risposte in modo sequenziale prevedendo una parola dopo l'altra, questo sistema utilizza la tecnologia della diffusione per elaborare e generare l'intero testo in parallelo.

L'obiettivo di Google DeepMind è superare i limiti dei processi attuali, aumentando la velocità di risposta e l'efficienza dei sistemi di intelligenza artificiale, specialmente quando vengono eseguiti localmente sui dispositivi dei singoli utenti.

Come funziona DiffusionGemma di Google

Per capire il funzionamento di DiffusionGemma, possiamo immaginare i modelli linguistici attuali che funzionano un po’ come una velocissima macchina da scrivere che digita un carattere alla volta; DiffusionGemma, invece, cambia le carte in tavola e può essere visto come pressa da stampa industriale che imprime un intero blocco di testo in un colpo solo.

Rispetto agli LLM (Large Language Model) tradizionali che sono "autoregressivi" (commettono un errore all'inizio della frase e sono costretti a portarselo dietro fino alla fine), DiffusionGemma è un modello "diffusivo discreto" che prende in prestito la tecnologia dai generatori di immagini (come Midjourney o Stable Diffusion) e partendo da un blocco chiamato canvas di 256 token casuali ricchi di rumore e pixel testuali confusi, e li ripulisce gradualmente.

Elaborando 256 token in parallelo a ogni singolo passaggio, il modello sposta il collo di bottiglia computazionale dalla larghezza di banda della memoria alla pura potenza di calcolo e, utilizzando schede grafiche dedicate, questo si traduce in una velocità di calcolo capace di superare i 1.000 token al secondo.

Infine, l'uso dell'attenzione bidirezionale consente a ogni parola di analizzare contemporaneamente sia quello che c'è prima e sia quello che viene dopo e se durante i vari passaggi di "denoising" (pulizia del rumore) il modello rileva un calo di coerenza logica o un errore grammaticale, è in grado di correggere e riscrivere le sezioni della frase prima di mostrare all'utente il risultato finale.

Cosa cambia con l’arrivo di DiffusionGemma e a cosa serve

Il rilascio di DiffusionGemma (che, ricordiamolo, è disponibile con licenza open source) mette a disposizione degli sviluppatori un modello da 26 miliardi di parametri totali basato su un'architettura Mixture of Experts (MoE), che attiva appena 3,8 miliardi di parametri durante l'effettiva esecuzione.

Grazie, poi, alla compressione e alla quantizzazione del codice, il modello è in grado di ridurre l'impronta di memoria e può essere eseguito localmente (garantendo un elevato livello di privacy) su computer dotati di GPU consumer di fascia alta (sotto i 18 GB di VRAM), sfruttando totalmente l'architettura hardware senza gravare sui server cloud.

Lato pratico, DiffusionGemma può essere utilizzato per compiti complessi che potrebbero mettere in crisi i normali LLM. È l’ideale per l'editing di testo, per il completamento di blocchi di codice mancanti (code infilling), per la formattazione di strutture rigide come tabelle in Markdown e per la risoluzione di complessi enigmi a griglia come il Sudoku.

Per saperne di più: Intelligenza Artificiale: cos'è e cosa può fare per noi

Google presenta Gemma, il modello AI versione "leggera" di Gemini

Google ha presentato ufficialmente due nuovi LLM appartenenti alla famiglia Google Gemma, si tratta di strumenti AI potenti, affidabili e totalmente open source

Domande frequenti (FAQ)

  • Cos'è DiffusionGemma di Google?
    DiffusionGemma è una nuova famiglia di modelli linguistici open source presentata da Google che utilizza la tecnologia della diffusione per generare testi in modo parallelo, rivoluzionando l'approccio tradizionale sequenziale.
  • Come funziona DiffusionGemma?
    DiffusionGemma elabora l'intero testo in parallelo anziché carattere per carattere, utilizzando la tecnologia diffusiva discreta per pulire gradualmente blocchi di testo confusi, con un'attenzione bidirezionale che analizza contemporaneamente il contesto precedente e successivo.
  • Cosa cambia con l'arrivo di DiffusionGemma?
    DiffusionGemma mette a disposizione un modello da 26 miliardi di parametri basato su architettura MoE, eseguibile localmente su computer con GPU consumer di fascia alta, riducendo l'impronta di memoria e garantendo privacy. È ideale per compiti complessi come l'editing di testo, il code infilling e la risoluzione di enigmi.
A cura di Cultur-e
Addestramento IA non consentito: É assolutamente vietato l’utilizzo del contenuto di questa pubblicazione, in qualsiasi forma o modalità, per addestrare sistemi e piattaforme di intelligenza artificiale generativa. I contenuti sono coperti da copyright.
Whatsapp
Segui le ultime notizie sul nostro canale Whatsapp
Immagine principale del blocco
Segui le ultime notizie sul nostro canale Whatsapp
Fda gratis svg
Iscriviti al canale gratuito

Iscriviti
all'area personale

Per ricevere Newsletter, scaricare eBook, creare playlist vocali e accedere ai corsi della Fastweb Digital Academy a te dedicati.