Cos'è DiffusionGemma di Google?

DiffusionGemma è una nuova famiglia di modelli linguistici open source presentata da Google che utilizza la tecnologia della diffusione per generare testi in modo parallelo, rivoluzionando l'approccio tradizionale sequenziale.

Google presenta DiffusionGemma l’AI che genera testo più velocemente

Ascolta l'articolo

Google presenta Diffusion Gemma, un modello AI con una nuova tecnologia per generare testo più rapidamente rispetto agli LLM tradizionali. Ecco come funziona

Google DeepMind

La tua privacy è davvero al sicuro?
Fai il test

LinkedIn X Facebook WhatsApp Email

Crea una playlist
Condividi l'articolo

LinkedIn X Facebook WhatsApp Email

In Breve (TL;DR)

Google ha presentato DiffusionGemma, un modello AI che genera il testo in parallelo invece di scrivere una parola alla volta, aumentando velocità ed efficienza.
Il modello è open source, può funzionare anche in locale e migliora attività come scrittura, programmazione e modifica dei testi.

Google ha presentato ufficialmente DiffusionGemma, una nuova famiglia di modelli linguistici open source che rivoluziona radicalmente il modo in cui l'intelligenza artificiale generativa crea un testo.

A differenza dei chatbot tradizionali come ChatGPT, Claude o Gemini che formulano le risposte in modo sequenziale prevedendo una parola dopo l'altra, questo sistema utilizza la tecnologia della diffusione per elaborare e generare l'intero testo in parallelo.

L'obiettivo di Google DeepMind è superare i limiti dei processi attuali, aumentando la velocità di risposta e l'efficienza dei sistemi di intelligenza artificiale, specialmente quando vengono eseguiti localmente sui dispositivi dei singoli utenti.

Fastweb Mobile Pro

11 ,95€ /mese

Internet 250 GB e Minuti illimitati

Spedizione SIM GRATIS

scopri

Come funziona DiffusionGemma di Google

Per capire il funzionamento di DiffusionGemma, possiamo immaginare i modelli linguistici attuali che funzionano un po’ come una velocissima macchina da scrivere che digita un carattere alla volta; DiffusionGemma, invece, cambia le carte in tavola e può essere visto come pressa da stampa industriale che imprime un intero blocco di testo in un colpo solo.

Rispetto agli LLM (Large Language Model) tradizionali che sono "autoregressivi" (commettono un errore all'inizio della frase e sono costretti a portarselo dietro fino alla fine), DiffusionGemma è un modello "diffusivo discreto" che prende in prestito la tecnologia dai generatori di immagini (come Midjourney o Stable Diffusion) e partendo da un blocco chiamato canvas di 256 token casuali ricchi di rumore e pixel testuali confusi, e li ripulisce gradualmente.

Elaborando 256 token in parallelo a ogni singolo passaggio, il modello sposta il collo di bottiglia computazionale dalla larghezza di banda della memoria alla pura potenza di calcolo e, utilizzando schede grafiche dedicate, questo si traduce in una velocità di calcolo capace di superare i 1.000 token al secondo.

Infine, l'uso dell'attenzione bidirezionale consente a ogni parola di analizzare contemporaneamente sia quello che c'è prima e sia quello che viene dopo e se durante i vari passaggi di "denoising" (pulizia del rumore) il modello rileva un calo di coerenza logica o un errore grammaticale, è in grado di correggere e riscrivere le sezioni della frase prima di mostrare all'utente il risultato finale.

Cosa cambia con l’arrivo di DiffusionGemma e a cosa serve

Il rilascio di DiffusionGemma (che, ricordiamolo, è disponibile con licenza open source) mette a disposizione degli sviluppatori un modello da 26 miliardi di parametri totali basato su un'architettura Mixture of Experts (MoE), che attiva appena 3,8 miliardi di parametri durante l'effettiva esecuzione.

Grazie, poi, alla compressione e alla quantizzazione del codice, il modello è in grado di ridurre l'impronta di memoria e può essere eseguito localmente (garantendo un elevato livello di privacy) su computer dotati di GPU consumer di fascia alta (sotto i 18 GB di VRAM), sfruttando totalmente l'architettura hardware senza gravare sui server cloud.

Lato pratico, DiffusionGemma può essere utilizzato per compiti complessi che potrebbero mettere in crisi i normali LLM. È l’ideale per l'editing di testo, per il completamento di blocchi di codice mancanti (code infilling), per la formattazione di strutture rigide come tabelle in Markdown e per la risoluzione di complessi enigmi a griglia come il Sudoku.

Per saperne di più: Intelligenza Artificiale: cos'è e cosa può fare per noi

Google presenta Gemma, il modello AI versione "leggera" di Gemini

Google ha presentato ufficialmente due nuovi LLM appartenenti alla famiglia Google Gemma, si tratta di strumenti AI potenti, affidabili e totalmente open source

Scopri di più

Domande frequenti (FAQ)

Cos'è DiffusionGemma di Google?

DiffusionGemma è una nuova famiglia di modelli linguistici open source presentata da Google che utilizza la tecnologia della diffusione per generare testi in modo parallelo, rivoluzionando l'approccio tradizionale sequenziale.
Come funziona DiffusionGemma?

DiffusionGemma elabora l'intero testo in parallelo anziché carattere per carattere, utilizzando la tecnologia diffusiva discreta per pulire gradualmente blocchi di testo confusi, con un'attenzione bidirezionale che analizza contemporaneamente il contesto precedente e successivo.
Cosa cambia con l'arrivo di DiffusionGemma?

DiffusionGemma mette a disposizione un modello da 26 miliardi di parametri basato su architettura MoE, eseguibile localmente su computer con GPU consumer di fascia alta, riducendo l'impronta di memoria e garantendo privacy. È ideale per compiti complessi come l'editing di testo, il code infilling e la risoluzione di enigmi.

A cura di Cultur-e

Topic:

Intelligenza Artificiale

#CuriositaTech

#IntelligenzaArtificiale

#NuoveTecnologie

Glossario

applet

DNS

ISP

router

wifi

Addestramento IA non consentito: É assolutamente vietato l’utilizzo del contenuto di questa pubblicazione, in qualsiasi forma o modalità, per addestrare sistemi e piattaforme di intelligenza artificiale generativa. I contenuti sono coperti da copyright.

Segui le ultime notizie sul nostro canale Whatsapp

Segui le ultime notizie sul nostro canale Whatsapp

Iscriviti al canale gratuito

LinkedIn X Facebook WhatsApp Email

Google Gemini AI, cos'è e come funziona

Cosa c’è da sapere su Google Gemini AI, la nuova intelligenza artificiale di Google. Dal set di dati con cui è stata addestrata, alle applicazioni future

Intelligenza Artificiale

Google lancia Gemma 3, il modello AI più potente di DeepSeek e ChatGPT

Google ha ufficialmente lanciato un nuovo modello di intelligenza artificiale, Gemma 3. Stando ai primi test è più potente di DeepSeek e ChatGPT

Intelligenza Artificiale

Gemini, l'AI di Google multimodale e super potente è arrivata

Gemini è la prima intelligenza artificiale multimodale creata da Google. Come funziona, cosa può fare e quali sono le potenzialità di questo nuovo modello AI

Scopri i corsi gratuiti della Fastweb Digital Academy

A. I. copywriting – Come usare l’intelligenza artificiale per creare contenuti

L’intelligenza artificiale sta facendo passi da gigante in tutti i campi: dalla gestione e interpretazione dei big data ai chatbot e virtual…

Intelligenza Artificiale – Le origini

Scopri da dove nasce l’Intelligenza Artificiale e come i Big Data le permettono di “pensare” e innovare. In questo modulo introduttivo con Federico…

Comunicare innovazione e impresa e generare lead ai tempi di ChatGPT

Eleva la tua comunicazione d'impresa e incrementa i tuoi lead