In Breve (TL;DR)
- Microsoft ha lanciato MAI-Image-2, il suo secondo modello AI per immagini sviluppato in casa, già in rollout su Copilot e Bing Image Creator con un debutto al #3 su Arena.ai.
- Il modello punta su fotorealismo, testo leggibile nelle immagini e scene complesse, con il limite attuale del solo formato 1:1 e nessuna funzione di editing.
Microsoft ha annunciato MAI-Image-2, il suo secondo modello text-to-image sviluppato interamente in casa dal team Microsoft AI Superintelligence, guidato da Mustafa Suleyman. Il modello è già in rollout su Copilot e Bing Image Creator e ha debuttato al #3 su Arena.ai, dietro solo a Google Gemini 3.1 Flash e OpenAI GPT Image 1.5. Un anno fa Microsoft si affidava quasi esclusivamente ai modelli OpenAI per alimentare Copilot: MAI-Image-2 segna il cambio di rotta.
Cosa fa MAI-Image-2 e su cosa si concentra rispetto agli altri modelli
Il modello è stato costruito raccogliendo feedback da fotografi, designer e visual storyteller, con un focus su tre aree. La prima è il fotorealismo: luce naturale, carnagioni accurate, texture fisiche convincenti, per ridurre il lavoro di post-produzione. La seconda è il testo nelle immagini: lettere leggibili all'interno delle scene, dalle infografiche alla segnaletica ai layout tipografici, categoria dove molti modelli producono ancora risultati inaffidabili. La terza è la generazione di scene complesse: composizioni dense, concetti surreali, framing cinematografico.
Il modello è disponibile ora su MAI Playground. L'accesso API è attivo per clienti enterprise selezionati e aprirà su Microsoft Foundry per tutti gli sviluppatori. Le limitazioni attuali: solo formato 1:1, solo text-to-image, senza editing o inpainting.
Perché Microsoft sta costruendo modelli AI per immagini in proprio
La logica strategica è diretta. Fino a un anno fa Microsoft si affidava a DALL-E di OpenAI per la generazione di immagini su Copilot. Costruire un modello interno riduce questa dipendenza, abbassa i costi su scala e restituisce il controllo sull'iterazione senza fare affidamento su partner esterni.
Il team Microsoft AI Superintelligence è nato nel novembre 2025. Suleyman ha lasciato il ruolo di CEO di Microsoft AI per guidarlo a tempo pieno: segnale di quanto l'azienda consideri strategica la costruzione di modelli proprietari. MAI-Image-2 è il secondo modello dopo MAI-Image-1, uscito cinque mesi fa. Il #3 su Arena.ai, secondo solo a Google e OpenAI, è il primo risultato concreto.
Cosa cambia per chi usa Copilot e Bing Image Creator
Per chi usa Copilot e Bing Image Creator il cambiamento è pratico: immagini più realistiche, testo leggibile nelle scene, composizioni più elaborate, direttamente dalle funzioni già disponibili. Il rollout è graduale e non tutti gli utenti lo riceveranno contemporaneamente.
Da tenere presenti i limiti attuali: MAI-Image-2 genera solo immagini in formato 1:1, non supporta landscape o portrait e non include editing, inpainting o immagine-su-immagine. È uno strumento text-to-image puro, senza le opzioni di ritocco di piattaforme come Adobe Firefly o Midjourney. Microsoft non ha comunicato date per il superamento di queste limitazioni.
Per saperne di più: Microsoft Copilot: come funziona e come sta trasformando la produttività
Domande frequenti (FAQ)
-
Cosa fa MAI-Image-2 e su cosa si concentra rispetto agli altri modelli?Il modello si concentra sul fotorealismo, testo nelle immagini e generazione di scene complesse, riducendo il lavoro di post-produzione e migliorando la leggibilità e la complessità delle immagini.
-
Perché Microsoft sta costruendo modelli AI per immagini in proprio?Microsoft vuole ridurre la dipendenza da partner esterni come OpenAI, abbassare i costi e avere maggiore controllo sull'iterazione e lo sviluppo dei modelli AI per immagini.
-
Cosa cambia per chi usa Copilot e Bing Image Creator con l'introduzione di MAI-Image-2?Gli utenti vedranno immagini più realistiche, testo leggibile nelle scene e composizioni più elaborate direttamente dalle funzioni esistenti, anche se attualmente ci sono limitazioni come il supporto solo per immagini 1:1 e l'assenza di editing avanzato.



