login LOGIN
CHIUDI chiudi
Il mio profilo

mostra
Hai dimenticato la password?
Inserisci l'indirizzo email di registrazione per reimpostare la password.
Segui le istruzioni che ti abbiamo inviato per posta elettronica.

Gemini 2.5 Computer Use, il nuovo agente AI che naviga su Internet in autonomia

Ascolta l'articolo

Google ha presentato Gemini 2.5 Computer Use, il nuovo agente AI capace di interagire con i browser e navigare su un sito web esattamente come un essere umano

Gemini 2.5 Computer Use Google

In Breve (TL;DR)

  • Google ha presentato Gemini 2.5 Computer Use, un modello AI basato su Gemini, in grado di interagire direttamente con ibrowser e compiere azioni complesse.
  • Questa tecnologia, già disponibile per sviluppatori e in demo pubblica, sta spianando la strada a una nuova generazione di agenti AI autonomi nel web.

Google ha mostrato in anteprima Gemini 2.5 Computer Use, il nuovo modello di intelligenza artificiale capace di interagire direttamente con le interfacce web attraverso un browser, esattamente come fare un utente in carne e ossa.

Una tecnologia rivoluzionaria, che spiana la strada all’arrivo di una nuova generazione di agenti AI capaci di operare all’interno di ambienti digitali tradizionalmente destinati agli esseri umani.

Questo modello AI è basato sulle versioni più recenti di Gemini, ha capacità di comprensione visiva e ragionamento contestuale, che gli consentono di analizzare le richieste degli utenti ed eseguire compiti complessi, come ad esempio navigare su un sito web, compilare e inviare moduli online e interagire con elementi grafici dinamici.

Che cosa può fare Gemini 2.5 Computer Use

La novità principale di Gemini 2.5 Computer Use sta nella sua capacità di comprendere e manipolare visivamente l’interfaccia utente, senza il bisogno di API o connessioni dirette.

Una particolarità che rende questo modello utile per testare interfacce grafiche e verificarne la funzionalità in contesti reali, automatizzare processi web complessi all’interno di siti o piattaforme che non offrono integrazioni per sviluppatori e svolgere compiti diversi, simulando il comportamento umano.

Tra le principali azioni che può svolgere ci sono: l’apertura di un browser web, la digitazione di testo, i clic, il trascinamento e rilascio di elementi interattivi e l’interazione con campi e pulsantidinamici.

Per presentare Gemini 2.5 Computer Use, Google ha pubblicato alcuni video dimostrativi che mostrano il funzionamento pratico di questo agente AI, sostenendo oltretutto che il modello supera i principali tool concorrenti nei benchmark di navigazione web e mobile, garantendo maggiore coerenza, precisione e rapidità di risposta.

Importante ricordare, però, che a differenza di strumenti come ChatGPT Agent o Anthropic Computer Use, questo modello opera esclusivamente all’interno di un browser, senza accesso diretto all’intero ambiente operativo del computer.

Quando arriva Gemini 2.5 Computer Use e come provarlo

Gemini 2.5 Computer Use è già disponibile per gli sviluppatori attraverso Google AI Studio e Vertex AI. Oltre a questo l’azienda di Mountain View ha reso accessibile una demo pubblica su Browserbase, dove è possibile osservare il modello in azione mentre svolge diverse attività tra cui l’interazione autonoma con pagine web complesse.

Con l’arrivo di Gemini 2.5 Computer Use, Google compie un ulteriore passo verso un’integrazione sempre più profonda tra intelligenza artificiale e interfacce umane, creando un sistema in grado di operare con una comprensione contestuale e visiva dell’ambiente digitale.

Questa novità apre a prospettive molto interessanti nell’ambito dello sviluppo software e dell’automazione, contribuendo a una sostanziale trasformazione dell’esperienza utente, con gli agenti AI che saranno in grado di agire come veri assistenti operativi, capaci di comprendere, navigare e agire nel web con la stessa naturalezza di un essere umano.

Per saperne di più: Google Gemini, cos'è come funziona e come utilizzarla

Domande frequenti (FAQ)

  • Cosa può fare Gemini 2.5 Computer Use?
    Gemini 2.5 Computer Use può comprendere e manipolare visivamente l'interfaccia utente, automatizzare processi web complessi e simulare comportamenti umani su siti web.
  • Quali sono le principali azioni che Gemini 2.5 Computer Use può svolgere?
    Tra le azioni principali ci sono l'apertura di un browser web, la digitazione di testo, i clic, il trascinamento e rilascio di elementi interattivi e l'interazione con campi e pulsanti dinamici.
  • Quali sono le novità introdotte da Gemini 2.5 Computer Use nel campo dell'intelligenza artificiale?
    Gemini 2.5 Computer Use rappresenta un passo verso un'integrazione più profonda tra intelligenza artificiale e interfacce umane, creando un sistema in grado di operare con comprensione contestuale e visiva dell'ambiente digitale.
  • Quando arriva Gemini 2.5 Computer Use e come provarlo?
    Gemini 2.5 Computer Use è già disponibile per gli sviluppatori tramite Google AI Studio e Vertex AI. È inoltre possibile provare una demo pubblica su Browserbase.
A cura di Cultur-e
Addestramento IA non consentito: É assolutamente vietato l’utilizzo del contenuto di questa pubblicazione, in qualsiasi forma o modalità, per addestrare sistemi e piattaforme di intelligenza artificiale generativa. I contenuti sono coperti da copyright.
Fda
L'IA nel mondo del lavoro
Intelligenza artificiale e lavoro
L'IA nel mondo del lavoro
Fda gratis svg
Impatti, sfide e opportunità
Iscriviti al corso gratuito

Iscriviti
all'area personale

Per ricevere Newsletter, scaricare eBook, creare playlist vocali e accedere ai corsi della Fastweb Digital Academy a te dedicati.