login LOGIN
CHIUDI chiudi
Il mio profilo

mostra
Hai dimenticato la password?
Inserisci l'indirizzo email di registrazione per reimpostare la password.
Segui le istruzioni che ti abbiamo inviato per posta elettronica.

Google presenta Gemini Robotics 1.5, la nuova frontiera dei robot intelligenti

Ascolta l'articolo

Google presenta Gemini Robotics 1.5 e ER 1.5, modelli avanzati che portano la robotica intelligente a nuovi livelli di ragionamento, pianificazione e autonomia

Gemini Robotics Google DeepMind

In Breve (TL;DR)

  • Google ha presentato Gemini Robotics 1.5 e ER 1.5, due nuovi modelli AI destinati ai robot che gli consentono di percepire, ragionare e pianificare azioni complesse.
  • Questi modelli rappresentano un passo fondamentale verso l'intelligenza artificiale incarnata, permettendo ai robot di compiere azioni nel mondo reale.

Google alza l’asticella nel settore della robotica presentando due modelli di Gemini pensati per spingere i robot oltre la “semplice” esecuzione dei comandi impartiti dall’utente. Si tratta di Gemini Robotics 1.5 e Gemini Robotics-ER 1.5 che permettono alle macchine di percepire ciò che le circonda e di agire, ma anche di ragionare, pianificare e adattarsi a compiti complessi.

Una svolta significativa che avvicina l’azienda di Mountain View verso un’intelligenza artificiale incarnata, in grado di integrarsi totalmente nell’utilizzo quotidiano, mostrando scenari che fino a poco tempo fa erano riservati solamente alla fantascienza.

Cosa possono fare Gemini Robotics 1.5 e Gemini Robotics-ER 1.5

Gemini Robotics 1.5 è un modello divisione-linguaggio-azione (VLA) ed è in grado di trasformare le informazioni visive e le istruzioni testuali in comandi motori. Questo approccio consente ai robot di “pensare prima di agire”, valutando i passaggi necessari per svolgere una qualsiasi azione e spiegando le proprie decisioni utilizzando il linguaggio naturale.

Gemini Robotics-ER 1.5, invece, è un modello di visione-linguaggio (VLM) ed è capace di pianificare strategie complesse, richiamare strumenti digitali (come GoogleSearch) e generare piani dettagliati per portare a termine anche i compiti più articolati.

I primi test effettuati dimostrano già prestazioni all’avanguardia nei benchmark di comprensione spaziale e ragionamento ma, all’atto pratico, cosa possono fare questi due nuovi modelli? Grazie ad essi, ad esempio, i robot possono affrontare attività quotidiane più o meno complesse, come lo smistamento dei rifiuti in base a regole del proprio paese: un’operazione che richiede un ragionamento multilivello, accesso a informazioni contestuali e, naturalmente, il perfetto coordinamento di più azioni fisiche.

Oltre a questo un altro aspetto innovativo di Gemini Robotics 1.5 e Gemini Robotics-ER 1.5 è la loro capacità di imparare attraverso diverse configurazioni robotiche: i movimenti appresi su una piattaforma possono essere trasferiti ad altre, riducendo i tempi di addestramento e ampliando le possibilità di applicazione.

Infine, resta centrale per Google un approccio olistico alla sicurezza e i due modelli sono in grado di usare il ragionamento semantico di alto livello, sistemi di prevenzione delle collisioni e politiche di dialogo sicuro con gli esseri umani. Inoltre, grazie all’aggiornamento del benchmark ASIMOV è possibile aiutare gli sviluppatori a valutare e migliorare ulteriormente la sicurezza semantica e fisica dei robot.

Quali sono i vantaggi nel mondo fisico

Con l’arrivo di Gemini Robotics 1.5 e Robotics-ER 1.5, Google segna una tappa cruciale verso l’obiettivo di un’intelligenza artificiale generale che può essere applicata con successo al mondo reale.

Non si tratta più solo di gestire dei sistemi reattivi. Il colosso di Mountain View si sta muovendo verso lo sviluppo di agenti AI capaci di percepire, pianificare, ragionare e utilizzare attivamente strumenti diversi, ponendo le basi per la creazione di robot sempre più utili nell’utilizzo quotidiano e totalmente integrati nelle varie attività che gli utenti svolgono nel mondo reale, sia in ambito domestico che in ambito aziendale.

Gemini Robotics-ER 1.5 è già disponibile per gli sviluppatori tramite l'API Gemini in Google AI Studio mentre Gemini Robotics 1.5 è disponibile in esclusiva per alcuni partner selezionati.

Per saperne di più: Google Gemini, cos'è come funziona e come utilizzarla

Domande frequenti (FAQ)

  • Cosa possono fare Gemini Robotics 1.5 e Gemini Robotics-ER 1.5?
    Gemini Robotics 1.5 è un modello divisione-linguaggio-azione (VLA) che trasforma informazioni visive e istruzioni testuali in comandi motori, consentendo ai robot di 'pensare prima di agire'. Gemini Robotics-ER 1.5 è un modello di visione-linguaggio (VLM) capace di pianificare strategie complesse e generare piani dettagliati per compiti articolati.
  • Quali sono i vantaggi nel mondo fisico?
    Con l'arrivo di Gemini Robotics 1.5 e Robotics-ER 1.5, Google si avvicina all'obiettivo di un'intelligenza artificiale generale applicabile al mondo reale. I robot possono percepire, pianificare, ragionare e utilizzare attivamente strumenti diversi, diventando sempre più utili e integrati nelle attività quotidiane degli utenti.
  • Dove sono disponibili Gemini Robotics 1.5 e Robotics-ER 1.5?
    Gemini Robotics-ER 1.5 è già disponibile per gli sviluppatori tramite l'API Gemini in Google AI Studio, mentre Gemini Robotics 1.5 è disponibile in esclusiva per alcuni partner selezionati.
A cura di Cultur-e
Addestramento IA non consentito: É assolutamente vietato l’utilizzo del contenuto di questa pubblicazione, in qualsiasi forma o modalità, per addestrare sistemi e piattaforme di intelligenza artificiale generativa. I contenuti sono coperti da copyright.
Intelligenza Astrale
Intelligenza Astrale
Immagine principale del blocco
Intelligenza Astrale
Fda gratis svg
L’oroscopo di Fastweb Plus generato con l’Intelligenza Artificiale
Leggi l’oroscopo gratuito

Iscriviti
all'area personale

Per ricevere Newsletter, scaricare eBook, creare playlist vocali e accedere ai corsi della Fastweb Digital Academy a te dedicati.