Google e Boston Dynamics integrano i modelli di Gemini Robotics in Spot per una percezione avanzata e un'esecuzione ottimale dei compiti.
In Breve
Google e Boston Dynamics integrano l'intelligenza artificiale Gemini nel robot Spot, consentendo il controllo tramite linguaggio naturale, il riconoscimento degli oggetti e l'esecuzione di compiti, facendo progredire la robotica adattiva e i sistemi di interazione uomo-macchina.

Azienda tecnologica Google ha annunciato una partnership con Boston Dynamics per integrare i modelli di ragionamento incarnato di Gemini Robotics nel robot quadrupede Spot, segnando un passo avanti nell'applicazione dell'intelligenza artificiale alla robotica nel mondo reale. La collaborazione consente al robot di interpretare meglio il suo ambiente, identificare oggetti ed eseguire compiti basandosi su istruzioni in linguaggio naturale, anziché affidarsi esclusivamente a routine pre-programmate.
L'integrazione si basa sul lavoro sperimentale condotto durante un hackathon interno nel 2025, in cui gli sviluppatori hanno esplorato come modelli linguistici complessi e sistemi di ragionamento visivo potessero migliorare l'autonomia di Spot. Sfruttando Gemini Robotics, il robot è in grado di elaborare gli input visivi provenienti dalle sue telecamere e tradurre istruzioni di alto livello, come ad esempio organizzare oggetti in una stanza, in azioni fisiche coordinate.
A differenza della programmazione robotica tradizionale, che spesso dipende da una logica rigida e graduale, il sistema introduce un'interfaccia più flessibile basata su suggerimenti conversazionali. Gli sviluppatori hanno creato un livello software intermedio utilizzando il kit di sviluppo software di Spot, consentendo ai modelli Gemini di comunicare con l'interfaccia di programmazione dell'applicazione del robot. Questo framework consente all'IA di selezionare da un defiuna serie di azioni necessarie, tra cui navigazione, rilevamento di oggetti, acquisizione di immagini, presa e posizionamento.
Le interfacce in linguaggio naturale ridefiniscono l'esecuzione dei compiti robotici.
Nelle dimostrazioni pratiche, il sistema ha mostrato la capacità di interpretare istruzioni generali e di adattarsi ad ambienti dinamici. Ad esempio, quando incaricato di organizzare degli oggetti, il modello di intelligenza artificiale ha analizzato i dati visivi, identificato gli oggetti rilevanti e guidato il robot attraverso una sequenza di azioni. Il feedback del robot, come il completamento del compito o i vincoli fisici, è stato integrato in tempo reale, consentendo al sistema di adattare il proprio comportamento senza intervento manuale.
L'approccio mantiene i confini operativi limitando l'IA a predefifunzionalità necessarie all'interno dell'API del robot, garantendo prestazioni prevedibili e controllate. Questa progettazione bilancia l'adattabilità con la sicurezza, un aspetto fondamentale per l'implementazione dell'IA nei sistemi fisici.
La partnership evidenzia anche i potenziali vantaggi in termini di efficienza per gli sviluppatori. Riducendo la necessità di un'ampia programmazione manuale, le interfacce in linguaggio naturale consentono agli ingegneri di concentrarsi su defidefinire obiettivi piuttosto che programmare ogni sequenza di azioni. Questo cambiamento potrebbe accelerare lo sviluppo di applicazioni robotiche in settori quali la produzione, l'ispezione e la logistica.
Sebbene l'implementazione rimanga sperimentale, la dimostrazione riflette tendenze più ampie nell'IA fisica, dove i modelli di base vengono sempre più utilizzati per migliorare la percezione e il processo decisionale delle macchine. Entrambe le aziende hanno indicato che sono in corso ulteriori sviluppi, tra cui la continua integrazione dei sistemi basati su Gemini nelle piattaforme robotiche.
La collaborazione suggerisce una transizione verso un'interazione uomo-macchina più intuitiva, in cui comportamenti robotici complessi possono essere guidati tramite input semplificati. Con l'evoluzione continua dei modelli di intelligenza artificiale, tali integrazioni potrebbero ampliare la portata funzionale dei sistemi autonomi, riducendo al contempo le barriere tecniche alla loro implementazione.
Negazione di responsabilità
In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.
Circa l'autore
Alisa, una giornalista dedicata al MPost, è specializzato in criptovalute, IA, investimenti e nell'ampio regno di Web3. Con un occhio attento alle tendenze e alle tecnologie emergenti, offre una copertura completa per informare e coinvolgere i lettori nel panorama in continua evoluzione della finanza digitale.
Altri articoli
Alisa, una giornalista dedicata al MPost, è specializzato in criptovalute, IA, investimenti e nell'ampio regno di Web3. Con un occhio attento alle tendenze e alle tecnologie emergenti, offre una copertura completa per informare e coinvolgere i lettori nel panorama in continua evoluzione della finanza digitale.



