Google och Boston Dynamics integrerar Gemini-robotmodeller i Spot för avancerad uppfattning och uppgiftsutförande
I korthet
Google och Boston Dynamics integrerar Gemini AI i Spot-roboten, vilket möjliggör kontroll av naturligt språk, objektigenkänning och utförande av uppgifter, samt främjar adaptiv robotik och system för interaktion mellan människa och maskin.

Teknologiföretag Google meddelade ett partnerskap med Boston Dynamics att integrera sina Gemini Robotics förkroppsligade resonemangsmodeller i den fyrfotade roboten Spot, vilket markerar ett steg framåt i tillämpningen av artificiell intelligens inom verklig robotik. Samarbetet gör det möjligt för roboten att bättre tolka sin omgivning, identifiera objekt och utföra uppgifter baserat på instruktioner på naturligt språk, snarare än att enbart förlita sig på förprogrammerade rutiner.
Integrationen bygger på experimentellt arbete som utfördes under ett internt hackathon 2025, där utvecklare utforskade hur stora språkmodeller och visuella resonemangssystem kunde förbättra Spots autonomi. Genom att utnyttja Gemini Robotics kan roboten bearbeta visuell input från sina kameror och översätta instruktioner på hög nivå – som att organisera objekt i ett rum – till koordinerade fysiska handlingar.
Till skillnad från traditionell robotprogrammering, som ofta är beroende av stel, stegvis logik, introducerar systemet ett mer flexibelt gränssnitt baserat på konversationsuppmaningar. Utvecklare skapade ett mellanliggande programvarulager med hjälp av Spots programvaruutvecklingskit, vilket gör det möjligt för Gemini-modeller att kommunicera med robotens applikationsprogrammeringsgränssnitt. Detta ramverk gör det möjligt för AI:n att välja från en defien nedsatt uppsättning åtgärder, inklusive navigering, objektdetektering, bildtagning, gripande och placering.
Naturliga språkgränssnitt omformar robotisk uppgiftskörning
I praktiska demonstrationer visade systemet förmågan att tolka allmänna instruktioner och anpassa sig till dynamiska miljöer. Till exempel, när AI-modellen fick i uppgift att organisera föremål, analyserade den visuell data, identifierade relevanta objekt och styrde roboten genom en sekvens av handlingar. Feedback från roboten – såsom slutförda uppgifter eller fysiska begränsningar – införlivades i realtid, vilket gjorde det möjligt för systemet att justera sitt beteende utan manuell inblandning.
Tillvägagångssättet upprätthåller operativa gränser genom att begränsa AI:n till predefiavancerade funktioner inom robotens API, vilket säkerställer förutsägbar och kontrollerad prestanda. Denna design balanserar anpassningsförmåga med säkerhet, en viktig faktor vid implementering av AI i fysiska system.
Partnerskapet belyser också potentiella effektivitetsvinster för utvecklare. Genom att minska behovet av omfattande manuell kodning gör gränssnitt med naturligt språk det möjligt för ingenjörer att fokusera på defiatt sätta upp mål snarare än att programmera varje handlingssekvens. Denna förändring skulle kunna påskynda utvecklingen av robotapplikationer inom branscher som tillverkning, inspektion och logistik.
Även om implementeringen fortfarande är experimentell, återspeglar demonstrationen bredare trender inom fysisk AI, där grundläggande modeller i allt högre grad används för att förbättra maskinuppfattning och beslutsfattande. Båda företagen har indikerat att ytterligare utveckling är på gång, inklusive fortsatt integration av Gemini-baserade system i robotplattformar.
Samarbetet föreslår en övergång mot mer intuitiv människa-maskin-interaktion, där komplext robotbeteende kan styras genom förenklade inmatningar. I takt med att AI-modeller fortsätter att utvecklas kan sådana integrationer utöka den funktionella omfattningen av autonoma system samtidigt som de tekniska hindren för deras implementering minskas.
Ansvarsfriskrivning
I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.
Om författaren
Alisa, en engagerad journalist på MPost, specialiserar sig på krypto, AI, investeringar och det expansiva området av Web3. Med ett skarpt öga för nya trender och tekniker levererar hon omfattande täckning för att informera och engagera läsare i det ständigt föränderliga landskapet för digital ekonomi.
fler artiklar
Alisa, en engagerad journalist på MPost, specialiserar sig på krypto, AI, investeringar och det expansiva området av Web3. Med ett skarpt öga för nya trender och tekniker levererar hon omfattande täckning för att informera och engagera läsare i det ständigt föränderliga landskapet för digital ekonomi.



