„Google“ ir „Boston Dynamics“ integruoja „Gemini“ robotikos modelius į „Spot“, kad būtų užtikrintas pažangus suvokimas ir užduočių atlikimas.
Trumpai
„Google“ ir „Boston Dynamics“ integruoja „Gemini“ dirbtinį intelektą į „Spot“ robotą, įgalindamas natūralios kalbos valdymą, objektų atpažinimą ir užduočių vykdymą, taip tobulindamos adaptyviąją robotiką ir žmogaus bei mašinos sąveikos sistemas.

Technologijų įmonė "Google" paskelbė apie partnerystę su Bostono dinamika integruoti savo „Gemini Robotics“ įkūnytus samprotavimo modelius į keturkojį robotą „Spot“, taip žengiant žingsnį dirbtinio intelekto taikymo realaus pasaulio robotikoje link. Šis bendradarbiavimas leidžia robotui geriau interpretuoti aplinką, atpažinti objektus ir atlikti užduotis pagal natūralios kalbos instrukcijas, o ne vien pasikliauti iš anksto užprogramuotomis procedūromis.
Integracija remiasi eksperimentiniu darbu, atliktu 2025 m. vykusio vidinio hakatono metu, kurio metu kūrėjai tyrinėjo, kaip dideli kalbos modeliai ir vizualinio samprotavimo sistemos galėtų padidinti „Spot“ autonomiją. Pasitelkdamas „Gemini Robotics“, robotas gali apdoroti vaizdinę informaciją iš savo kamerų ir paversti aukšto lygio instrukcijas, tokias kaip objektų išdėstymas kambaryje, koordinuotais fiziniais veiksmais.
Skirtingai nuo tradicinio robotų programavimo, kuris dažnai remiasi griežta, žingsnis po žingsnio logika, sistema pristato lankstesnę sąsają, pagrįstą pokalbių užduotimis. Kūrėjai sukūrė tarpinį programinės įrangos sluoksnį, naudodami „Spot“ programinės įrangos kūrimo rinkinį, leidžiantį „Gemini“ modeliams bendrauti su roboto taikomųjų programų programavimo sąsaja. Ši sistema leidžia dirbtiniam intelektui pasirinkti iš defiveiksmų rinkinys, įskaitant navigaciją, objektų aptikimą, vaizdo fiksavimą, sugriebimą ir išdėstymą.
Natūralios kalbos sąsajos keičia robotų užduočių vykdymą
Praktinėse demonstracijose sistema pademonstravo gebėjimą interpretuoti bendrąsias instrukcijas ir prisitaikyti prie dinamiškos aplinkos. Pavyzdžiui, kai dirbtinio intelekto modeliui buvo pavesta organizuoti daiktus, jis analizavo vaizdinius duomenis, atpažino svarbius objektus ir nurodė robotui atlikti veiksmų seką. Roboto grįžtamasis ryšys, pavyzdžiui, užduoties atlikimas ar fiziniai apribojimai, buvo įtraukiamas realiuoju laiku, todėl sistema galėjo koreguoti savo elgesį be rankinio įsikišimo.
Šis metodas išlaiko veiklos ribas, apribodamas dirbtinį intelektą iki išankstinėsdefiintegruotos roboto API galimybės, užtikrinant nuspėjamą ir kontroliuojamą našumą. Ši konstrukcija suderina prisitaikomumą su saugumu – tai pagrindinis aspektas diegiant dirbtinį intelektą fizinėse sistemose.
Partnerystė taip pat pabrėžia galimą kūrėjų efektyvumo padidėjimą. Sumažindamos poreikį intensyviam rankiniam kodavimui, natūralios kalbos sąsajos leidžia inžinieriams sutelkti dėmesį į defitikslų siekimas, o ne kiekvienos veiksmų sekos programavimas. Šis pokytis galėtų paspartinti robotikos taikomųjų programų plėtrą tokiose pramonės šakose kaip gamyba, tikrinimas ir logistika.
Nors diegimas tebėra eksperimentinis, demonstracinė versija atspindi platesnes fizinio dirbtinio intelekto tendencijas, kur pamatiniai modeliai vis dažniau naudojami mašinų suvokimui ir sprendimų priėmimui gerinti. Abi bendrovės nurodė, kad vyksta tolesnė plėtra, įskaitant tolesnę „Gemini“ pagrindu sukurtų sistemų integraciją į robotikos platformas.
Bendradarbiavimas siūlo perėjimą prie intuityvesnės žmogaus ir mašinos sąveikos, kai sudėtingas robotų elgesys gali būti valdomas supaprastintais įvesties duomenimis. Dirbtinio intelekto modeliams toliau tobulėjant, tokios integracijos gali išplėsti autonominių sistemų funkcinę apimtį ir kartu sumažinti technines kliūtis jų diegimui.
Atsakomybės neigimas
Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.
Apie autorių
Alisa, atsidavusi žurnalistė MPost, specializuojasi kriptovaliutų, dirbtinio intelekto, investicijų ir plačios srities srityse Web3. Akylai žvelgdama į naujas tendencijas ir technologijas, ji pateikia išsamią informaciją, kad informuotų ir įtrauktų skaitytojus į nuolat besikeičiančią skaitmeninių finansų aplinką.
Daugiau straipsnių
Alisa, atsidavusi žurnalistė MPost, specializuojasi kriptovaliutų, dirbtinio intelekto, investicijų ir plačios srities srityse Web3. Akylai žvelgdama į naujas tendencijas ir technologijas, ji pateikia išsamią informaciją, kad informuotų ir įtrauktų skaitytojus į nuolat besikeičiančią skaitmeninių finansų aplinką.



