Google та Boston Dynamics інтегрують моделі робототехніки Gemini у Spot для покращеного сприйняття та виконання завдань
Коротко
Google та Boston Dynamics інтегрують Gemini AI у робота Spot, що дозволяє керувати природною мовою, розпізнавати об'єкти та виконувати завдання, розвиваючи адаптивну робототехніку та системи взаємодії людини та машини.

Технологічна компанія Google оголосила про партнерство з Бостон Динаміка інтегрувати свої втілені моделі мислення Gemini Robotics у чотириногого робота Spot, що стане кроком уперед у застосуванні штучного інтелекту в реальній робототехніці. Ця співпраця дозволяє роботу краще інтерпретувати навколишнє середовище, ідентифікувати об'єкти та виконувати завдання на основі інструкцій природною мовою, а не покладатися виключно на попередньо запрограмовані процедури.
Інтеграція базується на експериментальній роботі, проведеній під час внутрішнього хакатону 2025 року, де розробники досліджували, як великі мовні моделі та системи візуального мислення можуть покращити автономність Spot. Використовуючи Gemini Robotics, робот може обробляти візуальний вхід зі своїх камер та перетворювати високорівневі інструкції, такі як організація об'єктів у кімнаті, на скоординовані фізичні дії.
На відміну від традиційного програмування робототехніки, яке часто залежить від жорсткої покрокової логіки, система пропонує гнучкіший інтерфейс, заснований на розмовних підказках. Розробники створили проміжний програмний рівень, використовуючи комплект розробки програмного забезпечення Spot, що дозволяє моделям Gemini взаємодіяти з інтерфейсом прикладного програмування робота. Цей фреймворк дозволяє штучному інтелекту вибирати з... defiпотрібний набір дій, включаючи навігацію, виявлення об'єктів, захоплення зображень, захоплення та розміщення.
Інтерфейси природної мови змінюють виконання робототехнічних завдань
У практичних демонстраціях система продемонструвала здатність інтерпретувати загальні інструкції та адаптуватися до динамічного середовища. Наприклад, коли їй доручали впорядковувати предмети, модель штучного інтелекту аналізувала візуальні дані, визначала відповідні об'єкти та керувала роботом послідовністю дій. Зворотній зв'язок від робота, такий як виконання завдання або фізичні обмеження, враховувався в режимі реального часу, що дозволяло системі коригувати свою поведінку без ручного втручання.
Цей підхід підтримує операційні межі, обмежуючи ШІ попереднімиdefiвбудовані можливості в API робота, що забезпечує передбачувану та контрольовану продуктивність. Така конструкція поєднує адаптивність з безпекою, що є ключовим фактором для розгортання штучного інтелекту у фізичних системах.
Партнерство також підкреслює потенційне підвищення ефективності для розробників. Зменшуючи потребу в багатому ручному кодуванні, інтерфейси природної мови дозволяють інженерам зосередитися на defiвизначення цілей, а не програмування кожної послідовності дій. Цей зсув може пришвидшити розвиток робототехнічних застосувань у таких галузях, як виробництво, інспекція та логістика.
Хоча реалізація залишається експериментальною, демонстрація відображає ширші тенденції у фізичному штучному інтелекті, де базові моделі все частіше використовуються для покращення машинного сприйняття та прийняття рішень. Обидві компанії зазначили, що ведуться подальші розробки, включаючи подальшу інтеграцію систем на базі Gemini в робототехнічні платформи.
Ця співпраця передбачає перехід до більш інтуїтивної взаємодії людини та машини, де складна робота може керуватися за допомогою спрощених вхідних даних. Оскільки моделі штучного інтелекту продовжують розвиватися, такі інтеграції можуть розширити функціональний обсяг автономних систем, одночасно зменшуючи технічні бар'єри для їх розгортання.
відмова
Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.
про автора
Аліса, відданий журналіст на MPost, спеціалізується на криптовалюті, штучному інтелекті, інвестиціях та широкій сфері Web3. З гострим поглядом на нові тенденції та технології, вона надає всебічне висвітлення, щоб інформувати та залучати читачів до постійно змінюваного ландшафту цифрових фінансів.
інші статті
Аліса, відданий журналіст на MPost, спеціалізується на криптовалюті, штучному інтелекті, інвестиціях та широкій сфері Web3. З гострим поглядом на нові тенденції та технології, вона надає всебічне висвітлення, щоб інформувати та залучати читачів до постійно змінюваного ландшафту цифрових фінансів.



