Google ogłasza rozpoznawanie gestów AI do interakcji z Internetem w czasie rzeczywistym
W skrócie
Google ogłosił Airfinger, oparty na sztucznej inteligencji system rozpoznawania gestów, który pozwoli użytkownikom na interakcję z siecią w czasie rzeczywistym za pomocą gestów dłoni.
Wykorzystuje połączenie wizji komputerowej i uczenia maszynowego do dokładnego rozpoznawania gestów dłoni, dzięki czemu jest bardziej przystępny cenowo i dostępny dla szerszego grona użytkowników.
Airfinger jest obecnie w stanie rozpoznać siedem różnych gestów, ale Google już pracuje nad rozszerzeniem swojego repertuaru.
Google ogłosiło nowy system rozpoznawania gestów oparty na sztucznej inteligencji, który pozwoli użytkownikom na interakcję z siecią w czasie rzeczywistym za pomocą gestów dłoni. System o nazwie Airfinger jest wciąż na wczesnym etapie rozwoju, ale może zrewolucjonizować sposób interakcji z naszymi urządzeniami.
Airfinger wykorzystuje połączenie wizji komputerowej i uczenia maszynowego, aby dokładnie rozpoznawać gesty rąk, umożliwiając poruszanie się po stronach internetowych, granie w gry i sterowanie inteligentnymi urządzeniami domowymi bez dotykania ekranu lub klawiatury. Technologia ta może mieć również znaczący wpływ na dostępność, umożliwiając osobom niepełnosprawnym korzystanie z urządzeń mobilnych w nowy sposób.
Airfinger wykorzystuje tę samą podstawową zasadę, co inne systemy rozpoznawania gestów, takie jak Microsoft Kinect lub Leap Motion Controller. Jednak zamiast używać dedykowanego sprzętu, Airfinger używa przedniego aparatu w smartfonie lub tablecie. Dzięki temu jest znacznie bardziej przystępny cenowo i dostępny dla szerszego grona użytkowników. Wykorzystanie przez Airfinger przedniego aparatu w smartfonie lub tablecie oznacza również, że może być używany w podróży, dzięki czemu idealnie nadaje się do prezentacji lub spotkań, w których tradycyjny system rozpoznawania gestów może być niedostępny lub niepraktyczny. Dodatkowo oprogramowanie jest stale aktualizowane, aby poprawić jego dokładność i rozszerzyć zakres kompatybilnych urządzeń.
W tej chwili Airfinger jest w stanie rozpoznać tylko siedem różnych gestów: 👍, 👎, ✌️, ☝️, ✊, 👋 i 🤟. Google już jednak pracuje nad poszerzeniem swojego repertuaru. Firma pracuje również nad poprawą dokładności systemu, a także jego zdolności do pracy w warunkach słabego oświetlenia. Celem Google jest sprawienie, by Airfinger był w stanie rozpoznawać bardziej złożone gesty i ostatecznie język migowy. Byłoby to bardzo korzystne dla osób niepełnosprawnych, dla których język migowy jest podstawowym środkiem komunikacji.
Mediapipe może rozpoznawać takie gesty za pomocą domyślnego modelu szkoleniowego:
- zaciśnięta pięść (
Closed_Fist
) - Otwarta dłoń (
Open_Palm
) - Wskazując w górę (
Pointing_Up
) - Kciuk w dół (
Thumb_Down
) - Kciuki w górę (
Thumb_Up
) - Zwycięstwo (
Victory
) - Miłość (
ILoveYou
)
Google udostępnił go publicznie w dniu GitHub. Jednak fakt, że trwają już nad nim prace zespołu badawczo-rozwojowego firmy sugeruje, że jest to priorytet dla Google. Przy odrobinie szczęścia zobaczymy, jak Airfinger zostanie wprowadzony na urządzenia w najbliższej przyszłości.
Przeczytaj więcej o sztucznej inteligencji:
Odpowiedzialność
Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.
O autorze
Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym.
Więcej artykułówDamir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym.