Raport aktualności Technologia
14 marca 2023 r.

Google ogłasza rozpoznawanie gestów AI do interakcji z Internetem w czasie rzeczywistym

W skrócie

Google ogłosił Airfinger, oparty na sztucznej inteligencji system rozpoznawania gestów, który pozwoli użytkownikom na interakcję z siecią w czasie rzeczywistym za pomocą gestów dłoni.

Wykorzystuje połączenie wizji komputerowej i uczenia maszynowego do dokładnego rozpoznawania gestów dłoni, dzięki czemu jest bardziej przystępny cenowo i dostępny dla szerszego grona użytkowników.

Airfinger jest obecnie w stanie rozpoznać siedem różnych gestów, ale Google już pracuje nad rozszerzeniem swojego repertuaru.

Google ogłosiło nowy system rozpoznawania gestów oparty na sztucznej inteligencji, który pozwoli użytkownikom na interakcję z siecią w czasie rzeczywistym za pomocą gestów dłoni. System o nazwie Airfinger jest wciąż na wczesnym etapie rozwoju, ale może zrewolucjonizować sposób interakcji z naszymi urządzeniami.

Airfinger wykorzystuje połączenie wizji komputerowej i uczenia maszynowego, aby dokładnie rozpoznawać gesty rąk, umożliwiając poruszanie się po stronach internetowych, granie w gry i sterowanie inteligentnymi urządzeniami domowymi bez dotykania ekranu lub klawiatury. Technologia ta może mieć również znaczący wpływ na dostępność, umożliwiając osobom niepełnosprawnym korzystanie z urządzeń mobilnych w nowy sposób.

Google ogłosił rozpoznawanie gestów AI do interakcji z Internetem w czasie rzeczywistym
@Midjourney / redaktor pięć gwiazdek#2326
Czytaj więcej: 10 najlepszych darmowych aplikacji AI Avatar 2023 (iOS i Android)

Airfinger wykorzystuje tę samą podstawową zasadę, co inne systemy rozpoznawania gestów, takie jak Microsoft Kinect lub Leap Motion Controller. Jednak zamiast używać dedykowanego sprzętu, Airfinger używa przedniego aparatu w smartfonie lub tablecie. Dzięki temu jest znacznie bardziej przystępny cenowo i dostępny dla szerszego grona użytkowników. Wykorzystanie przez Airfinger przedniego aparatu w smartfonie lub tablecie oznacza również, że może być używany w podróży, dzięki czemu idealnie nadaje się do prezentacji lub spotkań, w których tradycyjny system rozpoznawania gestów może być niedostępny lub niepraktyczny. Dodatkowo oprogramowanie jest stale aktualizowane, aby poprawić jego dokładność i rozszerzyć zakres kompatybilnych urządzeń.

W tej chwili Airfinger jest w stanie rozpoznać tylko siedem różnych gestów: 👍, 👎, ✌️, ☝️, ✊, 👋 i 🤟. Google już jednak pracuje nad poszerzeniem swojego repertuaru. Firma pracuje również nad poprawą dokładności systemu, a także jego zdolności do pracy w warunkach słabego oświetlenia. Celem Google jest sprawienie, by Airfinger był w stanie rozpoznawać bardziej złożone gesty i ostatecznie język migowy. Byłoby to bardzo korzystne dla osób niepełnosprawnych, dla których język migowy jest podstawowym środkiem komunikacji.

Mediapipe może rozpoznawać takie gesty za pomocą domyślnego modelu szkoleniowego

Mediapipe może rozpoznawać takie gesty za pomocą domyślnego modelu szkoleniowego:

  • zaciśnięta pięść (Closed_Fist)
  • Otwarta dłoń (Open_Palm)
  • Wskazując w górę (Pointing_Up)
  • Kciuk w dół (Thumb_Down)
  • Kciuki w górę (Thumb_Up)
  • Zwycięstwo (Victory)
  • Miłość (ILoveYou)

Google udostępnił go publicznie w dniu GitHub. Jednak fakt, że trwają już nad nim prace zespołu badawczo-rozwojowego firmy sugeruje, że jest to priorytet dla Google. Przy odrobinie szczęścia zobaczymy, jak Airfinger zostanie wprowadzony na urządzenia w najbliższej przyszłości.

Przeczytaj więcej o sztucznej inteligencji:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Więcej artykułów
Damir Jałałow
Damir Jałałow

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Apetyt instytucjonalny na ETFy Bitcoin rośnie w obliczu zmienności

Ujawnienia zawarte w zgłoszeniach 13F ujawniają, że znaczący inwestorzy instytucjonalni parają się funduszami ETF Bitcoin, co podkreśla rosnącą akceptację…

Dowiedz się więcej

Nadchodzi dzień wyroku: los CZ wisi na włosku, gdy amerykański sąd rozpatruje skargę Departamentu Sprawiedliwości

Changpeng Zhao stanie dziś przed amerykańskim sądem w Seattle wyrokiem skazującym.

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
Lisk oficjalnie przechodzi na warstwę 2 Ethereum i prezentuje wersję Core 4.0.6
Raport aktualności Technologia
Lisk oficjalnie przechodzi na warstwę 2 Ethereum i prezentuje wersję Core 4.0.6
8 maja 2024 r.
Nowe monety memów z maja 2024 r.: 7 wyborów dla fanów kryptowalut
Digest rynki Technologia
Nowe monety memów z maja 2024 r.: 7 wyborów dla fanów kryptowalut
8 maja 2024 r.
Synternet integruje Peaq ze swoją warstwą danych, aby zasilać sterowane zdarzeniami aplikacje DApp z danymi DePIN w czasie rzeczywistym
Biznes Raport aktualności Technologia
Synternet integruje Peaq ze swoją warstwą danych, aby zasilać sterowane zdarzeniami aplikacje DApp z danymi DePIN w czasie rzeczywistym
8 maja 2024 r.
Masowe operacje wydobycia kryptowalut w Iranie stanowią bezpośrednie zagrożenie dla bezpieczeństwa narodowego USA – senatorzy wzywają rząd do natychmiastowych działań
rynki Historie i recenzje Technologia
Masowe operacje wydobycia kryptowalut w Iranie stanowią bezpośrednie zagrożenie dla bezpieczeństwa narodowego USA – senatorzy wzywają rząd do natychmiastowych działań
8 maja 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.