Google anuncia un reconeixement de gestos d'IA per interactuar amb el web en temps real
En breu
Google ha anunciat Airfinger, un sistema de reconeixement de gestos impulsat per IA que permetrà als usuaris interactuar amb la web en temps real mitjançant gestos amb les mans.
Utilitza una combinació de visió per ordinador i aprenentatge automàtic per reconèixer amb precisió els gestos de les mans, fent-lo més assequible i accessible per a un ventall més ampli d'usuaris.
Actualment Airfinger és capaç de reconèixer set gestos diferents, però Google ja està treballant per ampliar el seu repertori.
Google ha anunciat un nou sistema de reconeixement de gestos amb intel·ligència artificial que permetrà als usuaris interactuar amb la web en temps real utilitzant només gestos amb les mans. El sistema, anomenat Airfinger, encara està en fase de desenvolupament inicial, però té el potencial de revolucionar la manera com interactuem amb els nostres dispositius.
Airfinger utilitza una combinació de visió per ordinador i aprenentatge automàtic amb precisió reconèixer els gestos de les mans, que permet navegar per llocs web, jugar i controlar dispositius domèstics intel·ligents sense tocar mai la pantalla o el teclat. Aquesta tecnologia també podria tenir implicacions importants per a l'accessibilitat, permetent a les persones amb discapacitat utilitzar els dispositius mòbils de noves maneres.
Airfinger utilitza el mateix principi bàsic que altres sistemes de reconeixement de gestos, com ara Microsoft Kinect o el Leap Motion Controller. Tanmateix, en comptes d'utilitzar una peça de maquinari dedicada, Airfinger utilitza la càmera frontal en un telèfon intel·ligent o tauleta. Això fa que sigui molt més assequible i accessible per a un ventall més ampli d'usuaris. L'ús que Airfinger fa de la càmera frontal en un telèfon intel·ligent o tauleta també significa que es pot utilitzar des de qualsevol lloc, la qual cosa la fa ideal per a presentacions o reunions on un sistema de reconeixement de gestos tradicional pot no estar disponible o pràctic. A més, el programari s'actualitza constantment per millorar la seva precisió i ampliar la seva gamma de dispositius compatibles.
De moment, Airfinger només és capaç de reconèixer set gestos diferents: 👍, 👎, ✌️, ☝️, ✊, 👋 i 🤟. Tanmateix, Google ja està treballant per ampliar el seu repertori. L'empresa també treballa per millorar la precisió del sistema, així com la seva capacitat de treballar en condicions de poca llum. L'objectiu de Google és fer que Airfinger sigui capaç de reconèixer gestos més complexos i, eventualment, la llengua de signes. Això beneficiaria molt a les persones amb discapacitat que depenen de la llengua de signes com a mitjà de comunicació principal.
Mediapipe pot reconèixer aquests gestos amb el model d'entrenament predeterminat:
- Puny tancat (
Closed_Fist
) - palmell obert (
Open_Palm
) - Apuntant cap amunt (
Pointing_Up
) - Polze cap avall (
Thumb_Down
) - Polzes amunt (
Thumb_Up
) - Victòria (
Victory
) - Amor (
ILoveYou
)
Google l'ha posat a disposició del públic el GitHub. Tanmateix, el fet que l'equip d'R+D de l'empresa ja estigui treballant-hi fa pensar que és una prioritat per a Google. Amb sort, veurem que Airfinger es desplegarà als dispositius en un futur proper.
Llegeix més sobre AI:
renúncia
En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.
About The Autor
Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet.
més articlesDamir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet.