Google kündigt eine KI-Gestenerkennung an, um in Echtzeit mit dem Web zu interagieren
In Kürze
Google hat Airfinger angekündigt, ein KI-gestütztes Gestenerkennungssystem, das es Benutzern ermöglicht, mit Handgesten in Echtzeit mit dem Internet zu interagieren.
Es verwendet eine Kombination aus Computer Vision und maschinellem Lernen, um Handgesten genau zu erkennen, wodurch es erschwinglicher und für ein breiteres Spektrum von Benutzern zugänglich wird.
Airfinger ist derzeit in der Lage, sieben verschiedene Gesten zu erkennen, aber Google arbeitet bereits daran, sein Repertoire zu erweitern.
Google hat ein neues KI-gestütztes Gestenerkennungssystem angekündigt, mit dem Benutzer in Echtzeit nur mit Handgesten mit dem Internet interagieren können. Das System mit dem Namen Airfinger befindet sich noch in einer frühen Entwicklungsphase, hat aber das Potenzial, die Art und Weise, wie wir mit unseren Geräten interagieren, zu revolutionieren.
Airfinger verwendet eine Kombination aus Computer Vision und maschinellem Lernen, um genau zu sein Handgesten erkennen, wodurch es möglich ist, auf Websites zu navigieren, Spiele zu spielen und Smart-Home-Geräte zu steuern, ohne jemals einen Bildschirm oder eine Tastatur zu berühren. Diese Technologie könnte auch erhebliche Auswirkungen auf die Zugänglichkeit haben, da sie Menschen mit Behinderungen ermöglicht, mobile Geräte auf neue Weise zu nutzen.
Airfinger nutzt das gleiche Grundprinzip wie andere Gestenerkennungssysteme, etwa Microsoft Kinect oder der Leap Motion Controller. Anstatt jedoch eine dedizierte Hardware zu verwenden, verwendet Airfinger die nach vorne gerichtete Kamera eines Smartphones oder Tablets. Dies macht es viel erschwinglicher und für ein breiteres Spektrum von Benutzern zugänglich. Die Verwendung der Frontkamera von Airfinger auf einem Smartphone oder Tablet bedeutet auch, dass sie unterwegs verwendet werden kann, was sie ideal für Präsentationen oder Besprechungen macht, bei denen ein herkömmliches Gestenerkennungssystem möglicherweise nicht verfügbar oder praktisch ist. Darüber hinaus wird die Software ständig aktualisiert, um ihre Genauigkeit zu verbessern und das Angebot an kompatiblen Geräten zu erweitern.
Im Moment kann Airfinger nur sieben verschiedene Gesten erkennen: 👍, 👎, ✌️, ☝️, ✊, 👋 und 🤟. Allerdings arbeitet Google bereits daran, sein Repertoire zu erweitern. Das Unternehmen arbeitet auch an der Verbesserung der Genauigkeit des Systems sowie seiner Fähigkeit, bei schlechten Lichtverhältnissen zu arbeiten. Googles Ziel ist es, Airfinger in die Lage zu versetzen, komplexere Gesten und schließlich Gebärdensprache zu erkennen. Dies würde Menschen mit Behinderungen, die auf die Gebärdensprache als primäres Kommunikationsmittel angewiesen sind, großen Nutzen bringen.
Mediapipe kann solche Gesten mit dem Standard-Trainingsmodell erkennen:
- Geschlossene Faust (
Closed_Fist
) - Offene Handfläche (
Open_Palm
) - Nach oben zeigend (
Pointing_Up
) - Daumen runter (
Thumb_Down
) - Daumen hoch (
Thumb_Up
) - Sieg (
Victory
) - Liebe (
ILoveYou
)
Google hat es der Öffentlichkeit zugänglich gemacht GitHub. Die Tatsache, dass das F&E-Team des Unternehmens bereits daran arbeitet, deutet jedoch darauf hin, dass dies eine Priorität für Google ist. Mit etwas Glück wird Airfinger in naher Zukunft auf Geräten eingeführt.
Lesen Sie mehr über KI:
Haftungsausschluss
Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.
Über den Autor
Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein.
Weitere ArtikelDamir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein.