Η Google ανακοινώνει ένα AI Gesture Recognizer για αλληλεπίδραση με τον Ιστό σε πραγματικό χρόνο
Εν συντομία
Η Google ανακοίνωσε το Airfinger, ένα σύστημα αναγνώρισης χειρονομιών με τεχνητή νοημοσύνη που θα επιτρέπει στους χρήστες να αλληλεπιδρούν με τον ιστό σε πραγματικό χρόνο χρησιμοποιώντας χειρονομίες.
Χρησιμοποιεί έναν συνδυασμό όρασης υπολογιστή και μηχανικής μάθησης για να αναγνωρίζει με ακρίβεια τις χειρονομίες, καθιστώντας το πιο προσιτό και προσβάσιμο σε ένα ευρύτερο φάσμα χρηστών.
Το Airfinger είναι επί του παρόντος ικανό να αναγνωρίσει επτά διαφορετικές χειρονομίες, αλλά η Google εργάζεται ήδη για να επεκτείνει το ρεπερτόριό της.
Η Google ανακοίνωσε ένα νέο σύστημα αναγνώρισης χειρονομιών με τεχνητή νοημοσύνη που θα επιτρέπει στους χρήστες να αλληλεπιδρούν με τον Ιστό σε πραγματικό χρόνο χρησιμοποιώντας μόνο χειρονομίες. Το σύστημα, που ονομάζεται Airfinger, βρίσκεται ακόμη σε πρώιμο στάδιο ανάπτυξης, αλλά έχει τη δυνατότητα να φέρει επανάσταση στον τρόπο που αλληλεπιδρούμε με τις συσκευές μας.
Το Airfinger χρησιμοποιεί έναν συνδυασμό όρασης υπολογιστή και μηχανικής μάθησης για με ακρίβεια αναγνωρίζουν τις χειρονομίες, καθιστώντας δυνατή την πλοήγηση σε ιστότοπους, την αναπαραγωγή παιχνιδιών και τον έλεγχο έξυπνων οικιακών συσκευών χωρίς να αγγίζετε ποτέ οθόνη ή πληκτρολόγιο. Αυτή η τεχνολογία θα μπορούσε επίσης να έχει σημαντικές επιπτώσεις στην προσβασιμότητα, επιτρέποντας στα άτομα με αναπηρίες να χρησιμοποιούν κινητές συσκευές με νέους τρόπους.
Διαβάστε περισσότερα: Οι 10 καλύτερες δωρεάν εφαρμογές AI Avatar 2023 (iOS και Android) |
Το Airfinger χρησιμοποιεί την ίδια βασική αρχή με άλλα συστήματα αναγνώρισης χειρονομιών, όπως το Microsoft Kinect ή το Leap Motion Controller. Ωστόσο, αντί να χρησιμοποιεί ένα αποκλειστικό κομμάτι υλικού, το Airfinger χρησιμοποιεί την μπροστινή κάμερα σε smartphone ή tablet. Αυτό το καθιστά πολύ πιο προσιτό και προσβάσιμο σε ένα ευρύτερο φάσμα χρηστών. Η χρήση της μπροστινής κάμερας από το Airfinger σε smartphone ή tablet σημαίνει επίσης ότι μπορεί να χρησιμοποιηθεί εν κινήσει, καθιστώντας το ιδανικό για παρουσιάσεις ή συναντήσεις όπου ένα παραδοσιακό σύστημα αναγνώρισης χειρονομιών μπορεί να μην είναι διαθέσιμο ή πρακτικό. Επιπλέον, το λογισμικό ενημερώνεται συνεχώς για τη βελτίωση της ακρίβειάς του και την επέκταση της γκάμα των συμβατών συσκευών του.
Προς το παρόν, το Airfinger μπορεί να αναγνωρίσει μόνο επτά διαφορετικές χειρονομίες: 👍, 👎, ✌️, ☝️, ✊, 👋 και 🤟. Ωστόσο, η Google εργάζεται ήδη για την επέκταση του ρεπερτορίου της. Η εταιρεία εργάζεται επίσης για τη βελτίωση της ακρίβειας του συστήματος, καθώς και της ικανότητάς του να λειτουργεί σε συνθήκες χαμηλού φωτισμού. Στόχος της Google είναι να κάνει το Airfinger ικανό να αναγνωρίζει πιο σύνθετες χειρονομίες και, τελικά, τη νοηματική γλώσσα. Αυτό θα ωφελούσε πολύ τα άτομα με αναπηρίες που βασίζονται στη νοηματική γλώσσα ως το κύριο μέσο επικοινωνίας τους.
Το Mediapipe μπορεί να αναγνωρίσει τέτοιες χειρονομίες με το προεπιλεγμένο μοντέλο εκπαίδευσης:
- κλειστή γροθιά (
Closed_Fist
) - ανοιχτή παλάμη (
Open_Palm
) - δείχνοντας προς τα πάνω (
Pointing_Up
) - Αποδοκιμάζω (
Thumb_Down
) - Μπράβο (
Thumb_Up
) - νίκη (
Victory
) - Αγάπη (
ILoveYou
)
Η Google το έχει καταστήσει διαθέσιμο στο κοινό στις GitHub. Ωστόσο, το γεγονός ότι ήδη εργάζεται από την ομάδα Ε&Α της εταιρείας υποδηλώνει ότι αποτελεί προτεραιότητα για την Google. Με κάθε τύχη, θα δούμε το Airfinger να κυκλοφορεί σε συσκευές στο εγγύς μέλλον.
Διαβάστε περισσότερα για το AI:
Αποποίηση ευθυνών
Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.
Σχετικά με το Συγγραφέας
Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου.
Περισσότερα άρθραΟ Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου.