Google ประกาศตัวจดจำท่าทาง AI เพื่อโต้ตอบกับเว็บแบบเรียลไทม์
ในบทสรุป
Google ได้ประกาศ Airfinger ระบบจดจำท่าทางที่ขับเคลื่อนด้วย AI ซึ่งจะช่วยให้ผู้ใช้สามารถโต้ตอบกับเว็บได้แบบเรียลไทม์โดยใช้ท่าทางมือ
ใช้การผสมผสานระหว่างการมองเห็นของคอมพิวเตอร์และการเรียนรู้ของเครื่องเพื่อจดจำท่าทางของมือได้อย่างแม่นยำ ทำให้มีราคาย่อมเยาและเข้าถึงได้สำหรับผู้ใช้ในวงกว้าง
ปัจจุบัน Airfinger สามารถจดจำท่าทางที่แตกต่างกันได้ XNUMX แบบ แต่ Google กำลังดำเนินการเพื่อขยายความสามารถของตน
Google ได้ประกาศระบบจดจำท่าทางแบบใหม่ที่ขับเคลื่อนด้วย AI ซึ่งจะช่วยให้ผู้ใช้สามารถโต้ตอบกับเว็บได้แบบเรียลไทม์โดยใช้เพียงท่าทางมือเท่านั้น ระบบที่เรียกว่า Airfinger ยังอยู่ในช่วงเริ่มต้นของการพัฒนา แต่มีศักยภาพที่จะปฏิวัติวิธีที่เราโต้ตอบกับอุปกรณ์ของเรา
Airfinger ใช้การผสมผสานระหว่างการมองเห็นของคอมพิวเตอร์และการเรียนรู้ของเครื่องอย่างแม่นยำ รับรู้ท่าทางมือทำให้นำทางเว็บไซต์ เล่นเกม และควบคุมอุปกรณ์สมาร์ทโฮมได้โดยไม่ต้องสัมผัสหน้าจอหรือแป้นพิมพ์เลย เทคโนโลยีนี้อาจมีนัยสำคัญสำหรับการเข้าถึง ทำให้ผู้พิการสามารถใช้อุปกรณ์เคลื่อนที่ในรูปแบบใหม่ๆ ได้
อ่านเพิ่มเติม: 10 สุดยอดแอพ AI Avatar ฟรีประจำปี 2023 (iOS และ Android) |
Airfinger ใช้หลักการพื้นฐานเดียวกันกับระบบการรู้จำท่าทางอื่นๆ เช่น Microsoft Kinect หรือ Leap Motion Controller อย่างไรก็ตาม แทนที่จะใช้ฮาร์ดแวร์เฉพาะ Airfinger จะใช้กล้องหน้าบนสมาร์ทโฟนหรือแท็บเล็ต สิ่งนี้ทำให้มีราคาไม่แพงมากและเข้าถึงได้สำหรับผู้ใช้ในวงกว้าง การใช้กล้องด้านหน้าของ Airfinger บนสมาร์ทโฟนหรือแท็บเล็ตยังหมายความว่าสามารถใช้ในขณะเดินทางได้ ทำให้เหมาะอย่างยิ่งสำหรับการนำเสนอหรือการประชุมที่ระบบจดจำท่าทางแบบดั้งเดิมอาจไม่สามารถใช้ได้หรือใช้งานได้จริง นอกจากนี้ ซอฟต์แวร์ยังได้รับการปรับปรุงอย่างต่อเนื่องเพื่อปรับปรุงความแม่นยำและขยายช่วงของอุปกรณ์ที่เข้ากันได้
ในขณะนี้ Airfinger สามารถจดจำท่าทางที่แตกต่างกันได้เพียงเจ็ดท่าทาง: 👍, 👎, ✌️, ☝️, ✊, 👋 และ 🤟 อย่างไรก็ตาม Google กำลังดำเนินการเพื่อขยายรายการของตน บริษัทกำลังดำเนินการปรับปรุงความแม่นยำของระบบ รวมถึงความสามารถในการทำงานในสภาพแสงน้อย เป้าหมายของ Google คือการทำให้ Airfinger สามารถจดจำท่าทางที่ซับซ้อนมากขึ้น และสุดท้ายคือภาษามือ สิ่งนี้จะเป็นประโยชน์อย่างมากต่อผู้พิการที่ใช้ภาษามือเป็นวิธีหลักในการสื่อสาร
Mediapipe สามารถรับรู้ท่าทางดังกล่าวด้วยรูปแบบการฝึกเริ่มต้น:
- กำปั้นปิด (
Closed_Fist
) - เปิดฝ่ามือ (
Open_Palm
) - ชี้ขึ้น (
Pointing_Up
) - ยกนิ้วให้ (
Thumb_Down
) - ยกนิ้วให้ (
Thumb_Up
) - ชัยชนะ (
Victory
) - รัก (
ILoveYou
)
Google ได้เผยแพร่ต่อสาธารณะแล้ว GitHub. อย่างไรก็ตาม ความจริงที่ว่าทีม R&D ของบริษัทกำลังดำเนินการอยู่แล้ว แสดงให้เห็นว่า Google ให้ความสำคัญกับสิ่งนี้เป็นลำดับแรก หากโชคดี เราจะได้เห็น Airfinger เปิดตัวสู่อุปกรณ์ต่างๆ ในอนาคตอันใกล้นี้
อ่านเพิ่มเติมเกี่ยวกับ AI:
ข้อจำกัดความรับผิดชอบ
สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า
เกี่ยวกับผู้เขียน
Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต
บทความอื่น ๆDamir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต