January 18, 2023

Microsoft ได้เปิดตัวโมเดลการแพร่กระจายที่สามารถสร้างอวาตาร์ 3 มิติจากภาพถ่ายบุคคลเดียว

เผยแพร่: 18 มกราคม 2023 เวลา 1:00 น. อัปเดต: 18 มกราคม 2023 เวลา 11:09 น.

ในบทสรุป

ภาพ 2 มิติของใบหน้าบุคคลสามารถใช้สร้างอวาตาร์ 3 มิติได้โดยใช้เทคนิคการเรียนรู้ของเครื่องกระจายอวาตาร์ 3 มิติ

สามารถใช้เพื่อให้มุมมอง 3 มิติที่สมจริงของบุคคลสำหรับการเล่นเกมหรือการใช้งานอื่นๆ หรือเพื่อให้ประสบการณ์เสมือนจริง (VR) หรือความเป็นจริงเสริม (AR)

3D Avatar Diffusion เป็นอัลกอริธึมการเรียนรู้ของเครื่องที่สามารถถ่ายภาพ 2 มิติของใบหน้ามนุษย์และสร้างภาพสามมิติ (3D) ได้ อวตารสามารถใช้เพื่อสร้างประสบการณ์เสมือนจริง (VR) หรือความเป็นจริงเสริม (AR) หรือเพื่อให้มุมมอง 3 มิติที่เหมือนจริงของบุคคลสำหรับการเล่นเกมหรือวัตถุประสงค์อื่นๆ

แบบจำลองการแพร่กระจายคือ พัฒนา โดยทีมนักวิจัยของ Microsoft Research และได้อธิบายไว้ในบทความที่ตีพิมพ์ในวารสาร arXiv.

Microsoft ได้เปิดตัวโมเดลการแพร่กระจายที่สามารถสร้างอวาตาร์ 3 มิติจากภาพถ่ายบุคคลเดียว

การแพร่กระจายของอวาตาร์ 3 มิติขึ้นอยู่กับประเภทของอัลกอริทึมการเรียนรู้ของเครื่องที่เรียกว่าแบบจำลองการแพร่กระจาย แบบจำลองการแพร่กระจายเป็นแบบจำลองเชิงกำเนิด ซึ่งหมายความว่าสามารถสร้างข้อมูลใหม่ที่คล้ายกับข้อมูลการฝึกอบรม แบบจำลองการแพร่กระจาย เคยใช้มาก่อนเพื่อสร้างภาพ 3 มิติจากภาพ 2 มิติ แต่ ADM เป็นแบบจำลองการแพร่กระจายแรกที่สามารถสร้างอวาตาร์ 3 มิติที่เหมือนจริงจากภาพ 2 มิติภาพเดียว

ในการฝึกโมเดล นักวิจัยใช้ชุดข้อมูลโมเดลใบหน้า 200,000 มิติกว่า 3 โมเดล ชุดข้อมูลประกอบด้วยใบหน้าที่หลากหลายซึ่งมีโทนสีผิว ทรงผม และลักษณะใบหน้าที่แตกต่างกัน จากนั้น ADM ก็สามารถเรียนรู้ความสัมพันธ์ระหว่างภาพ 2 มิติกับโมเดลใบหน้า 3 มิติ และสร้างอวาตาร์ 3 มิติที่เหมือนจริงจากภาพ 2 มิติภาพเดียวได้

โมเดลสามารถใช้เพื่อสร้างภาพแทนตัวจากภาพถ่ายที่ถ่ายจากมุมอื่นได้

สำหรับอวาตาร์ 3 มิติส่วนบุคคล แบบจำลองของ Rodin นำเสนอการจัดการด้วยข้อความนำทาง การแก้ไขภาษาธรรมชาติเป็นวิธีที่ง่ายในการเปลี่ยนคุณสมบัติต่างๆ ของอวาตาร์ 3 มิติ

การศึกษานี้เสนอแบบจำลองกำเนิด 3 มิติที่สร้างอวตารดิจิทัล 3 มิติโดยอัตโนมัติซึ่งแสดงเป็นฟิลด์ความกระจ่างใสของประสาทโดยใช้แบบจำลองการแพร่กระจาย เนื่องจากข้อกำหนดห้ามใช้หน่วยความจำและการประมวลผลที่เกี่ยวข้องกับ 3D การสร้างคุณสมบัติที่หลากหลายที่จำเป็นสำหรับอวาตาร์คุณภาพสูงจึงเป็นปัญหาใหญ่ นักพัฒนาแนะนำให้เปิดตัวเครือข่ายการแพร่กระจาย (Rodin) เพื่อแก้ไขปัญหานี้

ในแง่ของเพศ อายุ เชื้อชาติ การแสดงออก เครื่องประดับบนใบหน้า ฯลฯ นางแบบแสดงให้เห็นถึงความหลากหลายที่โดดเด่น...

เครือข่ายนี้นำเสนอแผนที่คุณลักษณะ 2 มิติจำนวนมากของฟิลด์การแผ่รังสีของระบบประสาทในระนาบคุณลักษณะ 2 มิติเดียว โดยที่แบบจำลองจะดำเนินการเผยแพร่ 3D-aware โมเดล Rodin ใช้ 3D-aware Convolution ซึ่งเข้าร่วมกับฟีเจอร์ที่ฉายในระนาบฟีเจอร์ 2D ตามความสัมพันธ์ดั้งเดิมในแบบ 3D เพื่อให้ประสิทธิภาพการคำนวณที่จำเป็นมากในขณะที่ยังคงความสมบูรณ์ของการแพร่กระจายในแบบ 3 มิติ

อ่านเพิ่มเติมเกี่ยวกับ AI:

คีย์เวิร์ด:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต

บทความอื่น ๆ

ดาเมียร์ ยาลอฟ