รายงานข่าว เทคโนโลยี
September 19, 2023

Google เปิดตัวไดนามิกของภาพที่สร้างสรรค์ที่เป็นนวัตกรรมใหม่ซึ่งจำลองฉากไดนามิกในภาพนิ่ง

Google ได้เผยโฉมก พลวัตของภาพทั่วไปซึ่งเป็นแนวทางใหม่ที่ช่วยให้เกิดการเปลี่ยนแปลงของ ภาพนิ่งเดียวให้เป็นวิดีโอวนซ้ำอย่างราบรื่น หรือฉากไดนามิกเชิงโต้ตอบที่นำเสนอการใช้งานจริงที่หลากหลาย

Google เปิดตัวไดนามิกของภาพที่สร้างสรรค์ที่เป็นนวัตกรรมใหม่ซึ่งจำลองฉากไดนามิกในภาพนิ่ง

หัวใจสำคัญของเทคโนโลยีบุกเบิกนี้คือการสร้างแบบจำลองพื้นที่ภาพก่อนเกิดไดนามิกของฉาก วัตถุประสงค์คือเพื่อสร้างความเข้าใจที่ครอบคลุมว่าวัตถุและองค์ประกอบภายในภาพอาจมีพฤติกรรมอย่างไรเมื่ออยู่ภายใต้ปฏิสัมพันธ์แบบไดนามิกต่างๆ ความเข้าใจนี้สามารถใช้เพื่อจำลองการตอบสนองของการเปลี่ยนแปลงของวัตถุต่อการโต้ตอบของผู้ใช้ได้อย่างมีประสิทธิภาพ

คุณสมบัติที่สำคัญของเทคโนโลยีนี้คือความสามารถในการสร้างวิดีโอวนซ้ำอย่างราบรื่น ด้วยการใช้ประโยชน์จากพื้นที่ภาพก่อนฉากไดนามิก ระบบของ Google สามารถคาดการณ์และขยายการเคลื่อนไหวขององค์ประกอบภายในภาพ เปลี่ยนให้เป็นวิดีโอวนซ้ำที่น่าติดตามและต่อเนื่อง ฟังก์ชั่นนี้เปิดโอกาสสร้างสรรค์มากมายสำหรับผู้สร้างเนื้อหาและนักออกแบบ

บทความนี้นำเสนอแนวทางการสร้างแบบจำลองพื้นที่ภาพโดยอาศัยไดนามิกของฉาก ซึ่งเรียนรู้จากชุดวิถีการเคลื่อนไหวที่ดึงมาจากลำดับวิดีโอจริงที่มีการเคลื่อนไหวที่เป็นธรรมชาติและสั่นไหว เช่น ต้นไม้ ดอกไม้ เทียน และเสื้อผ้าที่ปลิวไปตามสายลม . โมเดลที่ผ่านการฝึกอบรมใช้กระบวนการสุ่มตัวอย่างการแพร่กระจายที่ประสานความถี่เพื่อคาดการณ์การแสดงการเคลื่อนไหวระยะยาวต่อพิกเซลในโดเมนฟูริเยร์ ซึ่งเรียกว่าพื้นผิวการเคลื่อนที่แบบสุ่มของระบบประสาท การแสดงนี้สามารถแปลงเป็นวิถีการเคลื่อนไหวหนาแน่นที่ครอบคลุมทั้งวิดีโอ

เทคโนโลยีนี้ช่วยให้ผู้ใช้โต้ตอบกับวัตถุภายในภาพนิ่งได้อย่างสมจริง ด้วยการจำลองการตอบสนองของไดนามิกของวัตถุต่อการกระตุ้นของผู้ใช้ ระบบของ Google อนุญาต ประสบการณ์ที่ดื่มด่ำและโต้ตอบได้ ภายในภาพ สิ่งนี้มีศักยภาพที่จะปฏิวัติ ช่องว่าง metaverse และวิธีที่ผู้ใช้มีส่วนร่วมกับเนื้อหาภาพ

การศึกษานี้เป็นการสำรวจการสร้างแบบจำลองกำเนิดก่อนที่จะมีการเคลื่อนไหวของฉากในพื้นที่ภาพ เช่น การเคลื่อนไหวของพิกเซลทั้งหมดในภาพเดียว โมเดลนี้ได้รับการฝึกฝนเกี่ยวกับวิถีการเคลื่อนไหวที่แยกออกมาโดยอัตโนมัติจากคอลเลคชันวิดีโอจริงจำนวนมาก แบบจำลองที่ได้รับการฝึกภายใต้เงื่อนไขของภาพอินพุตจะคาดการณ์พื้นผิวการเคลื่อนไหวแบบสุ่มของระบบประสาท ซึ่งเป็นชุดค่าสัมประสิทธิ์ของพื้นฐานการเคลื่อนไหวที่กำหนดลักษณะวิถีการเคลื่อนที่ของแต่ละพิกเซลไปสู่อนาคต

รากฐานของนวัตกรรมนี้อยู่ในโมเดลที่ได้รับการฝึกอบรมอย่างพิถีพิถัน แบบจำลองของ Google เรียนรู้จากชุดข้อมูลจำนวนมหาศาลของวิถีการเคลื่อนไหวที่ดึงมาจากลำดับวิดีโอจริงที่มีการเคลื่อนไหวที่เป็นธรรมชาติและสั่นไหว ลำดับเหล่านี้ประกอบด้วยฉากที่มีองค์ประกอบต่างๆ เช่น ต้นไม้ไหว ดอกไม้เคลื่อนไหว เทียนกะพริบ และเสื้อผ้าปลิวไสวตามสายลม ชุดข้อมูลที่หลากหลายนี้ช่วยให้แบบจำลองเข้าใจพฤติกรรมไดนามิกที่หลากหลาย

ขอบเขตของการศึกษานี้จำกัดอยู่เพียงฉากในโลกแห่งความเป็นจริงที่มีการเปลี่ยนแปลงตามธรรมชาติ เช่น ต้นไม้และดอกไม้ที่เคลื่อนไหวตามสายลม อนุกรมฟูริเยร์ถูกเลือกเป็นฟังก์ชันพื้นฐาน พื้นผิวพื้นที่ความถี่ที่เกิดขึ้นสามารถเปลี่ยนเป็นวิถีการเคลื่อนที่ของพิกเซลระยะไกลที่หนาแน่น ซึ่งสามารถนำไปใช้ในการสังเคราะห์เฟรมในอนาคต เปลี่ยนภาพนิ่งให้เป็นภาพเคลื่อนไหวที่สมจริง

เมื่อนำเสนอด้วยก ภาพเดี่ยวแบบจำลองที่ได้รับการฝึกใช้กระบวนการสุ่มตัวอย่างการแพร่กระจายที่มีการประสานความถี่ กระบวนการนี้คาดการณ์การแสดงการเคลื่อนไหวระยะยาวต่อพิกเซลในโดเมนฟูริเยร์ ซึ่งเรียกว่าพื้นผิวการเคลื่อนที่แบบสุ่มของระบบประสาท จากนั้นการแสดงนี้จะถูกแปลงเป็นวิถีการเคลื่อนไหวที่หนาแน่นซึ่งครอบคลุมทั้งวิดีโอ เมื่อใช้ร่วมกับโมดูลการเรนเดอร์ตามรูปภาพ วิถีเหล่านี้สามารถควบคุมเพื่อการใช้งานจริงที่หลากหลาย

เมื่อเปรียบเทียบกับพิกเซล RGB แบบ Raw แล้ว Priors Over Motion จะจับภาพโครงสร้างใต้มิติที่เป็นพื้นฐานและมีมิติต่ำกว่า ซึ่งอธิบายความแปรผันของค่าพิกเซลได้อย่างมีประสิทธิภาพ สิ่งนี้นำไปสู่การสร้างในระยะยาวที่สอดคล้องกันมากขึ้นและการควบคุมแอนิเมชั่นที่ละเอียดยิ่งขึ้นเมื่อเปรียบเทียบกับวิธีการก่อนหน้านี้ ภาพเคลื่อนไหว ผ่านการสังเคราะห์วิดีโอดิบ

การแสดงการเคลื่อนไหวที่สร้างขึ้นนั้นสะดวกสำหรับแอปพลิเคชันดาวน์สตรีมจำนวนหนึ่ง เช่น การสร้างวิดีโอวนซ้ำอย่างราบรื่น การแก้ไขการเคลื่อนไหวที่สร้างขึ้น และการเปิดใช้งานการโต้ตอบ ภาพแบบไดนามิกจำลองการตอบสนองของพลวัตของวัตถุต่อแรงที่ผู้ใช้กระทำ

อ่านหัวข้อที่เกี่ยวข้องเพิ่มเติม:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

บทความอื่น ๆ
ดาเมียร์ ยาลอฟ
ดาเมียร์ ยาลอฟ

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

Hot Stories
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

จาก Ripple สู่ Big Green DAO: โครงการ Cryptocurrency มีส่วนสนับสนุนการกุศลอย่างไร

เรามาสำรวจความคิดริเริ่มที่ใช้ประโยชน์จากศักยภาพของสกุลเงินดิจิทัลเพื่อการกุศลกันดีกว่า

รู้เพิ่มเติม

AlphaFold 3, Med-Gemini และอื่นๆ: วิธีที่ AI พลิกโฉมการดูแลสุขภาพในปี 2024

AI แสดงให้เห็นในรูปแบบต่างๆ ในการดูแลสุขภาพ ตั้งแต่การเปิดเผยความสัมพันธ์ทางพันธุกรรมใหม่ๆ ไปจนถึงการเสริมศักยภาพให้กับระบบการผ่าตัดด้วยหุ่นยนต์ ...

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
จาก Ripple สู่ Big Green DAO: โครงการ Cryptocurrency มีส่วนสนับสนุนการกุศลอย่างไร
การวิเคราะห์ คริปโต Wiki บัญชีธุรกิจ การศึกษา ไลฟ์สไตล์ ตลาด ซอฟต์แวร์ เทคโนโลยี
จาก Ripple สู่ Big Green DAO: โครงการ Cryptocurrency มีส่วนสนับสนุนการกุศลอย่างไร
May 13, 2024
AlphaFold 3, Med-Gemini และอื่นๆ: วิธีที่ AI พลิกโฉมการดูแลสุขภาพในปี 2024
AI Wiki การวิเคราะห์ ย่อยอาหาร ความคิดเห็น บัญชีธุรกิจ ตลาด รายงานข่าว ซอฟต์แวร์ เรื่องราวและบทวิจารณ์ เทคโนโลยี
AlphaFold 3, Med-Gemini และอื่นๆ: วิธีที่ AI พลิกโฉมการดูแลสุขภาพในปี 2024
May 13, 2024
Nim Network เตรียมเปิดตัวเฟรมเวิร์กโทเค็นการเป็นเจ้าของ AI และดำเนินการขายผลตอบแทนพร้อมกำหนดวันสแนปชอตในเดือนพฤษภาคม
ตลาด รายงานข่าว เทคโนโลยี
Nim Network เตรียมเปิดตัวเฟรมเวิร์กโทเค็นการเป็นเจ้าของ AI และดำเนินการขายผลตอบแทนพร้อมกำหนดวันสแนปชอตในเดือนพฤษภาคม
May 13, 2024
Binance ร่วมมือกับอาร์เจนตินาเพื่อต่อสู้กับอาชญากรรมทางไซเบอร์
ความคิดเห็น บัญชีธุรกิจ ตลาด รายงานข่าว ซอฟต์แวร์ เทคโนโลยี
Binance ร่วมมือกับอาร์เจนตินาเพื่อต่อสู้กับอาชญากรรมทางไซเบอร์
May 13, 2024
CRYPTOMERIA LABS PTE. บจก.