Text-to-Video Model Gen-2 สามารถสร้างวิดีโอสั้นโดยใช้ข้อความแจ้ง
ในบทสรุป
Text2Video รุ่น Gen-2 ใหม่จาก RunWayML ไม่เพียงแต่แก้ไขที่มีอยู่เท่านั้น วิดีโอ แต่ยังสร้างสิ่งใหม่ตั้งแต่ต้นโดยใช้เพียงข้อความแจ้งเท่านั้น
ฟีเจอร์นี้คาดว่าจะปรับปรุงวิธีที่ผู้คนสร้างและแบ่งปันเนื้อหาบนแพลตฟอร์มโซเชียลมีเดีย ทำให้ผู้ใช้สามารถเปลี่ยนแปลงได้ ภาพนิ่งให้เป็นไดนามิก และคลิปวิดีโอที่น่าสนใจโดยไม่ต้องมีความรู้เรื่องการตัดต่อวิดีโอมาก่อน
โมเดลแปลงข้อความเป็นวิดีโอ Gen-2 ใหม่จาก Runway ไม่เพียงแต่แก้ไขวิดีโอที่มีอยู่แล้วเท่านั้น แต่ยังสร้างวิดีโอใหม่ตั้งแต่เริ่มต้นโดยใช้ข้อความแจ้งเท่านั้น นี่เป็นการปรับปรุงที่สำคัญกว่า Gen เวอร์ชันก่อนหน้า ซึ่งสามารถแก้ไขได้เฉพาะวิดีโอที่มีอยู่เท่านั้น โมเดลข้อความเป็นวิดีโอ Gen-2 ใช้เทคโนโลยี AI ที่ล้ำสมัยของ Runway เพื่อสร้างวิดีโอที่แยกไม่ออกจากวิดีโอที่มนุษย์สร้างขึ้น ด้วยคุณสมบัติใหม่นี้ ผู้ใช้สามารถประหยัดเวลาและความพยายามโดยการสร้างวิดีโอโดยอัตโนมัติโดยไม่ต้องใช้ทักษะการตัดต่อวิดีโอมากมาย
โมเดล Gen-2 ใหม่ยังสามารถเปลี่ยนรูปภาพที่อัปโหลดให้เป็น วิดีโอสั้น ๆ คลิป. สิ่งนี้ทำได้โดยการให้คำใบ้ข้อความที่อธิบายว่าผู้ใช้ต้องการให้วิดีโอเป็นอย่างไร จนถึงตอนนี้ ระยะเวลาของวิดีโอไม่เกินสองสามวินาที แต่คุณภาพนั้นสูงกว่าของคู่แข่งมาก (โดยเฉพาะอย่างยิ่งเมื่อของคู่แข่ง เครือข่ายประสาทเทียม ไม่เปิดเผยต่อสาธารณะ) ฟีเจอร์นี้คาดว่าจะปรับปรุงวิธีที่ผู้คนสร้างและแชร์เนื้อหาบนแพลตฟอร์มโซเชียลมีเดีย ด้วยโมเดล Gen-2 ผู้ใช้สามารถเปลี่ยนภาพนิ่งให้เป็นคลิปวิดีโอไดนามิกได้อย่างง่ายดาย มีโอกาสที่ดีที่ Facebook หรือ Tiktok จะใช้เทคโนโลยีนี้เพื่อขยายชุดเครื่องมือ AI ที่มีให้สำหรับผู้สร้างเนื้อหา
การแข่งขันวิดีโอ AI เป็นไปอย่างดุเดือด เวลาผ่านไปเพียงหนึ่งสัปดาห์นับตั้งแต่การเปิดตัว Gen-1 และ Gen-2 ก็ออกมาแล้ว การแข่งขันระหว่างบริษัทเทคโนโลยีเพื่อพัฒนาเทคโนโลยีวิดีโอ AI ขั้นสูงสุดกำลังเพิ่มขึ้นอย่างรวดเร็ว โดยแต่ละบริษัทต่างมุ่งมั่นที่จะเอาชนะคู่แข่งรายอื่น
หากต้องการลอง Gen เวอร์ชันใหม่ คุณจะต้องลงทะเบียนในคิวบน เว็บไซต์รันเวย์.
- Runway สตาร์ทอัพด้านปัญญาประดิษฐ์ ประกาศ Gen-1ซึ่งเป็นโครงข่ายประสาทเทียมที่สามารถเปลี่ยนวิดีโอเก่าให้เป็นวิดีโอใหม่ได้โดยการรวมข้อความแจ้งและรูปภาพเข้าด้วยกัน Gen-1 ช่วยให้ผู้สร้างภาพยนตร์สามารถผลิตเนื้อหาได้อย่างรวดเร็วในลักษณะที่คุ้มค่าโดยการใช้องค์ประกอบและสไตล์ของ พร้อมรับภาพหรือข้อความ เข้ากับโครงสร้างของวิดีโอต้นทาง Runway Research ทุ่มเทให้กับการสร้างระบบ AI หลายรูปแบบที่ช่วยให้เกิดความคิดสร้างสรรค์รูปแบบใหม่ และ Gen-1 สามารถนำมาใช้เพื่อทดลองอนาคตของการเล่าเรื่องได้
- เมื่อเดือนที่แล้ว Sam Altman ผู้ร่วมก่อตั้งและซีอีโอของ OpenAIที่เพิ่งพูดคุยกับ TechCrunch และกล่าวว่า OpenAI กำลังพัฒนา โมเดล AI สำหรับวิดีโอ และ GPT-4ซึ่งจะเปิดเผยต่อสาธารณะหลังจากที่บริษัทยืนยันความน่าเชื่อถือและความปลอดภัยแล้ว
- ในเดือนตุลาคม Google ได้พัฒนา Imagen Video ซึ่งเป็นวิธีการสร้างวิดีโอแบบมีเงื่อนไขข้อความโดยอิงจากชุดวิดีโอ แบบจำลองการแพร่กระจาย. ระบบยอมรับคำอธิบายที่เป็นข้อความและสร้างภาพยนตร์ 16 เฟรมที่ 24 เฟรมต่อวินาทีด้วยความละเอียด 48 x 128 พิกเซล ระบบจะปรับขนาดและ "คาดการณ์" เฟรมพิเศษ โดยสร้างวิดีโอสุดท้ายที่มี 24 เฟรมที่ 720 เฟรมต่อวินาที และความละเอียด 1280p (768×14) คู่ข้อความรูปภาพหกสิบล้านคู่และคู่ข้อความวิดีโอ XNUMX ล้านคู่ถูกนำมาใช้ในการฝึก Imagen Video
อ่านบทความที่เกี่ยวข้องเพิ่มเติม:
ข้อจำกัดความรับผิดชอบ
สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า
เกี่ยวกับผู้เขียน
Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต
บทความอื่น ๆDamir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต