AI Wiki ศิลปะ การศึกษา ซอฟต์แวร์ เทคโนโลยี

April 24, 2024

The Rise of Sora: AI เป็นอย่างไรdefiภูมิทัศน์ของการสร้างเนื้อหาวิดีโอ

by จาฮาซิน ชาเดน

เผยแพร่: 24 เมษายน 2024 เวลา 8:06 น. อัปเดต: 24 เมษายน 2024 เวลา 8:07 น.

by อนาสตาเซีย โอ

แก้ไขและตรวจสอบข้อเท็จจริง: 24 เมษายน 2024 เวลา 8:06 น

ในบทสรุป

Sora เป็นโมเดล AI การแปลงข้อความเป็นวิดีโอแบบก้าวหน้าที่สัญญาว่าจะเปลี่ยนเกมการสร้างวิดีโอโดยสิ้นเชิง

เมื่อเร็วๆ นี้ Adobe ได้เปิดเผยแผนการที่จะรวมเครื่องมือ AI เจนเนอเรชั่นเข้าไว้ด้วยกัน Premiere Pro ซอฟต์แวร์. การย้ายครั้งนี้ซึ่งรวมถึงการอนุญาตให้ผู้ใช้เข้าถึงเครื่องมือต่างๆ เช่น OpenAISora ของ Sora โดยตรงภายใน Premiere Pro มีเป้าหมายเพื่อเพิ่มคุณค่าให้กับซอฟต์แวร์ด้วยความสามารถที่ขับเคลื่อนด้วย AI เช่น การจัดการฉากและการกำจัดสิ่งรบกวนสมาธิ

แม้ว่า OpenAIปัจจุบัน Sora ยังไม่สามารถเข้าถึงได้โดยสาธารณะ Adobe สาธิตการผสานรวมเข้ากับ Premiere Pro เป็นฟีเจอร์ทดลองโดยไม่ต้องระบุไทม์ไลน์ที่เฉพาะเจาะจงสำหรับการเปิดตัว

เรารู้สึกตื่นเต้นที่จะประกาศความก้าวหน้า #เจเนอเรทีฟเอไอ คุณสมบัติที่ขับเคลื่อนโดยสิ่งใหม่ #อะโดบีไฟร์ฟลาย โมเดลวิดีโอ ดูตัวอย่างการเพิ่มวัตถุ การลบวัตถุ และการขยายแบบสร้าง ทั้งหมดจะมาเร็ว ๆ นี้ที่ #พรีเมียร์โปร- https://t.co/Yg1NxffVNR pic.twitter.com/wa5ivFXAPG
—อะโดบี (@อะโดบี) April 15, 2024

Sora เป็นโมเดล AI การแปลงข้อความเป็นวิดีโอแบบก้าวหน้าที่ได้รับความสนใจเนื่องจากสัญญาว่าจะเปลี่ยนเกมการสร้างวิดีโอโดยสิ้นเชิง เครื่องมือที่น่าหวังที่ให้เอฟเฟกต์สุดขั้วสำหรับทุกคนที่เกี่ยวข้องกับการผลิตวิดีโอ การออกแบบการเคลื่อนไหว และแอนิเมชั่น เทคโนโลยีนี้ยังเผชิญกับความท้าทายที่สำคัญอีกด้วย

มาสำรวจทุกแง่มุมของโซระที่น่าทึ่งและเป็นที่รอคอยกันมาก

ข้อความเป็นวิดีโอ?

โดยพื้นฐานแล้ว Sora ได้รับการออกแบบมาเพื่อสร้างวิดีโอที่เหมือนจริงและน่าดึงดูดสายตาซึ่งสร้างขึ้นจากข้อความแจ้ง ในฐานะที่เป็นนวัตกรรมการประยุกต์ใช้ AI Sora มีเป้าหมายที่จะปรับปรุงกระบวนการผลิตวิดีโอ และนำเสนอความเป็นไปได้ใหม่ๆ สำหรับกระบวนการเล่าเรื่องและการสื่อสารด้วยภาพ

ฟังก์ชันการทำงานของ Sora มีรากฐานมาจากความสามารถในการตีความและดำเนินการคำสั่งที่เป็นข้อความเพื่อสร้างเนื้อหาวิดีโอที่น่าสนใจ Sora ใช้ประโยชน์จากเทคนิคการเรียนรู้เชิงลึกขั้นสูงและการทำความเข้าใจภาษา ประมวลผลข้อความที่ป้อนและสร้างฉากภาพที่สอดคล้องกันด้วยตัวละคร การตั้งค่า และการเคลื่อนไหว กระบวนการนี้เกี่ยวข้องกับการทำงานร่วมกันที่ซับซ้อนระหว่างการประมวลผลภาษาธรรมชาติและการสังเคราะห์วิดีโอ ทำให้เกิดผลลัพธ์ที่สอดคล้องกับข้อความแจ้งที่ให้ไว้อย่างใกล้ชิด

ในการพัฒนาโซระ OpenAIทีมงานของเน้นย้ำถึงความสำคัญของการสร้างแบบจำลอง AI ที่สรุปความเข้าใจภาษาอย่างลึกซึ้งและความเข้าใจหลักการเล่าเรื่องด้วยภาพอย่างแข็งแกร่ง ด้วยการบูรณาการความก้าวหน้าอันล้ำสมัยในการทำความเข้าใจภาษาธรรมชาติและการสังเคราะห์วิดีโอ การออกแบบของ Sora จึงจัดลำดับความสำคัญของการผสมผสานระหว่างการแสดงออกทางภาษาและการนำเสนอด้วยภาพอย่างเหนียวแน่น

มันเป็นไปได้ยังไง?

ดังนั้น Sora จึงทำหน้าที่เป็นโมเดลการแพร่กระจายที่คล้ายกับ AI เจนเนอเรชั่นอื่นๆ ที่ทำงานกับข้อความเป็นรูปภาพ หมายความว่า Sora เริ่มต้นแต่ละเฟรมด้วยสัญญาณรบกวนคงที่ จากนั้นเปลี่ยนภาพให้เป็นภาพที่มีลักษณะคล้ายกับข้อความแจ้งและคำอธิบายของสิ่งที่คาดหวัง สิ่งนี้เป็นไปได้ด้วยการเรียนรู้ของเครื่อง วิดีโอ Sora สามารถขยายได้สูงสุด 60 วินาที

จัดการกับความสอดคล้องชั่วคราว Sora สร้างสรรค์นวัตกรรมโดยการพิจารณาเฟรมวิดีโอหลายเฟรมพร้อมกัน เพื่อให้มั่นใจว่ามีความสอดคล้องกันในขณะที่วัตถุเคลื่อนไหวภายในฉาก

ด้วยการรวมเอาทั้งรุ่นการแพร่กระจายและรุ่นหม้อแปลงไฟฟ้า Sora ปฏิบัติตามแนวทางแบบไฮบริดที่คล้ายคลึงกัน GPTสถาปัตยกรรมของหม้อแปลงไฟฟ้า Jack Qiao เน้นย้ำถึงจุดแข็งที่เสริมกันของโมเดลเหล่านี้ โดยการกระจายทำได้ดีเยี่ยมในการสร้างพื้นผิว แต่ขาดองค์ประกอบระดับโลก ในขณะที่หม้อแปลงไฟฟ้ามีความยอดเยี่ยมในการกำหนดโครงร่างในระดับสูง การรวมกันนี้ใช้ประโยชน์จากความสามารถของหม้อแปลงในการจัดระเบียบแพตช์ ในขณะที่โมเดลการแพร่กระจายจะเติมรายละเอียด

ในการใช้งาน Sora รูปภาพจะถูกแบ่งออกเป็นแพตช์สามมิติเพื่อรองรับการคงอยู่ชั่วคราว สิ่งนี้สะท้อนกระบวนการโทเค็นในโมเดลภาษา โดยที่แพตช์แสดงถึงองค์ประกอบของชุดรูปภาพ นอกจากนี้ ขั้นตอนการลดขนาดยังถูกนำไปใช้เพื่อปรับปรุงประสิทธิภาพการคำนวณอีกด้วย

เพื่อปรับปรุงความเที่ยงตรงของวิดีโอ Sora ใช้เทคนิคการสรุปคำบรรยายที่คล้ายคลึงกับ DALL E3ในประเด็นที่ GPT เขียนข้อความแจ้งผู้ใช้ใหม่พร้อมรายละเอียดเพิ่มเติมก่อนการสร้างวิดีโอ สิ่งนี้ทำหน้าที่เป็นรูปแบบหนึ่งของการปรับแต่งพร้อมท์อัตโนมัติ เพื่อให้มั่นใจว่าจะปฏิบัติตามอินพุตของผู้ใช้อย่างซื่อสัตย์

ตอนนี้โซระดีแค่ไหน?

OpenAI รับทราบถึงข้อจำกัดหลายประการในการวนซ้ำ Sora ในปัจจุบัน ที่น่าสังเกตก็คือ Sora ขาดความเข้าใจด้านฟิสิกส์โดยธรรมชาติ ซึ่งหมายความว่ามันอาจไม่ยึดติดกับหลักการทางกายภาพในโลกแห่งความเป็นจริงอย่างสม่ำเสมอ

ตามตัวอย่าง แบบจำลองล้มเหลวในการเข้าใจความสัมพันธ์ระหว่างเหตุและผล ส่งผลให้เกิดความไม่สอดคล้องกันที่อาจเกิดขึ้น ในทำนองเดียวกัน การวางตำแหน่งเชิงพื้นที่ของวัตถุอาจแสดงการเปลี่ยนแปลงที่ไม่เป็นธรรมชาติ

เมื่อพูดถึงความน่าเชื่อถือ สถานะของโซระยังคงไม่แน่นอน แม้ว่า OpenAI ได้นำเสนอตัวอย่างที่แสดงให้เห็นถึงคุณภาพสูง แต่ก็ไม่ชัดเจนว่ามีการจัดแสดงแบบเลือกสรรมากน้อยเพียงใด ในแอปพลิเคชันแปลงข้อความเป็นรูปภาพ การสร้างภาพหลายภาพและการเลือกภาพที่ดีที่สุดถือเป็นแนวทางปฏิบัติทั่วไป จำนวนภาพที่ผลิตโดย OpenAI ทีมงานเพื่อแสดงวิดีโอในบทความประกาศไม่เปิดเผย การขาดความโปร่งใสนี้อาจขัดขวางการยอมรับ โดยเฉพาะอย่างยิ่งหากจำเป็นต้องสร้างวิดีโอนับร้อยหรือหลายพันรายการเพื่อให้ได้ผลลัพธ์ที่ใช้งานได้เพียงรายการเดียว เพื่อบรรเทาความไม่แน่นอนนี้ เราต้องรอให้เครื่องมือเข้าถึงได้กว้างขึ้น

โซระจะมีประโยชน์ที่ไหน?

ความสามารถของ Sora ขยายไปถึงการสร้างวิดีโอตั้งแต่เริ่มต้น การยืดฟุตเทจที่มีอยู่ และการเติมเฟรมที่ขาดหายไปภายในวิดีโออย่างราบรื่น

เช่นเดียวกับวิธีที่เครื่องมือ AI สร้างข้อความเป็นรูปภาพปฏิวัติการสร้างภาพโดยไม่ต้องใช้ทักษะการแก้ไขทางเทคนิค Sora ตั้งเป้าที่จะทำให้การผลิตวิดีโอง่ายขึ้นโดยไม่ต้องมีความเชี่ยวชาญในการแก้ไขภาพ ต่อไปนี้เป็นสถานการณ์สมมติของแอปพลิเคชันหลักบางส่วน:

Sora ช่วยให้สามารถสร้างวิดีโอแบบสั้นที่ปรับแต่งสำหรับแพลตฟอร์มโซเชียลมีเดีย เช่น TikTok, Instagram Reels และ YouTube Shorts มันมีความเป็นเลิศเป็นพิเศษในการสร้างเนื้อหาที่อาจยากหรือทำไม่ได้ในการถ่ายทำโดยใช้วิธีการแบบเดิมๆ
ตามเนื้อผ้า ความพยายามที่มีราคาแพง เช่น การผลิตโฆษณา วิดีโอส่งเสริมการขาย และการสาธิตผลิตภัณฑ์สามารถลดความซับซ้อนลงได้อย่างมากด้วยเครื่องมือ AI การแปลงข้อความเป็นวิดีโอ เช่น Sora ซึ่งนำเสนอโซลูชันที่คุ้มค่า
แม้ว่าวิดีโอที่สร้างโดย AI จะไม่ได้รวมเข้ากับผลิตภัณฑ์ขั้นสุดท้าย แต่ก็ทำหน้าที่เป็นเครื่องมืออันทรงคุณค่าสำหรับการแสดงแนวคิดอย่างรวดเร็ว ผู้สร้างภาพยนตร์สามารถใช้ AI สำหรับการจำลองฉากก่อนการถ่ายทำ ในขณะที่นักออกแบบสามารถเห็นภาพผลิตภัณฑ์ก่อนการผลิต ตัวอย่างเช่น บริษัทของเล่นอาจจ้าง Sora เพื่อสร้างแบบจำลอง AI ของของเล่นเรือโจรสลัดตัวใหม่เพื่อประเมินความเป็นไปได้ก่อนที่จะมีการผลิตจำนวนมาก
ข้อมูลสังเคราะห์พิสูจน์ได้ว่ามีคุณค่าอย่างยิ่งในสถานการณ์ที่ข้อกังวลด้านความเป็นส่วนตัวหรือความเป็นไปได้ขัดขวางไม่ให้มีการใช้ข้อมูลจริง แม้ว่าโดยทั่วไปจะนำไปใช้กับข้อมูลตัวเลข เช่น บันทึกทางการเงินและข้อมูลที่สามารถระบุตัวบุคคลได้ แต่ข้อมูลสังเคราะห์ที่มีคุณสมบัติคล้ายคลึงกันก็สามารถสร้างขึ้นเพื่อให้เข้าถึงได้กว้างขึ้น ในขอบเขตของวิดีโอ ข้อมูลสังเคราะห์มีประโยชน์สำหรับการฝึกอบรมระบบการมองเห็นของคอมพิวเตอร์

ความท้าทายที่เกี่ยวข้องกับโซระ

เนื่องจากเป็นผลิตภัณฑ์ที่เพิ่งเปิดตัว ความเสี่ยงของ Sora ยังไม่ชัดเจนอย่างสมบูรณ์ อย่างไรก็ตาม คาดว่าจะคล้ายคลึงกับโมเดลข้อความเป็นรูปภาพ
หากไม่มีการป้องกันที่เพียงพอ Sora มีโอกาสที่จะสร้างเนื้อหาที่น่ารังเกียจหรือไม่เหมาะสม เช่น วิดีโอที่มีความรุนแรง ภาพกราฟิก เนื้อหาทางเพศที่โจ่งแจ้ง การแสดงภาพในทางเสื่อมเสียของกลุ่มใดกลุ่มหนึ่ง และการส่งเสริมหรือการยกย่องกิจกรรมที่ผิดกฎหมาย สิ่งที่ถือเป็นเนื้อหาที่ไม่เหมาะสมอาจแตกต่างกันอย่างมากขึ้นอยู่กับผู้ใช้ (เช่น เด็กกับผู้ใหญ่) และสถานการณ์ที่สร้างวิดีโอ (เช่น วิดีโอให้ความรู้เกี่ยวกับอันตรายจากดอกไม้ไฟที่แสดงฉากกราฟิกโดยไม่ได้ตั้งใจ)
วิดีโอตัวอย่างที่แชร์โดย OpenAI แสดงให้เห็นว่าความสามารถที่โดดเด่นอย่างหนึ่งของโซระคือทักษะในการสร้างสถานการณ์ตามจินตนาการที่เหนือกว่าความเป็นจริง อย่างไรก็ตามความสามารถนี้ยังทำให้เสี่ยงต่อการสร้าง”ปลอมลึก” วิดีโอที่มีการปรับเปลี่ยนบุคคลหรือสถานการณ์ที่แท้จริงเพื่อสื่อความเท็จ ไม่ว่าจะโดยไม่ได้ตั้งใจ (ข้อมูลที่ผิด) หรือโดยเจตนา (ข้อมูลที่บิดเบือน) เนื้อหาดังกล่าวสามารถนำไปสู่ผลลัพธ์ที่สำคัญได้
ผลลัพธ์ที่สร้างโดยโมเดล AI ทั่วไปนั้นเชื่อมโยงกับข้อมูลที่ได้รับการฝึกอบรมโดยธรรมชาติ ดังนั้น อคติทางวัฒนธรรมหรือทัศนคติแบบเหมารวมที่ฝังอยู่ในข้อมูลการฝึกอบรมอาจปรากฏในวิดีโอที่สร้างขึ้น ซึ่งอาจเป็นปัญหาที่คล้ายคลึงกัน

อะไร OpenAI ทีมทำเพื่อป้องกันความเสี่ยงที่กล่าวมาข้างต้น?

ปัจจุบันโซระสามารถเข้าถึงได้เฉพาะกับ “ทีมสีแดง” นักวิจัย—ผู้เชี่ยวชาญที่ได้รับมอบหมายให้ระบุและบรรเทาปัญหาที่อาจเกิดขึ้นกับแบบจำลอง นักวิจัยเหล่านี้พยายามที่จะสร้างเนื้อหาที่อาจแสดงความเสี่ยงตามที่ระบุไว้ OpenAI เพื่อแก้ไขและแก้ไขข้อกังวลใด ๆ ก่อนที่โซระจะเปิดเผยต่อสาธารณะ

โซระจะปล่อยให้ฉันทำงานน้อยลงได้ไหม?

ความสามารถของ Sora ในการผลิตเนื้อหาวิดีโอระดับสูงโดยอิงตามข้อความมีศักยภาพที่จะกระตุ้นให้เกิดการเปลี่ยนแปลงที่โดดเด่นภายในภูมิทัศน์การจ้างงานเชิงสร้างสรรค์ ตำแหน่งทั่วไปในการถ่ายวิดีโอ เทคนิคพิเศษ และแอนิเมชั่นมีความเสี่ยงที่จะล้าสมัยเมื่อเผชิญกับความก้าวหน้าดังกล่าว แม้ว่าครีเอทีฟโฆษณาบางรายอาจปรับเปลี่ยนไปตามความเชี่ยวชาญในการดูแลฟังก์ชัน AI การใช้ AI อย่างมีจริยธรรม และการชี้แนะทิศทางครีเอทีฟโฆษณาเพื่อควบคุมความสามารถของ AI แต่ความเป็นไปได้ของการเปลี่ยนแปลงนี้สำหรับทุกคนยังคงไม่แน่นอน

ในทางกลับกัน ด้วยการลดอุปสรรคด้านเทคนิคและการเงินที่เกี่ยวข้องกับการผลิตวิดีโอ Sora มีศักยภาพในการเสริมพลังให้กับบุคคลในวงกว้างมากขึ้นในการสร้างสรรค์เนื้อหาคุณภาพสูง การทำให้เป็นประชาธิปไตยนี้อาจส่งเสริมให้เกิดการเผยแพร่เนื้อหาที่หลากหลายและสร้างสรรค์มากขึ้น แม้ว่าอาจจำเป็นต้องให้หน่วยงานสื่อและผู้สร้างเนื้อหาที่จัดตั้งขึ้นต้องปรับเปลี่ยนและแนะนำแนวทางที่เป็นนวัตกรรมใหม่ แต่วิวัฒนาการนี้สามารถประกาศผลลัพธ์เชิงบวกได้

ไม่ว่าจะด้วยวิธีใด หลังจากการเปิดตัวครั้งใหญ่ โซระจะทำให้เกิดการเปลี่ยนแปลงในวิดีโอและอุตสาหกรรมที่เกี่ยวข้อง รวมถึงการสร้างเนื้อหาส่วนบุคคลอย่างไม่ต้องสงสัย

ผลกระทบระยะยาวของ OpenAI โซระ

เมื่อ Sora ยึดมั่นในขั้นตอนการทำงานแบบมืออาชีพ ผลกระทบที่ยั่งยืนของมันก็เผยออกมา:

การปลดล็อกกรณีการใช้งานที่มีมูลค่าสูง: การบูรณาการของ Sora ในอุตสาหกรรมต่าง ๆ รับประกันการใช้งานที่เปลี่ยนแปลง ได้แก่:

เร่งการผลิตเนื้อหา: Sora ปรับปรุงประสิทธิภาพการสร้างสื่อทั่วทั้งภาค VR, AR, เกม และความบันเทิงแบบดั้งเดิม เร่งวงจรการผลิตและอำนวยความสะดวกในการคิด
ประสบการณ์ส่วนบุคคล: เนื้อหาที่ได้รับการปรับแต่งโดย Sora เพื่อให้ตรงกับความต้องการของแต่ละบุคคลเกิดขึ้น การปรับรูปแบบความบันเทิงและการศึกษาให้เหมาะกับสไตล์และรสนิยมการเรียนรู้ที่หลากหลาย
การปรับตัวแบบเรียลไทม์: การตัดต่อวิดีโอแบบไดนามิกที่เปิดใช้งานโดย Sora ช่วยให้สามารถปรับเปลี่ยนเนื้อหาได้ทันที เพื่อรองรับความต้องการของผู้ชมและข้อเสนอแนะแบบเรียลไทม์
การเบลอขอบเขตดิจิทัล: การทำงานร่วมกันของ Sora กับ VR และ AR ทำให้เส้นแบ่งระหว่างอาณาจักรทางกายภาพและดิจิทัลพร่ามัว นำเสนอประสบการณ์แปลกใหม่ที่ดื่มด่ำและโอกาสในการเล่าเรื่องแบบโต้ตอบ

โดยพื้นฐานแล้ว การถือกำเนิดของ Sora ถือเป็นการประกาศยุคแห่งการเปลี่ยนแปลงในการสร้างเนื้อหาที่ขับเคลื่อนด้วย AI การเปลี่ยนแปลงอุตสาหกรรม การเล่าเรื่อง และประสบการณ์ผู้ใช้ในรูปแบบที่ลึกซึ้ง

คีย์เวิร์ด:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

Zhauhazyn เป็นนักเขียนคำโฆษณาและวิชาเอกสังคมวิทยา ด้วยความหลงใหลในพลวัตที่ซับซ้อนของการศึกษาวิทยาศาสตร์และเทคโนโลยี เธอจึงเจาะลึกเข้าไปในอาณาจักรของ Web3 ด้วยความหลงใหลในบล็อคเชนอย่างแรงกล้า

บทความอื่น ๆ

จาฮาซิน ชาเดน