AI Wiki Art Pendidikan perisian Teknologi

April 24, 2024

Kebangkitan Sora: Bagaimana AI adalah Redefidalam Landskap Penciptaan Kandungan Video

by Zhauhazyn Shaden

Diterbitkan: 24 April 2024 pada 8:06 pagi Dikemas kini: 24 April 2024 pada 8:07 pagi

by Anastasiia O

Disunting dan disemak fakta: 24 April 2024 jam 8:06 pagi

Secara ringkas

Sora ialah model AI teks-ke-video progresif yang menjanjikan untuk mengubah permainan penciptaan video sepenuhnya.

Adobe baru-baru ini telah mendedahkan rancangan untuk mengintegrasikan alat AI generatif ke dalamnya Premiere Pro perisian. Langkah ini, termasuk memberikan pengguna akses kepada alatan seperti OpenAISora 's secara langsung dalam Premiere Pro, bertujuan untuk memperkayakan perisian dengan keupayaan berkuasa AI seperti manipulasi pemandangan dan penyingkiran gangguan.

Walaupun OpenAISora 's pada masa ini tidak boleh diakses oleh orang ramai, Adobe menunjukkan penyepaduannya ke dalam Premiere Pro sebagai ciri percubaan tanpa menyediakan garis masa khusus untuk keluarannya.

Kami sangat teruja untuk mengumumkan kejayaan #GenerativeAI ciri yang dikuasakan oleh yang baharu #AdobeFirefly model video. Lihatlah Penambahan Objek, Penyingkiran Objek dan Lanjutan Generatif. Semua akan datang tidak lama lagi #PremierePro! 💥 https://t.co/Yg1NxffVNR pic.twitter.com/wa5ivFXAPG
—Adobe (@Adobe) April 15, 2024

Sora ialah model AI teks-ke-video progresif yang mendapat perhatian kerana janjinya untuk menukar permainan penciptaan video sepenuhnya. Alat yang menjanjikan kesan melampau untuk semua orang yang mempunyai kaitan dengan pengeluaran video, reka bentuk gerakan dan animasi, teknologi ini juga membawa cabaran penting.

Mari kita terokai semua aspek Sora yang luar biasa dan dinanti-nantikan.

Teks ke Video?

Pada asasnya Sora direka untuk membuat video seperti hidup dan menawan visual yang dihasilkan daripada gesaan teks. Sebagai aplikasi AI yang inovatif, Sora menyasarkan untuk menyelaraskan proses pengeluaran video dan menawarkan kemungkinan baharu untuk proses naratif dan komunikasi visual.

Fungsi Sora berakar pada keupayaannya untuk mentafsir dan melaksanakan arahan teks untuk mencipta kandungan video yang menarik. Memanfaatkan teknik pembelajaran mendalam lanjutan dan pemahaman bahasa, Sora memproses teks input dan membina adegan visual yang sepadan dengan watak, tetapan dan gerakan. Proses ini melibatkan interaksi yang sofistikated antara pemprosesan bahasa semula jadi dan sintesis video, menghasilkan output yang sejajar rapat dengan gesaan teks yang disediakan.

Dalam membangunkan Sora, OpenAIPasukan 's menekankan kepentingan mencipta model AI yang merangkumi pemahaman mendalam tentang bahasa dan pemahaman yang mantap tentang prinsip penceritaan visual. Dengan menyepadukan kemajuan terkini dalam pemahaman bahasa semula jadi dan sintesis video, reka bentuk Sora mengutamakan gabungan padu ekspresi linguistik dan perwakilan visual.

Bagaimana Ia Mungkin?

Jadi, Sora berfungsi sebagai model resapan serupa dengan AI generatif lain yang berfungsi dengan teks-ke-imej. Ini bermakna Sora memulakan setiap bingkai dengan bunyi statik, kemudian menukar imej kepada gambaran yang akan menyerupai gesaan dan penerangan yang diberikan tentang perkara yang dijangkakan. Ini boleh dilakukan berkat pembelajaran mesin. Video Sora boleh menjangkau sehingga 60 saat.

Menangani konsistensi temporal, Sora berinovasi dengan mempertimbangkan berbilang bingkai video secara serentak, memastikan keselarasan apabila objek bergerak dalam tempat kejadian.

Menggabungkan kedua-dua model penyebaran dan pengubah, Sora mengikuti pendekatan hibrid yang serupa GPTseni bina transformer. Jack Qiao menyerlahkan kekuatan pelengkap model ini, dengan resapan cemerlang pada penjanaan tekstur tetapi kurang dalam komposisi global, manakala transformer cemerlang dalam penentuan susun atur peringkat tinggi. Gabungan ini memanfaatkan keupayaan pengubah untuk menyusun tampalan sementara model resapan mengisi butiran.

Dalam pelaksanaan Sora, imej dibahagikan kepada patch tiga dimensi untuk menampung kegigihan temporal. Ini mencerminkan proses tokenisasi dalam model bahasa, di mana tampalan mewakili elemen set imej. Selain itu, langkah pengurangan dimensi digunakan untuk menyelaraskan kecekapan pengiraan.

Untuk meningkatkan kesetiaan video, Sora menggunakan teknik kapsyen semula yang serupa dengan DALL E 3, Di mana GPT menulis semula gesaan pengguna dengan butiran tambahan sebelum penjanaan video. Ini berfungsi sebagai satu bentuk penghalusan segera automatik, memastikan pematuhan setia kepada input pengguna.

Seberapa Baik Sora Sekarang?

OpenAI mengakui beberapa batasan dalam lelaran semasa Sora. Terutama, Sora tidak mempunyai pemahaman yang wujud tentang fizik, bermakna ia mungkin tidak mematuhi prinsip fizikal dunia sebenar secara konsisten.

Sebagai contoh, model gagal memahami hubungan sebab-akibat, mengakibatkan kemungkinan ketidakkonsistenan. Begitu juga, kedudukan spatial objek mungkin memaparkan anjakan luar biasa.

Apabila bercakap mengenai kebolehpercayaan, status Sora masih tidak pasti. Walaupun OpenAI telah membentangkan contoh yang menunjukkan kualiti tinggi, tidak jelas sejauh mana pempameran terpilih telah berlaku. Dalam aplikasi teks ke imej, menjana berbilang imej dan memilih yang terbaik adalah amalan biasa. Bilangan tepat imej yang dihasilkan oleh OpenAI pasukan untuk mempamerkan video dalam artikel pengumuman mereka tidak didedahkan. Kekurangan ketelusan ini berpotensi menghalang penggunaan, terutamanya jika menjana ratusan atau beribu-ribu video diperlukan untuk mendapatkan hanya satu hasil yang boleh digunakan. Untuk mengurangkan ketidakpastian ini, kita mesti menunggu kebolehcapaian alat yang lebih luas.

Di manakah Sora Akan Digunakan?

Keupayaan Sora diperluaskan kepada penciptaan video dari awal, pemanjangan rakaman sedia ada, dan pengisian lancar bingkai yang hilang dalam video.

Sama seperti cara alat AI generatif teks-ke-imej merevolusikan penciptaan imej tanpa kemahiran penyuntingan teknikal, Sora bertujuan untuk memudahkan penghasilan video tanpa memerlukan kepakaran penyuntingan imej. Berikut ialah beberapa senario aplikasi utama:

Sora membolehkan penciptaan video bentuk pendek yang disesuaikan untuk platform media sosial seperti TikTok, Instagram Reels dan YouTube Shorts. Ia amat cemerlang dalam mencipta kandungan yang mungkin sukar atau tidak praktikal untuk difilemkan menggunakan kaedah tradisional.
Secara tradisinya, usaha yang mahal seperti menghasilkan iklan, video promosi dan demonstrasi produk boleh dipermudahkan dengan ketara dengan alat AI teks ke video seperti Sora, yang menawarkan penyelesaian kos efektif.
Walaupun video yang dijana AI tidak disepadukan ke dalam produk akhir, ia berfungsi sebagai alat yang berharga untuk menggambarkan konsep dengan cepat. Pembuat filem boleh menggunakan AI untuk mockup adegan sebelum penggambaran, manakala pereka boleh memvisualisasikan produk sebelum pembuatan. Sebagai contoh, sebuah syarikat mainan boleh menggunakan Sora untuk mencipta mockup AI bagi mainan kapal lanun baharu untuk menilai kebolehlaksanaannya sebelum pengeluaran besar-besaran.
Data sintetik terbukti tidak ternilai dalam situasi di mana kebimbangan privasi atau kemungkinan menghalang penggunaan data sebenar. Walaupun lazimnya digunakan pada data berangka seperti rekod kewangan dan maklumat yang boleh dikenal pasti secara peribadi, data sintetik dengan sifat yang serupa boleh dijana untuk kebolehaksesan yang lebih luas. Dalam bidang video, data sintetik berguna untuk melatih sistem penglihatan komputer.

Cabaran yang berkaitan dengan Sora

Sebagai produk yang baru diperkenalkan, risiko Sora masih belum dijelaskan sepenuhnya; walau bagaimanapun, ia dijangka serupa dengan model teks-ke-imej.
Tanpa perlindungan yang mencukupi, Sora berpotensi untuk mencipta kandungan yang tidak menyenangkan atau tidak sesuai, seperti video yang mengandungi keganasan, imejan grafik, bahan seksual eksplisit, perwakilan menghina kumpulan tertentu, dan promosi atau pengagungan aktiviti haram. Kandungan yang tidak sesuai boleh sangat berbeza bergantung pada pengguna (seperti kanak-kanak berbanding orang dewasa) dan keadaan di mana video tersebut dihasilkan (seperti video pendidikan tentang bahaya bunga api secara tidak sengaja menunjukkan adegan grafik).
Contoh video yang dikongsi oleh OpenAI menunjukkan bahawa salah satu kebolehan Sora yang ketara ialah kemahirannya dalam mencipta senario imaginatif yang melangkaui realiti. Namun begitu, keupayaan ini juga menjadikannya terdedah kepada penjanaan "palsu palsu” video, di mana individu atau situasi tulen diubah untuk menyampaikan kepalsuan, sama ada secara tidak sengaja (maklumat salah) atau sengaja (salahmaklumat). Kandungan sedemikian boleh membawa kepada akibat yang besar.
Hasil yang dihasilkan oleh model AI generatif secara semula jadi dikaitkan dengan data yang mereka latih. Oleh itu, bias budaya atau stereotaip yang tertanam dalam data latihan mungkin muncul dalam video yang dijana, mungkin mengekalkan masalah yang sama.

Apa Yang OpenAI Pasukan Lakukan untuk Mencegah Risiko yang Disebutkan Di Atas?

Pada masa ini, Sora boleh diakses secara eksklusif untuk "pasukan merah” penyelidik—pakar yang ditugaskan untuk mengenal pasti dan mengurangkan potensi isu dengan model tersebut. Para penyelidik ini berusaha untuk menjana kandungan yang mungkin mempamerkan risiko yang digariskan, membenarkan OpenAI untuk menangani dan membetulkan sebarang kebimbangan sebelum keluaran awam Sora.

Bolehkah Sora Meninggalkan Saya Bekerja?

Kapasiti Sora untuk menghasilkan kandungan video peringkat teratas berdasarkan isyarat teks berpotensi untuk mencetuskan transformasi yang ketara dalam landskap pekerjaan kreatif. Kedudukan konvensional dalam videografi, kesan khas dan animasi berisiko usang dalam menghadapi kemajuan tersebut. Walaupun sesetengah kreatif mungkin berputar dengan mengasah kepakaran dalam mengawasi fungsi AI, penggunaan AI yang beretika dan membimbing arah kreatif untuk memanfaatkan keupayaan AI, kemungkinan peralihan ini untuk semua masih tidak pasti.

Sebaliknya, dengan mengurangkan halangan teknikal dan kewangan yang berkaitan dengan pengeluaran video, Sora mempunyai potensi untuk memperkasakan kumpulan individu yang lebih luas untuk menghasilkan kandungan berkualiti tinggi. Pendemokrasian ini mungkin menggalakkan peningkatan dalam pengedaran kandungan yang pelbagai dan inventif. Walaupun ia mungkin memerlukan entiti media dan pencipta kandungan yang mantap untuk menyesuaikan dan memperkenalkan pendekatan inovatif, evolusi ini boleh meramalkan hasil yang positif.

Sama ada, selepas keluaran besar-besaran, Sora sudah pasti akan menyebabkan perubahan dalam video dan industri berkaitan, serta dalam penciptaan kandungan peribadi.

Implikasi Jangka Panjang daripada OpenAI Sora

Apabila Sora menjadi berakar umbi dalam aliran kerja profesional, impaknya yang berkekalan terungkap:

Membuka Kunci Kes Penggunaan Bernilai Tinggi: Penyepaduan Sora merentas industri menjanjikan aplikasi transformatif, termasuk:

Pengeluaran Kandungan Dipercepatkan: Sora memperkemas penciptaan media merentas sektor VR, AR, permainan dan hiburan tradisional, mempercepatkan kitaran pengeluaran dan memudahkan idea.
Pengalaman Diperibadikan: Kandungan tersuai yang disusun oleh Sora untuk memadankan pilihan individu muncul, membentuk semula hiburan dan paradigma pendidikan agar sesuai dengan gaya pembelajaran dan citarasa yang pelbagai.
Penyesuaian Masa Nyata: Penyuntingan video dinamik yang didayakan oleh Sora membolehkan pengubahsuaian secara on-the-fly pada kandungan, memenuhi keutamaan penonton dan maklum balas dalam masa nyata.
Mengaburkan Sempadan Digital: Sinergi Sora dengan VR dan AR mengaburkan garis antara alam fizikal dan digital, mempersembahkan pengalaman mengasyikkan novel dan peluang bercerita interaktif.

Pada dasarnya, kemunculan Sora menandakan era transformatif dalam penciptaan kandungan dipacu AI, membentuk semula industri, naratif dan pengalaman pengguna dengan cara yang mendalam.

Tags:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Zhauhazyn ialah penulis salinan dan jurusan sosiologi. Terpesona dengan dinamik rumit Pengajian Sains dan Teknologi, dia mendalami bidang Web3 dengan semangat yang bersungguh-sungguh untuk blockchain.

lebih banyak artikel

Zhauhazyn Shaden

Hot Stories

Token WLD Worldcoin Menghadapi Tekanan Jualan Agresif Dengan Lebih Banyak Pembukaan Pada Bulan Akan Datang, Amaran DeFi2 Pedagang Bybit

by Alisa Davidson

Semoga 14, 2024

Kegagalan Sistem Pengalaman Crypto Exchange Coinbase, Dana Pengguna Selamat Menyiasat Isu Syarikat Tipu

by Alisa Davidson

Semoga 14, 2024

Rangkaian Nim Untuk Melancarkan Rangka Kerja Tokenisasi Pemilikan AI Dan Menjalankan Jualan Hasil Dengan Tarikh Syot Kilat Dijadualkan Untuk Mei

by Alisa Davidson

Semoga 13, 2024

Lebih Protokol Merancang Untuk Melancarkan Mainnetnya Pada Jun Memandangkan Testnetnya Menarik Lebih 750,000 Pengguna

by Alisa Davidson

Semoga 13, 2024

Berita Terkini

Token WLD Worldcoin Menghadapi Tekanan Jualan Agresif Dengan Lebih Banyak Pembukaan Pada Bulan Akan Datang, Amaran DeFi2 Pedagang Bybit

by Alisa Davidson

Semoga 14, 2024

Kegagalan Sistem Pengalaman Crypto Exchange Coinbase, Dana Pengguna Selamat Menyiasat Isu Syarikat Tipu

by Alisa Davidson

Semoga 14, 2024

AlphaFold 3, Med-Gemini, dan lain-lain: The Way AI Transforms Healthcare in 2024

by Zhauhazyn Shaden

Semoga 13, 2024

Rangkaian Nim Untuk Melancarkan Rangka Kerja Tokenisasi Pemilikan AI Dan Menjalankan Jualan Hasil Dengan Tarikh Syot Kilat Dijadualkan Untuk Mei

by Alisa Davidson

Semoga 13, 2024

Dari Ripple kepada The Big Green DAO: Bagaimana Projek Mata Wang Kripto Menyumbang kepada Amal

Mari kita terokai inisiatif yang memanfaatkan potensi mata wang digital untuk tujuan amal.

Mengetahui lebih lanjut

AlphaFold 3, Med-Gemini, dan lain-lain: The Way AI Transforms Healthcare in 2024

AI menjelma dalam pelbagai cara dalam penjagaan kesihatan, daripada mendedahkan korelasi genetik baharu kepada memperkasakan sistem pembedahan robotik ...

Mengetahui lebih lanjut

Sertai Komuniti Teknologi Inovatif Kami