Laporan Berita Teknologi
September 19, 2023

Model Würstchen V2 Menang Stable Diffusion XL dengan Kelajuan Mengagumkan untuk Menjana Imej Beresolusi Tinggi

Tweet terbaru oleh pengarang artikel bertajuk "Würstchen" (Bahasa Jerman untuk "Sosej") telah menarik perhatian peminat dan pakar. Tweet itu berkongsi hasil penjanaan imej yang menarik menggunakan model Würstchen V2 baharu.

Model Würstchen V2 Menang Stable Diffusion XL dengan Kelajuan Mengagumkan untuk Menjana Imej Beresolusi Tinggi
Berkaitan: Midjourney 5.2 dan Stable Diffusion Kemas Kini SDXL 0.9 untuk Penjanaan Teks-ke-Imej Kreatif

Würstchen adalah pantas dan cekap, menghasilkan imej lebih pantas daripada model sepertinya Stable Diffusion XL semasa menggunakan kurang memori. Ia juga telah mengurangkan kos latihan, dengan Würstchen v1 hanya memerlukan 9,000 jam GPU latihan pada resolusi 512×512, berbanding 150,000 jam GPU yang dibelanjakan untuk Stable Diffusion 1.4. Pengurangan 16x ganda dalam kos ini bukan sahaja memberi manfaat kepada penyelidik yang menjalankan eksperimen baharu tetapi juga membuka pintu kepada lebih banyak organisasi untuk melatih model sedemikian. Würstchen v2 menggunakan 24,602 jam GPU, menjadikannya 6x lebih murah daripada SD1.4, yang hanya dilatih pada 512×512.

Satu ciri menonjol yang segera menarik perhatian komuniti AI ialah kepantasan Würstchen V2 yang mengagumkan. Menurut penulis, menghasilkan empat imej 1024×2048 menggunakan model ini hanya mengambil masa 7 saat. Untuk meletakkan ini dalam perspektif, model SDXL memerlukan 40 saat yang agak lembap untuk mencapai tugas yang sama.

Würstchen V1, yang diperkenalkan sebelum ini, berkongsi asasnya dengan SDXL sebagai Latent Model resapan tetapi menggabungkan seni bina Unet yang lebih pantas. Memandangkan komuniti tidak sabar-sabar menjangkakan butiran lanjut tentang seni bina Würstchen V2, kelajuan yang dipertingkatkan sahaja menandakannya sebagai perkembangan yang patut diberi perhatian.

Würstchen V2 ialah a model penyebaran yang berfungsi dalam ruang terpendam imej yang sangat mampat, mengurangkan kos pengiraan untuk latihan dan inferens mengikut susunan magnitud. Ia menggunakan reka bentuk baru yang mencapai pemampatan spatial 42x, satu pencapaian yang tidak pernah dilihat sebelum ini. Würstchen menggunakan pemampatan dua peringkat, Peringkat A dan Peringkat B, yang menyahkod imej termampat kembali ke ruang piksel. Model ketiga, Peringkat C, dipelajari dalam ruang pendam yang sangat mampat, memerlukan pecahan pengiraan yang digunakan untuk model berprestasi terbaik semasa sambil membenarkan inferens yang lebih murah dan lebih pantas.

Würstchen V2 terdiri daripada dua peringkat penyebaran:

  • Peringkat A: Peringkat ini melibatkan penyebaran berkondisi teks dan mempunyai 1 bilion parameter yang mengejutkan. Pecutan di sini dicapai melalui teknik mampatan ultra tinggi. Terutama, bukannya saiz kod tersembunyi 128x128x4, seperti yang dilihat dalam SDXL, Würstchen V2 pada mulanya beroperasi pada resolusi 24x24x16. Ini bermakna lebih sedikit piksel tetapi lebih banyak saluran, menghasilkan peningkatan kelajuan yang ketara.
  • Peringkat B: Ini ialah model resapan yang dilengkapi dengan 600 juta parameter, bertanggungjawab untuk menyahmampat imej daripada 24×24 kepada resolusi 128×128.

Melengkapkan proses ialah penyahkod dengan 20 juta parameter yang mengubah kod tersembunyi menjadi imej yang diberikan.

Faedah praktikal yang menyerlah serta-merta ialah kelajuan luar biasa Würstchen V2. Ia beroperasi pada halaju yang 2-2.5 kali lebih pantas daripada SDXL, satu kemajuan yang ketara dalam bidang Penjanaan imej AI.

Seperti mana-mana inovasi teknologi, mungkin terdapat pertukaran. Dari segi kualiti imej, sesetengah pakar mencadangkan sedikit kerugian, walaupun perbandingan yang komprehensif dan jujur ​​masih ditunggu untuk memberikan bukti konkrit.

Contoh teks-ke-imej yang dijana adalah di bawah:

Baca lebih banyak topik berkaitan:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Selera Institusi Berkembang Terhadap Bitcoin ETF Di Tengah-tengah Kemeruapan

Pendedahan melalui pemfailan 13F mendedahkan pelabur institusi terkenal yang berkecimpung dalam Bitcoin ETF, menekankan penerimaan yang semakin meningkat terhadap ...

Mengetahui lebih lanjut

Hari Penghukuman Tiba: Nasib CZ Bergantung Seimbang apabila Mahkamah AS Mempertimbangkan Rayuan DOJ

Changpeng Zhao bersedia untuk menghadapi hukuman di mahkamah AS di Seattle hari ini.

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Lebih Lanjut
Maklumat Lanjut
Layer3 Untuk Melancarkan Token L3 Musim Panas Ini, Memperuntukkan 51% Daripada Jumlah Bekalan Kepada Komuniti
pasaran Laporan Berita Teknologi
Layer3 Untuk Melancarkan Token L3 Musim Panas Ini, Memperuntukkan 51% Daripada Jumlah Bekalan Kepada Komuniti
Semoga 10, 2024
Amaran Terakhir Edward Snowden kepada Pemaju Bitcoin: “Jadikan Privasi sebagai Keutamaan Tahap Protokol atau Risiko Kehilangannya
pasaran Keselamatan Wiki perisian Cerita dan Ulasan Teknologi
Amaran Terakhir Edward Snowden kepada Pemaju Bitcoin: “Jadikan Privasi sebagai Keutamaan Tahap Protokol atau Risiko Kehilangannya
Semoga 10, 2024
Pudina Rangkaian Lapisan 2 Ethereum Dikuasakan Optimisme Untuk Melancarkan Mainnetnya Pada 15 Mei
Laporan Berita Teknologi
Pudina Rangkaian Lapisan 2 Ethereum Dikuasakan Optimisme Untuk Melancarkan Mainnetnya Pada 15 Mei
Semoga 10, 2024
Tawaran Teratas Minggu Ini, Pelaburan Utama dalam AI, IT, Web3, dan Kripto (06-10.04)
Digest Perniagaan pasaran perisian Teknologi
Tawaran Teratas Minggu Ini, Pelaburan Utama dalam AI, IT, Web3, dan Kripto (06-10.04)
Semoga 10, 2024