Laporan Berita Teknologi
Jun 19, 2023

SnapFusion: Model Teks-ke-Imej Pantas untuk Peranti Mudah Alih dalam masa 1.9 Saat

Secara ringkas

SnapFusion menukar penciptaan kandungan dengan berjalan model penyebaran teks ke imej terus pada peranti mudah alih, mengurangkan kos dan menangani kebimbangan privasi.

SnapFusion ialah model AI teks kepada imej yang membolehkan pengguna menjana imej yang menakjubkan daripada penerangan bahasa semula jadi, semuanya dalam masa dua saat sahaja pada peranti mudah alih mereka. Sudah berlalu hari bergantung pada GPU mewah atau perkhidmatan berasaskan awan untuk menjalankan model kompleks ini. SnapFusion mendemokrasikan penciptaan kandungan dengan meletakkan kuasa penyebaran teks ke imej di tangan pengguna.

SnapFusion: Model Teks-ke-Imej yang Pantas dan Cekap untuk Peranti Mudah Alih dalam 1.9 Saat
Kredit: Midjourney / lili10292#2100

Mencipta imej realistik daripada penerangan teks sentiasa menjadi tugas yang mencabar. Model terdahulu memerlukan seni bina rangkaian yang besar dan berbilang lelaran denoising, menjadikannya pengiraan mahal dan perlahan. Tambahan pula, menjalankan model ini selalunya melibatkan penghantaran data pengguna ke perkhidmatan pihak ketiga, meningkatkan kebimbangan privasi.

Untuk menangani cabaran ini, pencipta SnapFusion membangunkan seni bina rangkaian yang cekap dan menambah baik proses penyulingan langkah. Dengan mengenal pasti lebihan dalam model asal, mereka memperkenalkan UNet yang cekap dan mengurangkan pengiraan penyahkod imej melalui penyulingan data. Selain itu, mereka mempertingkatkan penyulingan langkah dengan meneroka strategi latihan dan memperkenalkan teknik regularisasi.

arxiv.org/pdf/2306.00980.pdf

Eksperimen yang meluas pada Dataset MS-COCO menunjukkan keunggulan SnapFusion. Dengan hanya lapan langkah denoising, SnapFusion mencapai skor FID dan CLIP yang lebih baik berbanding sebelumnya model terkini, Stable Diffusion v1.5, yang memerlukan 50 langkah. Peningkatan yang luar biasa dalam kecekapan dan prestasi ini membuka kemungkinan baharu untuk penciptaan kandungan.

Kesan SnapFusion melangkaui pencapaian teknikalnya. Dengan berlari model penyebaran teks ke imej secara langsung pada peranti mudah alih, ia menghapuskan keperluan untuk GPU mahal dan perkhidmatan berasaskan awan. Ini bukan sahaja mengurangkan kos tetapi juga menangani kebimbangan privasi yang berkaitan dengan penghantaran data pengguna kepada pihak ketiga. Pengguna kini boleh melancarkan kreativiti mereka dan menjana imej berkualiti tinggi semasa dalam perjalanan.

Saiz parameter model boleh dikurangkan lagi untuk menjadikannya serasi dengan pelbagai peranti tepi. Selain itu, mengoptimumkan model untuk peranti mudah alih yang berbeza mencapai inferens cepat speeds ialah topik penyelidikan yang berterusan.

Adalah penting untuk menggunakan SnapFusion dan teknologi serupa secara bertanggungjawab untuk mencegah aplikasi berniat jahat. Langkah boleh diambil, seperti sistem pengesanan automatik yang mengenal pasti dan membenderakan kandungan imej yang melanggar peraturan. Dengan mencapai keseimbangan antara inovasi dan pertimbangan etika, SnapFusion boleh mengubah penciptaan kandungan sambil memastikan pengalaman pengguna yang selamat dan bertanggungjawab.

Baca lebih lanjut mengenai AI:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Hot Stories

Inside Wall Street Memes (WSM): Membongkar Tajuk Berita

by Viktoriia Palchik
Semoga 07, 2024

Temui Paus Kripto: Siapa Siapa di Pasaran

by Viktoriia Palchik
Semoga 07, 2024
Sertai Surat Berita Kami.
Berita Terkini

Selera Institusi Berkembang Terhadap Bitcoin ETF Di Tengah-tengah Kemeruapan

Pendedahan melalui pemfailan 13F mendedahkan pelabur institusi terkenal yang berkecimpung dalam Bitcoin ETF, menekankan penerimaan yang semakin meningkat terhadap ...

Mengetahui lebih lanjut

Hari Penghukuman Tiba: Nasib CZ Bergantung Seimbang apabila Mahkamah AS Mempertimbangkan Rayuan DOJ

Changpeng Zhao bersedia untuk menghadapi hukuman di mahkamah AS di Seattle hari ini.

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Lebih Lanjut
Maklumat Lanjut
LD Capital, Antalpha Ventures Dan Highblock Limited Bergabung Pasukan Untuk Melancarkan Dana Kecairan ETF Hong Kong $128J
Perniagaan pasaran Laporan Berita
LD Capital, Antalpha Ventures Dan Highblock Limited Bergabung Pasukan Untuk Melancarkan Dana Kecairan ETF Hong Kong $128J
Semoga 8, 2024
Inside Wall Street Memes (WSM): Membongkar Tajuk Berita
Perniagaan pasaran Cerita dan Ulasan Teknologi
Inside Wall Street Memes (WSM): Membongkar Tajuk Berita
Semoga 7, 2024
Temui Paus Kripto: Siapa Siapa di Pasaran
Perniagaan pasaran Cerita dan Ulasan Teknologi
Temui Paus Kripto: Siapa Siapa di Pasaran
Semoga 7, 2024
Orbiter Finance Bekerjasama Dengan Bitcoin Layer 2 Zulu Network Dan Digunakan Pada Is Lwazi Testnet
Perniagaan Laporan Berita Teknologi
Orbiter Finance Bekerjasama Dengan Bitcoin Layer 2 Zulu Network Dan Digunakan Pada Is Lwazi Testnet 
Semoga 7, 2024