Laporan Berita
November 06, 2022

ERNIE-ViLG 2.0: Model teks-ke-imej baharu daripada Baidu mengatasi Dalle-2 dan Stable Diffusion

Secara ringkas

Kedua-dua Dalle-2 dan Stable Diffusion diungguli dengan ketara oleh ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 ialah model teks-ke-imej yang menawarkan prestasi yang lebih baik daripada Dalle-2 dan Stable Diffusion, dua daripada model teks-ke-imej yang paling popular pada masa ini. Model baharu itu telah direka dan dilatih oleh sekumpulan penyelidik dari Baidu, dan hasilnya sangat menakjubkan.

Model teks-ke-imej baharu ERNIE-ViLG 2.0 mengatasi prestasi Dalle-2 dan Stable Diffusion
Imej yang dicipta oleh ERNIE-ViLG 2.0

Hasilnya menunjukkan bahawa ERNIE-ViLG 2.0 mengatasi prestasi Dalle-2 dan Stable Diffusion. Ini merupakan pencapaian yang ketara dan menunjukkan kuasa rangka kerja ERNIE. The Metaverse Post pasukan membandingkan ERNIE-ViLG 2.0 dengan Stable Diffusion di bawah:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

Keputusan ini memberikan sokongan kukuh untuk hipotesis bahawa ERNIE-ViLG 2.0 adalah lebih berkesan sistem teks-ke-imej daripada kedua-dua Dalle-2 dan Stable Diffusion.

Seni bina Unet dari Stable Diffusion diambil sebagai asas, tetapi dengan perubahan:

  • Gabungan Pakar Denoising: Terdapat 10 rangkaian saraf dan bukannya hanya satu, dengan setiap satunya bertanggungjawab untuk langkah penyebaran tertentu.
  • Pengetahuan tekstual: Menimbang semula perkataan dalam pertanyaan secara automatik supaya kata kunci mendapat lebih berat.
  • Pengetahuan visual: Semasa latihan, objek telah dikesan pada hasil penjanaan pertengahan, dan berat fungsi kehilangan pada kawasan dengan objek telah meningkat.

Akibatnya, terbesar di dunia model teks ke imej keluar dengan 24 bilion parameter (10 kali lebih besar daripada SD) untuk melatih model.

Berbanding dengan model terdahulu, ERNIE-ViLG 2.0 sangat mengatasinya dari segi kualiti imej dan padanan imej-ke-teks apabila diuji serentak pada ViLG-300 dwibahasa segera ditetapkan oleh seseorang.

Gesaan hanya diterjemahkan daripada bahasa Cina ke bahasa Inggeris secara automatik dalam Muka Berpeluk demo awam sebelum dihantar ke AI. Banyak ciri mengalir daripada ini.

  • ERNIE tidak mengenali tokoh masyarakat antarabangsa. Sebagai contoh, ERNIE tidak mengenali Arnold Schwarzenegger. Ia sememangnya mempunyai kegemaran tempatan di China.
  • Akibatnya, kaedah menggunakan nama selebriti dalam gesaan untuk meningkatkan kualiti secara mendadak muka gagal.
  • Anda boleh menjangkakan sedikit herotan kerana terjemahan daripada bahasa Cina, jadi mungkin terdapat beberapa kejutan untuk anda jika anda tidak berbahasa Cina.
  • Ia tidak tahu apa-apa tentang Greg Rutkowski.

Baca artikel berkaitan:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Hot Stories

Penyelesaian Perdagangan Stablecoin Mata BRICS Nations

by Viktoriia Palchik
Semoga 01, 2024
Sertai Surat Berita Kami.
Berita Terkini

Hari Penghukuman Tiba: Nasib CZ Bergantung Seimbang apabila Mahkamah AS Mempertimbangkan Rayuan DOJ

Changpeng Zhao bersedia untuk menghadapi hukuman di mahkamah AS di Seattle hari ini.

Mengetahui lebih lanjut

Pengasas Samourai Wallet Dituduh Memudahkan $2B dalam Tawaran Darknet

Kebimbangan pengasas Samourai Wallet mewakili kemunduran yang ketara bagi industri, menekankan ...

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Untuk Lebih Lanjut
Baca lagi
Ankr Bekerjasama Dengan AI Blockchain Platform Talus Network Untuk Membuka Kunci Kecairan Bitcoin Untuk AI
Perniagaan Laporan Berita Teknologi
Ankr Bekerjasama Dengan AI Blockchain Platform Talus Network Untuk Membuka Kunci Kecairan Bitcoin Untuk AI
Semoga 1, 2024
Binance Labs Menyokong Makmal Pergerakan Untuk Memudahkan Penyepaduan Pergerakan Facebook Merentasi Blockchain
Perniagaan Laporan Berita Teknologi
Binance Labs Menyokong Makmal Pergerakan Untuk Memudahkan Penyepaduan Pergerakan Facebook Merentasi Blockchain
Semoga 1, 2024
Penyelesaian Perdagangan Stablecoin Mata BRICS Nations
Perniagaan pasaran Cerita dan Ulasan Teknologi
Penyelesaian Perdagangan Stablecoin Mata BRICS Nations
Semoga 1, 2024
Rangkaian Bitcoin L2 BOB Bersepadu Dengan LayerZero Untuk Kefungsian Yang Dipertingkatkan
Perniagaan Laporan Berita Teknologi
Rangkaian Bitcoin L2 BOB Bersepadu Dengan LayerZero Untuk Kefungsian Yang Dipertingkatkan
Semoga 1, 2024