Ulat sa Balita
Nobyembre 06, 2022

ERNIE-ViLG 2.0: Ang bagong text-to-image na modelo mula sa Baidu ay higit sa Dalle-2 at Stable Diffusion

Sa madaling sabi

Parehong Dalle-2 at Stable Diffusion ay makabuluhang nalampasan ng ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 ay isang text-to-image na modelo na nag-aalok ng mas mahusay na pagganap kaysa sa Dalle-2 at Stable Diffusion, dalawa sa pinakasikat na mga modelo ng text-to-image na kasalukuyang available. Ang bagong modelo ay dinisenyo at sinanay ng isang pangkat ng mga mananaliksik mula sa Baidu, at ang mga kinalabasan ay nakamamanghang.

Ang bagong text-to-image na modelong ERNIE-ViLG 2.0 ay higit sa Dalle-2 at Stable Diffusion
Ang imahe na nilikha ng ERNIE-ViLG 2.0

Ang mga kinalabasan ay nagpakita na ang ERNIE-ViLG 2.0 ay higit na nalampasan ang Dalle-2 at Stable Diffusion. Ito ay isang makabuluhang tagumpay at nagpapakita ng kapangyarihan ng balangkas ng ERNIE. Ang Metaverse Post team kumpara sa ERNIE-ViLG 2.0 sa Stable Diffusion sa ibaba:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

Ang mga resultang ito ay nagbibigay ng malakas na suporta para sa hypothesis na ang ERNIE-ViLG 2.0 ay mas epektibo text-to-image system kaysa sa Dalle-2 at Stable Diffusion.

Ang arkitektura ng Unet mula sa Stable Diffusion ay kinuha bilang batayan, ngunit may mga pagbabago:

  • Isang Pinaghalong Mga Eksperto sa Pagbabawas: Mayroong 10 neural network sa halip na isa lamang, na ang bawat isa ay responsable lamang para sa ilang mga hakbang sa pagsasabog.
  • Kaalaman sa teksto: Awtomatikong na-reweight ang mga salita sa query para mas tumaba ang mga keyword.
  • Visual na kaalaman: Sa panahon ng pagsasanay, ang mga bagay ay nakita sa mga resulta ng intermediate na henerasyon, at ang bigat ng pagkawala ng function sa mga rehiyon na may mga bagay ay nadagdagan.

Bilang resulta, ang pinakamalaki sa mundo modelo ng text-to-image lumabas na may 24 bilyong parameter (10 beses na mas malaki kaysa sa SD) upang sanayin ang modelo.

Kung ihahambing sa mga naunang modelo, ang ERNIE-ViLG 2.0 ay higit na lumalampas sa mga ito sa mga tuntunin ng kalidad ng imahe at pagtutugma ng imahe-sa-teksto kapag sinubukan nang sabay-sabay sa ViLG-300 bilingual prompt itinakda ng isang tao.

Ang mga prompt ay awtomatikong isinalin mula sa Chinese patungo sa Ingles sa Hugging Mukha pampublikong demo bago ipadala sa AI. Maraming mga tampok ang dumadaloy mula dito.

  • Hindi kilala ni ERNIE ang mga international public figure. Halimbawa, hindi kilala ni ERNIE si Arnold Schwarzenegger. Tiyak na mayroon itong mga lokal na paborito sa China.
  • Bilang resulta, ang paraan ng paggamit ng mga pangalan ng celebrity sa mga senyas upang kapansin-pansing palakasin ang kalidad ng mukha nabigo.
  • Maaari mong asahan ang ilang pagbaluktot dahil sa pagsasalin mula sa Chinese, kaya maaaring may ilang sorpresa na naghihintay para sa iyo kung hindi ka nagsasalita ng Chinese.
  • Ni wala itong alam tungkol kay Greg Rutkowski.

Basahin ang mga kaugnay na artikulo:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Mas marami pang artikulo
Damir Yalalov
Damir Yalalov

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Hot Stories

BRICS Nations Eye Stablecoin Trade Solution

by Viktoriia Palchik
Mayo 01, 2024
Sumali sa Aming Newsletter.
Pinakabagong Balita

Dumating na ang Araw ng Pagsentensiya: Ang Kapalaran ni CZ ay Nagbabalanse habang Isinasaalang-alang ng Korte ng US ang Panawagan ng DOJ

Si Changpeng Zhao ay handang harapin ang sentensiya sa korte ng US sa Seattle ngayon.

Malaman Higit Pa

Ang Mga Tagapagtatag ng Samourai Wallet ay Inakusahan na Nagpapadali ng $2B sa Darknet Deals

Ang pangamba ng mga tagapagtatag ng Samourai Wallet ay kumakatawan sa isang kapansin-pansing pag-urong para sa industriya, na binibigyang-diin ang patuloy na ...

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Nakipagtulungan ang Ankr Sa AI Blockchain Platform Talus Network Upang I-unlock ang Bitcoin Liquidity Para sa AI
Negosyo Ulat sa Balita Teknolohiya
Nakipagtulungan ang Ankr Sa AI Blockchain Platform Talus Network Upang I-unlock ang Bitcoin Liquidity Para sa AI
Mayo 1, 2024
Sinusuportahan ng Binance Labs ang Movement Labs Upang Pangasiwaan ang Pagsasama-sama ng Facebook sa Mga Blockchain
Negosyo Ulat sa Balita Teknolohiya
Sinusuportahan ng Binance Labs ang Movement Labs Upang Pangasiwaan ang Pagsasama-sama ng Facebook sa Mga Blockchain
Mayo 1, 2024
BRICS Nations Eye Stablecoin Trade Solution
Negosyo markets Mga Kuwento at Pagsusuri Teknolohiya
BRICS Nations Eye Stablecoin Trade Solution
Mayo 1, 2024
Bitcoin L2 Network BOB Sumasama Sa LayerZero Para sa Pinahusay na Paggana
Negosyo Ulat sa Balita Teknolohiya
Bitcoin L2 Network BOB Sumasama Sa LayerZero Para sa Pinahusay na Paggana
Mayo 1, 2024
CRYPTOMERIA LABS PTE. LTD.