Nyheds rapport
November 06, 2022

ERNIE-ViLG 2.0: Den nye tekst-til-billede-model fra Baidu overgår Dalle-2 og Stable Diffusion

Kort sagt

Både Dalle-2 og Stable Diffusion blev markant bedre end ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 er en tekst-til-billede model, der giver bedre ydeevne end Dalle-2 og Stable Diffusion, to af de mest populære tekst-til-billede-modeller, der er tilgængelige i øjeblikket. Den nye model er designet og trænet af et team af forskere fra Baidu, og resultaterne er betagende.

Den nye tekst-til-billede model ERNIE-ViLG 2.0 overgår Dalle-2 og Stable Diffusion
Billedet skabt af ERNIE-ViLG 2.0

Resultaterne viste, at ERNIE-ViLG 2.0 klarede sig markant bedre end Dalle-2 og Stable Diffusion. Dette er en betydelig præstation og demonstrerer styrken i ERNIE-rammen. Det Metaverse Post team sammenlignede ERNIE-ViLG 2.0 med Stable Diffusion nedenfor:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

Disse resultater giver stærk støtte til hypotesen om, at ERNIE-ViLG 2.0 er en mere effektiv tekst-til-billede system end både Dalle-2 og Stable Diffusion.

Unet-arkitekturen fra Stable Diffusion tages som udgangspunkt, men med ændringer:

  • En blanding af denoising-eksperter: Der er 10 neurale netværk i stedet for kun ét, hvor hver kun er ansvarlig for visse diffusionstrin.
  • Tekstkendskab: Omvægtede automatisk ordene i forespørgslen, så søgeord får mere vægt.
  • Visuel viden: Under træning blev objekter detekteret på mellemgenerationsresultater, og vægten af ​​tabsfunktionen på regioner med objekter blev øget.

Som et resultat, verdens største tekst-til-billede model kom ud med 24 milliarder parametre (10 gange større end SD) for at træne modellen.

I sammenligning med tidligere modeller overgår ERNIE-ViLG 2.0 dem meget med hensyn til billedkvalitet og billed-til-tekst-matchning, når de testes samtidigt på ViLG-300 tosproget prompt sat af en person.

Prompts oversættes simpelthen automatisk fra kinesisk til engelsk i KrammerFace offentlig demo, før den sendes ind i AI. En masse funktioner kommer fra dette.

  • ERNIE kender ikke internationale offentlige personer. For eksempel kender ERNIE ikke Arnold Schwarzenegger. Det har bestemt lokale favoritter i Kina.
  • Som følge heraf vil metoden med at bruge berømthedsnavne i prompter til dramatisk at øge kvaliteten af ansigter mislykkes.
  • Du kan forvente en vis forvrængning på grund af oversættelsen fra kinesisk, så der kan være nogle overraskelser i vente, hvis du ikke taler kinesisk.
  • Den ved ikke engang noget om Greg Rutkowski.

Læs relaterede artikler:

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Flere artikler
Damir Yalalov
Damir Yalalov

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Hot Stories
Tilmeld dig vores nyhedsbrev.
Seneste Nyheder

Institutionel appetit vokser mod Bitcoin ETF'er midt i volatilitet

Afsløringer gennem 13F-arkivering afslører bemærkelsesværdige institutionelle investorer, der dytter i Bitcoin ETF'er, hvilket understreger en voksende accept af ...

Vide mere

Straffeudmålingsdagen ankommer: CZ's skæbne hænger i balance, da amerikansk domstol overvejer DOJ's anbringende

Changpeng Zhao står klar til at blive dømt ved en amerikansk domstol i Seattle i dag.

Vide mere
Tilmeld dig vores innovative teknologifællesskab
Læs mere
Læs mere
Injective slår sig sammen med AltLayer for at give inEVM genskabende sikkerhed
Forretning Nyheds rapport Teknologier
Injective slår sig sammen med AltLayer for at give inEVM genskabende sikkerhed
Maj 3, 2024
Masa går sammen med Teller for at introducere MASA Lending Pool, muliggør USDC-lån på base
Markeder Nyheds rapport Teknologier
Masa går sammen med Teller for at introducere MASA Lending Pool, muliggør USDC-lån på base
Maj 3, 2024
Velodrome lancerer Superchain Beta-version i de kommende uger og udvider på tværs af OP Stack Layer 2 Blockchains
Markeder Nyheds rapport Teknologier
Velodrome lancerer Superchain Beta-version i de kommende uger og udvider på tværs af OP Stack Layer 2 Blockchains
Maj 3, 2024
CARV annoncerer partnerskab med Aethir for at decentralisere sit datalag og uddele belønninger
Forretning Nyheds rapport Teknologier
CARV annoncerer partnerskab med Aethir for at decentralisere sit datalag og uddele belønninger
Maj 3, 2024