Nyhetsrapport
November 06, 2022

ERNIE-ViLG 2.0: Den nya text-till-bild-modellen från Baidu överträffar Dalle-2 och Stable Diffusion

I korthet

Både Dalle-2 och Stable Diffusion överträffades betydligt av ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 är en text-till-bild-modell som erbjuder bättre prestanda än Dalle-2 och Stable Diffusion, två av de mest populära text-till-bild-modellerna som finns tillgängliga för närvarande. Den nya modellen designades och tränades av ett team av forskare från Baidu, och resultaten är hisnande.

Den nya text-till-bild-modellen ERNIE-ViLG 2.0 överträffar Dalle-2 och Stable Diffusion
Bilden skapad av ERNIE-ViLG 2.0

Resultaten visade att ERNIE-ViLG 2.0 avsevärt överträffade Dalle-2 och Stable Diffusion. Detta är en betydande prestation och visar kraften i ERNIE-ramverket. De Metaverse Post team jämförde ERNIE-ViLG 2.0 med Stable Diffusion Nedan:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

Dessa resultat ger starkt stöd för hypotesen att ERNIE-ViLG 2.0 är en mer effektiv text-till-bild-system än både Dalle-2 och Stable Diffusion.

Unet-arkitekturen från Stable Diffusion tas som grund, men med ändringar:

  • En blandning av denoising-experter: Det finns 10 neurala nätverk istället för bara ett, där var och en endast ansvarar för vissa diffusionssteg.
  • Textkunskaper: Omvikt automatiskt orden i frågan så att sökord får mer vikt.
  • Visuell kunskap: Under träningen upptäcktes föremål på mellangenerationsresultat och vikten av förlustfunktionen på regioner med föremål ökades.

Som ett resultat världens största text-till-bild-modell kom ut med 24 miljarder parametrar (10 gånger större än SD) för att träna modellen.

I jämförelse med tidigare modeller överträffar ERNIE-ViLG 2.0 dem avsevärt när det gäller bildkvalitet och bild-till-text-matchning när de testas samtidigt på ViLG-300 tvåspråkig snabb satt av en person.

Uppmaningar översätts helt enkelt från kinesiska till engelska automatiskt i Kramar ansikte offentlig demo innan den skickas till AI. Många funktioner kommer från detta.

  • ERNIE känner inte internationella offentliga personer. ERNIE känner till exempel inte Arnold Schwarzenegger. Det har verkligen lokala favoriter i Kina.
  • Som ett resultat kommer metoden att använda kändisnamn i uppmaningar att dramatiskt höja kvaliteten på ytorna misslyckas.
  • Du kan förvänta dig en snedvridning på grund av översättningen från kinesiska, så det kan finnas några överraskningar i beredskap för dig om du inte talar kinesiska.
  • Den vet inte ens något om Greg Rutkowski.

Läs relaterade artiklar:

Villkor

I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.

Om författaren

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

fler artiklar
Damir Yalalov
Damir Yalalov

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

Hot Stories

BRICS Nations Eye Stablecoin Trade Solution

by Viktoriia Palchik
Maj 01, 2024
Gå med i vårt nyhetsbrev.
Senaste nytt

Straffdagen anländer: CZ:s öde hänger i balans när den amerikanska domstolen överväger DOJ:s vädjande

Changpeng Zhao är redo att dömas i en amerikansk domstol i Seattle i dag.

Lär dig mer

Samourai Wallet-grundare anklagade för att underlätta $2 miljarder i Darknet-erbjudanden

Uppfattningen av Samourai Wallet-grundarna representerar ett anmärkningsvärt bakslag för branschen, vilket understryker den ihållande ...

Lär dig mer
Gå med i vår innovativa teknikgemenskap
Läs mer
Läs mer
Ankr samarbetar med AI Blockchain Platform Talus Network för att låsa upp Bitcoin-likviditet för AI
Företag Nyhetsrapport Teknologi
Ankr samarbetar med AI Blockchain Platform Talus Network för att låsa upp Bitcoin-likviditet för AI
Maj 1, 2024
Binance Labs stödjer Movement Labs för att underlätta Facebooks Move-integration över blockkedjor
Företag Nyhetsrapport Teknologi
Binance Labs stödjer Movement Labs för att underlätta Facebooks Move-integration över blockkedjor
Maj 1, 2024
BRICS Nations Eye Stablecoin Trade Solution
Företag Marknader Berättelser och recensioner Teknologi
BRICS Nations Eye Stablecoin Trade Solution
Maj 1, 2024
Bitcoin L2 Network BOB integreras med LayerZero för förbättrad funktionalitet
Företag Nyhetsrapport Teknologi
Bitcoin L2 Network BOB integreras med LayerZero för förbättrad funktionalitet
Maj 1, 2024