Nieuwsverslag
06 november 2022

ERNIE-ViLG 2.0: Het nieuwe tekst-naar-beeld-model van Baidu presteert beter dan Dalle-2 en Stable Diffusion

In het kort

Zowel Dalle-2 als Stable Diffusion presteerden aanzienlijk beter dan ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 is een tekst-naar-beeld-model dat betere prestaties biedt dan Dalle-2 en Stable Diffusion, twee van de meest populaire tekst-naar-beeld-modellen die momenteel beschikbaar zijn. Het nieuwe model is ontworpen en getraind door een team van onderzoekers van Baidu en de resultaten zijn adembenemend.

Het nieuwe tekst-naar-beeld-model ERNIE-ViLG 2.0 presteert beter dan Dalle-2 en Stable Diffusion
De afbeelding gemaakt door ERNIE-ViLG 2.0

De resultaten toonden aan dat ERNIE-ViLG 2.0 aanzienlijk beter presteerde dan Dalle-2 en Stable Diffusion. Dit is een belangrijke prestatie en toont de kracht van het ERNIE-raamwerk aan. De Metaverse Post team vergeleek ERNIE-ViLG 2.0 met Stable Diffusion hieronder

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

Deze resultaten bieden sterke ondersteuning voor de hypothese dat ERNIE-ViLG 2.0 effectiever is tekst-naar-beeld-systeem dan zowel Dalle-2 als Stable Diffusion.

De Unet-architectuur van Stable Diffusion wordt als basis genomen, maar met wijzigingen:

  • Een mix van denoising-experts: Er zijn 10 neurale netwerken in plaats van slechts één, en elk is alleen verantwoordelijk voor bepaalde diffusiestappen.
  • Tekstuele kennis: De woorden in de zoekopdracht zijn automatisch opnieuw gewogen, zodat zoekwoorden meer gewicht krijgen.
  • Visuele kennis: Tijdens de training werden objecten gedetecteerd op tussentijdse generatieresultaten en werd het gewicht van de verliesfunctie op gebieden met objecten verhoogd.

Met als resultaat 's werelds grootste tekst-naar-beeld-model kwam uit met 24 miljard parameters (10 keer groter dan SD) om het model te trainen.

In vergelijking met eerdere modellen overtreft ERNIE-ViLG 2.0 deze aanzienlijk in termen van beeldkwaliteit en beeld-naar-tekst-matching wanneer ze gelijktijdig worden getest op de tweetalige ViLG-300 prompt ingesteld door een persoon.

Prompts worden simpelweg automatisch vertaald van het Chinees naar het Engels in de KnuffelenGezicht openbare demo voordat deze naar de AI wordt verzonden. Hieruit vloeien veel functies voort.

  • ERNIE kent geen internationale publieke figuren. ERNIE kent bijvoorbeeld Arnold Schwarzenegger niet. Het heeft zeker lokale favorieten in China.
  • Als gevolg hiervan heeft de methode om namen van beroemdheden te gebruiken in prompts de kwaliteit van de video's dramatisch verbeterd gezichten mislukt.
  • U kunt enige vervorming verwachten vanwege de vertaling uit het Chinees, dus er kunnen enkele verrassingen voor u in petto zijn als u geen Chinees spreekt.
  • Het weet zelfs niets over Greg Rutkowski.

Gerelateerde artikelen lezen:

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

Meer artikelen
Damir Jalalov
Damir Jalalov

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

De institutionele belangstelling groeit richting Bitcoin ETF’s te midden van volatiliteit

Uit openbaarmakingen via 13F-registraties blijkt dat opmerkelijke institutionele beleggers zich bezighouden met Bitcoin ETF's, wat een groeiende acceptatie onderstreept van ...

Meer weten

De dag van de veroordeling breekt aan: het lot van CZ hangt in evenwicht terwijl de Amerikaanse rechtbank het pleidooi van DOJ in overweging neemt

Changpeng Zhao staat vandaag op het punt te worden veroordeeld door een Amerikaanse rechtbank in Seattle.

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
Injective bundelt krachten met AltLayer om de beveiliging van inEVM te herstellen
Business Nieuwsverslag Technologie
Injective bundelt krachten met AltLayer om de beveiliging van inEVM te herstellen
3 mei 2024
Masa werkt samen met Teller om MASA Lending Pool te introduceren, waardoor USDC-leningen op de basis mogelijk worden
Markten Nieuwsverslag Technologie
Masa werkt samen met Teller om MASA Lending Pool te introduceren, waardoor USDC-leningen op de basis mogelijk worden
3 mei 2024
Velodrome lanceert de komende weken de bètaversie van Superchain en breidt zich uit over OP Stack Layer 2 Blockchains
Markten Nieuwsverslag Technologie
Velodrome lanceert de komende weken de bètaversie van Superchain en breidt zich uit over OP Stack Layer 2 Blockchains
3 mei 2024
CARV kondigt partnerschap aan met Aethir om zijn datalaag te decentraliseren en beloningen te verdelen
Business Nieuwsverslag Technologie
CARV kondigt partnerschap aan met Aethir om zijn datalaag te decentraliseren en beloningen te verdelen
3 mei 2024