Novinová správa
Novembra 06, 2022

ERNIE-ViLG 2.0: Nový model prevodu textu na obrázok od Baidu prekonáva Dalle-2 a Stable Diffusion

Stručne

Obaja Dalle-2 a Stable Diffusion boli výrazne lepšie ako ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 je model prevodu textu na obrázok, ktorý ponúka lepší výkon ako Dalle-2 a Stable Diffusion, dva z najpopulárnejších modelov prevodu textu na obrázok, ktoré sú v súčasnosti k dispozícii. Nový model bol navrhnutý a vyškolený tímom výskumníkov z Baidu a výsledky sú úchvatné.

Nový model prevodu textu na obrázok ERNIE-ViLG 2.0 prekonáva Dalle-2 a Stable Diffusion
Obrázok vytvorený ERNIE-ViLG 2.0

Výsledky ukázali, že ERNIE-ViLG 2.0 výrazne prekonal Dalle-2 a Stable Diffusion. Toto je významný úspech a demonštruje silu rámca ERNIE. The Metaverse Post tím porovnal ERNIE-ViLG 2.0 s Stable Diffusion nižšie:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

Tieto výsledky poskytujú silnú podporu pre hypotézu, že ERNIE-ViLG 2.0 je efektívnejší text-to-image systém ako Dalle-2 a Stable Diffusion.

Architektúra Unet z Stable Diffusion sa berie ako základ, ale so zmenami:

  • Zmes odborníkov na odšumovanie: Existuje 10 neurónových sietí namiesto jednej, pričom každá je zodpovedná len za určité kroky šírenia.
  • znalosť textu: Automaticky prehodnotila slová v dopyte, aby kľúčové slová získali väčšiu váhu.
  • Vizuálne znalosti: Počas tréningu boli objekty detegované na výsledkoch strednej generácie a zvýšila sa váha stratovej funkcie v oblastiach s objektmi.

V dôsledku toho najväčší na svete model textu na obrázok vyšiel s 24 miliardami parametrov (10-krát väčšími ako SD) na trénovanie modelu.

V porovnaní s predchádzajúcimi modelmi ich ERNIE-ViLG 2.0 výrazne prevyšuje z hľadiska kvality obrazu a zhody medzi obrazom a textom, keď sa testuje súčasne na dvojjazyčnom zariadení ViLG-300. prompt nastavené osobou.

Výzvy sa jednoducho prekladajú z čínštiny do angličtiny automaticky v HuggingFace verejné demo pred odoslaním do AI. Z toho vyplýva množstvo funkcií.

  • ERNIE nepozná medzinárodné verejné osobnosti. Napríklad ERNIE nepozná Arnolda Schwarzeneggera. Určite má v Číne miestne obľúbené.
  • Výsledkom je, že metóda používania mien celebrít vo výzvach na dramatické zvýšenie kvality tváre zlyhá.
  • Môžete očakávať určité skreslenie kvôli prekladu z čínštiny, takže ak neviete po čínsky, môžu vás čakať prekvapenia.
  • Nevie nič ani o Gregovi Rutkowskom.

Prečítajte si súvisiace články:

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Ďalšie články
Damir Yalalov
Damir Yalalov

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Inštitucionálny apetít rastie smerom k bitcoinovým ETF uprostred volatility

Zverejnenia prostredníctvom podaní 13F odhaľujú pozoruhodných inštitucionálnych investorov, ktorí sa venujú bitcoinovým ETF, čo podčiarkuje rastúcu akceptáciu ...

vedieť viac

Prichádza deň odsúdenia: Osud CZ visí v rovnováhe, pretože americký súd zvažuje žalobu ministerstva spravodlivosti

Changpeng Zhao dnes čaká na americkom súde v Seattli odsúdenie.

vedieť viac
Pripojte sa k našej komunite inovatívnych technológií
Čítaj viac
Čítaj viac
Injective spája svoje sily s AltLayer, aby priniesla bezpečnosť pri prestavbe inEVM
firmy Novinová správa Technológia
Injective spája svoje sily s AltLayer, aby priniesla bezpečnosť pri prestavbe inEVM
Môže 3, 2024
Masa sa spojila so spoločnosťou Teller, aby predstavila fond pôžičiek MASA a umožnila požičiavanie USDC na základni
trhy Novinová správa Technológia
Masa sa spojila so spoločnosťou Teller, aby predstavila fond pôžičiek MASA a umožnila požičiavanie USDC na základni
Môže 3, 2024
Velodrome uvádza na trh beta verziu Superchain v najbližších týždňoch a rozširuje sa o blockchainy OP Stack Layer 2
trhy Novinová správa Technológia
Velodrome uvádza na trh beta verziu Superchain v najbližších týždňoch a rozširuje sa o blockchainy OP Stack Layer 2
Môže 3, 2024
CARV oznamuje partnerstvo so spoločnosťou Aethir s cieľom decentralizovať svoju dátovú vrstvu a distribuovať odmeny
firmy Novinová správa Technológia
CARV oznamuje partnerstvo so spoločnosťou Aethir s cieľom decentralizovať svoju dátovú vrstvu a distribuovať odmeny
Môže 3, 2024
CRYPTOMERIA LABS PTE. LTD.