Uudiste reportaaž
November 06, 2022

ERNIE-ViLG 2.0: Baidu uus tekstist pildiks muutmise mudel ületab Dalle-2 ja Stable Diffusion

Põgusalt

Nii Dalle-2 kui Stable Diffusion ERNIE-ViLG 2.0 edestas oluliselt

ERNIE-ViLG 2.0 on tekstist pildiks muutev mudel, mis pakub paremat jõudlust kui Dalle-2 ja Stable Diffusion, kaks kõige populaarsemat praegu saadaolevat tekstist pildiks muutmise mudelit. Uue mudeli kujundas ja koolitas Baidu teadlaste meeskond ning tulemused on hingematvad.

Uus tekstist pildiks muutmise mudel ERNIE-ViLG 2.0 ületab Dalle-2 ja Stable Diffusion
ERNIE-ViLG 2.0 loodud pilt

Tulemused näitasid, et ERNIE-ViLG 2.0 ületas oluliselt Dalle-2 ja Stable Diffusion. See on märkimisväärne saavutus ja näitab ERNIE raamistiku võimsust. The Metaverse Post meeskond võrdles ERNIE-ViLG 2.0-ga Stable Diffusion allpool:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

Need tulemused toetavad tugevalt hüpoteesi, et ERNIE-ViLG 2.0 on tõhusam teksti-pildiks süsteem kui nii Dalle-2 kui ka Stable Diffusion.

Uneti arhitektuur aastast Stable Diffusion võetakse aluseks, kuid muudatustega:

  • Müra vähendamise ekspertide segu: Ühe närvivõrgu asemel on 10, millest igaüks vastutab ainult teatud difusioonietappide eest.
  • Tekstialased teadmised: Kaaluti päringus olevad sõnad automaatselt ümber, et märksõnad saaksid suurema kaalu.
  • Visuaalsed teadmised: Treeningu käigus tuvastati objektid vahepealsete generatsioonide tulemuste põhjal ja suurendati kadufunktsiooni kaalu objektidega piirkondades.

Selle tulemusena maailma suurim tekst-pildiks mudel tuli mudeli koolitamiseks välja 24 miljardi parameetriga (10 korda suurem kui SD).

Võrreldes varasemate mudelitega ületab ERNIE-ViLG 2.0 neid oluliselt pildikvaliteedi ja pildi ja teksti sobitamise osas, kui seda testitakse samaaegselt kakskeelsel ViLG-300 kiire inimese poolt seatud.

Viibad tõlgitakse lihtsalt automaatselt hiina keelest inglise keelde Kallistav Nägu avalik demo enne AI-sse saatmist. Sellest tuleneb palju funktsioone.

  • Rahvusvahelisi avaliku elu tegelasi ERNIE ei tunne. Näiteks ERNIE ei tunne Arnold Schwarzeneggerit. Kindlasti on sellel Hiinas kohalikke lemmikuid.
  • Selle tulemusel ajendab kuulsuste nimede kasutamine viipades oluliselt tõsta nägu ebaõnnestub.
  • Hiinakeelse tõlke tõttu võite oodata mõningaid moonutusi, nii et kui te hiina keelt ei räägi, võib teid oodata üllatusi.
  • See ei tea isegi Greg Rutkowskist midagi.

Loe seotud artikleid:

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks. 

Veel artikleid
Damir Jalalov
Damir Jalalov

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks. 

Institutsionaalne isu kasvab volatiilsuse tõttu Bitcoini ETF-ide poole

13F-i dokumentide kaudu avaldatud teave paljastab märkimisväärsed institutsionaalsed investorid, kes tegelevad Bitcoini ETF-idega, rõhutades, et ...

Rohkem teada

Karistuspäev saabub: CZ saatus on tasakaalus, kuna USA kohus võtab DOJ palvet arvesse

Changpeng Zhao ootab täna ees kohtuotsus USA Seattle'i kohtus.

Rohkem teada
Liituge meie uuendusliku tehnikakogukonnaga
Loe rohkem
Loe edasi
Robinhoodi krüpto sai väärtpaberi- ja börsikomisjonilt Wellsi teate väidetavate väärtpaberirikkumiste kohta
turud Uudiste reportaaž Tehnoloogia
Robinhoodi krüpto sai väärtpaberi- ja börsikomisjonilt Wellsi teate väidetavate väärtpaberirikkumiste kohta
Võib 6 2024
QuickSwap juurutab X-kihi põhivõrgus ja laiendab Polygon CDK võrku koos tsitadelli käivitamisega
Uudiste reportaaž Tehnoloogia
QuickSwap juurutab X-kihi põhivõrgus ja laiendab Polygon CDK võrku koos tsitadelli käivitamisega 
Võib 6 2024
Layer 2 Network Linea algatab ZeroLendi ZERO Token Claiming For Airdrop Kasutajad ja investorid
turud Uudiste reportaaž Tehnoloogia
Layer 2 Network Linea algatab ZeroLendi ZERO Token Claiming For Airdrop Kasutajad ja investorid
Võib 6 2024
Binance lõpetab BIDR-i toodete ja teenuste toetamise, soovitab kasutajatel raha konverteerida enne 20. augustit
turud Uudiste reportaaž Tehnoloogia
Binance lõpetab BIDR-i toodete ja teenuste toetamise, soovitab kasutajatel raha konverteerida enne 20. augustit
Võib 6 2024
CRYPTOMERIA LABS PTE. LTD.