Novinová správa Technológia
Júna 23, 2023

Midjourney 5.2 a Stable Diffusion Aktualizácie SDXL 0.9 pre kreatívne generovanie textu na obrázok

Stručne

StabilityAI vydala najnovší model, Stable Diffusion SDXL 0.9, ktorý sľubuje lepšie vnímanie výzvy a vylepšené detaily obrazu.

Midjourney 5.2 prináša nové funkcie ako Outpainting, príkaz /shorten, prispôsobiteľné variácie a transformáciu obrazu 1:1.

Očakáva sa, že tieto aktualizácie vylepšia používateľskú skúsenosť a zvýši kreativitu v kreatívnom procese.

Dnes oba hlavné generátory prevodu textu na obrázok vydali významné aktualizácie. Vylepšená presnosť pri generovaní realistických obrázkov z textových popisov, ako aj nové funkcie, ktoré používateľom umožňujú ovládať štýl a kompozíciu generovaných obrázkov.

Midjourney 5.2 a Stable Diffusion Aktualizácie SDXL 0.9 pre Creative Image Generation
kredit: Midjourney

Nové funkcie v jazyku Midjourney 5.2

Okrem StabilityAIaktualizácie používateľa, Midjourney tiež zaviedla vzrušujúce funkcie s vydaním Midjourney 5.2. Jedným pozoruhodným doplnkom je funkcia Zoom Out, ktorá sa podobá Generatívna výplň Adobe pre Photoshop. Je však dôležité poznamenať, že MidjourneyFunkcia Zoom Out nezahŕňa masky a výsledok do značnej miery závisí od rozsahu parametra „urobiť“.

Midjourney 5.2 prináša celý rad nových možností, ktoré zlepšujú používateľskú skúsenosť. Najmä vydanie Stable Diffusion XL 0.9 zatienil silnú aktualizáciu v r Midjourney, ktorú mnohí používatelia spočiatku prehliadali.

Niektoré z kľúčových funkcií a vylepšení v Midjourney 5.2:

  • Outpainting: Používatelia môžu teraz preskúmať funkciu Outpainting s možnosťami, ako sú 1.5, 2 a vlastné nastavenia. Pri opakovanom použití táto funkcia prináša pôsobivé výsledky.
  • Prispôsobiteľné variácie: Sila variácií v Midjourney je teraz prispôsobiteľné. Používatelia môžu bez námahy prepínať medzi slabými a silnými variáciami výberom dvoch tlačidiel, čo ponúka väčšiu flexibilitu v kreatívnom procese.
  • Transformácia obrazu 1:1: Midjourney teraz umožňuje používateľom transformovať akýkoľvek obrázok do štvorca s pomerom strán 1:1, čo umožňuje bezproblémovú integráciu v rôznych kontextoch.

Takže, Midjourney 5.2 zaviedol novú funkciu s názvom prompt parser, ktorá ešte viac zjednodušuje vytváranie pôsobivých obrázkov. Pomocou príkazu „/skrátiť [vaša výzva] môžu teraz používatelia identifikovať dôležité slová a odstrániť nepotrebné, čím optimalizujú svoje vyzve na dosiahnutie najlepších výsledkov. Analyzátor tiež priraďuje váhy každému slovu, čo umožňuje používateľom vybrať si z piatich možností pre najvhodnejšiu výzvu. Zjednodušene povedané, pomáha transformovať nejasné nápady na výzvu, ktorá lepšie zodpovedá zámerom a potrebám používateľov.

Pokiaľ ide o riadenie procesov, Midjourney dobiehala konkurenciu. Pokiaľ však ide o užívateľskú prívetivosť, Midjourney zaostáva. Tí, ktorí hľadajú pohodlie pred flexibilitou, môžu byť priťahovaní adobe firefly, konkurenčná platforma známa svojimi užívateľsky príjemnými funkciami. Na druhej strane, Stable Diffusion, so svojou povahou open source a rozšíreniami ponúka bezkonkurenčnú flexibilitu. Napriek tomu StabilityAIPríležitostné oneskorenia a nejednoznačné vyhlásenia ako „50 % vyškolených“ a „budú k dispozícii v polovici júla, ale to je nepresné“, keď budú váhy k dispozícii, všetko sa hladko vyrovná.

S týmito pokrokmi, Midjourney naďalej poskytuje vzrušujúce funkcie pre jednoduché a efektívne generovanie obrazu. Používatelia si teraz môžu užívať väčšiu kontrolu nad svojimi výzvami, čo vedie k lepším výstupom. Ako technológia neustále napreduje, platformy ako Midjourney cieľom je zlepšiť používateľské skúsenosti a sprístupniť kreatívne úsilie všetkým.

Okrem toho najnovšia verzia Midjourney zdôrazňuje realizmus, ktorý je obzvlášť viditeľný v umeleckej generácie. Na zvýraznenie týchto vylepšení sa vykonalo porovnanie medzi výzvou a počiatočnou hodnotou Midjourney verzie 5.1 a 5.2.

Čerstvo vytvorené príklady od Midjourney 5.2:

Nové funkcie v jazyku Stable Diffusion SDXL 0.9

StabilityAI urobila vylepšenia uvedením svojho najnovšieho modelu, Stable Diffusion SDXL 0.9. Sľubujú lepšie vnímanie výzvy a vylepšené detaily obrazu, čo používateľom umožňuje vytvárať podmanivejšie vizuálne prvky. Ešte lepšie je, že nový model si už teraz môžete bezplatne vyskúšať Klip Drop.

Stable Diffusion Model SDXL 0.9 si získal pozornosť od svojho vydania StabilityAI. Aj keď je k dispozícii oficiálne potvrdenie vydania, odkaz ešte nebol poskytnutý. V základnej verzii sa model SDXL 0.9 môže pochváliť pôsobivými parametrami 3.5 miliardy. Okrem toho sa plánuje ďalší súbor dvoch modelov s celkovými parametrami 6.6 miliardy.

Ak chcete dosiahnuť lepšie generovanie obrazu, StabilityAI využíva zreťazenie dvoch modelov CLIP: základná spona z OpenAI a OpenCLIP ViT-G/14. Táto fúzia umožňuje generovanie presnejších detailov na obrázkoch. Porovnania párových obrázkov medzi SDXL beta a nová verzia SDXL 0.9 jasne demonštruje podstatné zlepšenie kvality.

Stojí za zmienku, že použitie modelu SDXL 0.9 počas odvodzovania vyžaduje grafickú kartu s najmenej 16 GB VRAM, aby sa zabezpečil plynulý výkon. Keďže používatelia netrpezlivo očakávajú komplexný blogový príspevok so všetkými podrobnosťami a vydaním kódu, očakávajú sa ďalšie vylepšenia a príležitosti.

Čerstvo vytvorené príklady pomocou SDXL 0.9:

Prečítajte si viac o AI:

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Ďalšie články
Damir Yalalov
Damir Yalalov

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Hot Stories
Pridajte sa k nášmu newsletteru.
Novinky

Inštitucionálny apetít rastie smerom k bitcoinovým ETF uprostred volatility

Zverejnenia prostredníctvom podaní 13F odhaľujú pozoruhodných inštitucionálnych investorov, ktorí sa venujú bitcoinovým ETF, čo podčiarkuje rastúcu akceptáciu ...

vedieť viac

Prichádza deň odsúdenia: Osud CZ visí v rovnováhe, pretože americký súd zvažuje žalobu ministerstva spravodlivosti

Changpeng Zhao dnes čaká na americkom súde v Seattli odsúdenie.

vedieť viac
Pripojte sa k našej komunite inovatívnych technológií
Čítaj viac
Čítaj viac
Posun Donalda Trumpa ku kryptomenám: od oponenta k advokátovi a čo to znamená pre americký trh s kryptomenami
firmy trhy Príbehy a recenzie Technológia
Posun Donalda Trumpa ku kryptomenám: od oponenta k advokátovi a čo to znamená pre americký trh s kryptomenami
Môže 10, 2024
Layer3 na spustenie tokenu L3 toto leto, pričom komunite pridelí 51 % celkovej ponuky
trhy Novinová správa Technológia
Layer3 na spustenie tokenu L3 toto leto, pričom komunite pridelí 51 % celkovej ponuky
Môže 10, 2024
Posledné varovanie Edwarda Snowdena pre vývojárov bitcoínov: „Urobte zo súkromia prioritu na úrovni protokolu alebo riskujte jeho stratu
trhy zabezpečenia Wiki Softvér Príbehy a recenzie Technológia
Posledné varovanie Edwarda Snowdena pre vývojárov bitcoínov: „Urobte zo súkromia prioritu na úrovni protokolu alebo riskujte jeho stratu
Môže 10, 2024
Optimizmom poháňaná sieť Ethereum Layer 2 Mint spustí svoju hlavnú sieť 15. mája
Novinová správa Technológia
Optimizmom poháňaná sieť Ethereum Layer 2 Mint spustí svoju hlavnú sieť 15. mája
Môže 10, 2024
CRYPTOMERIA LABS PTE. LTD.