Novinky Technika
Června 23, 2023

Midjourney 5.2 a Stable Diffusion Aktualizace SDXL 0.9 pro kreativní generování textu na obrázek

Stručně

StabilityAI vydala nejnovější model, Stable Diffusion SDXL 0.9, který slibuje lepší vnímání výzvy a vylepšené detaily obrazu.

Midjourney 5.2 zavádí nové funkce jako Outpainting, příkaz /shorten, přizpůsobitelné varianty a transformaci obrazu 1:1.

Očekává se, že tyto aktualizace zlepší uživatelskou zkušenost a posílí kreativitu v kreativním procesu.

Dnes oba hlavní generátory textu na obrázek vydaly významné aktualizace. Vylepšená přesnost při generování realistických obrázků z textových popisů a také nové funkce, které uživatelům umožňují ovládat styl a složení generovaných obrázků.

Midjourney 5.2 a Stable Diffusion Aktualizace SDXL 0.9 pro Creative Image Generation
Credit: Midjourney

Nové funkce v jazyce Midjourney 5.2

Kromě StabilityAIaktualizace uživatele, Midjourney také zavedl vzrušující funkce s vydáním Midjourney 5.2. Jedním z pozoruhodných přírůstků je funkce Zoom Out, která se podobá Generativní výplň Adobe pro Photoshop. Je však důležité poznamenat, že MidjourneyFunkce Zoom Out nezahrnuje masky a výsledek do značné míry závisí na rozsahu parametru „do Out“.

Midjourney 5.2 přináší řadu nových funkcí, které vylepšují uživatelský zážitek. Zejména vydání Stable Diffusion XL 0.9 zastínil silnou aktualizaci v Midjourney, kterou řada uživatelů zpočátku přehlížela.

Některé z klíčových funkcí a vylepšení v Midjourney 5.2:

  • Outpainting: Uživatelé nyní mohou prozkoumat funkci Outpainting s možnostmi, jako jsou 1.5, 2 a vlastní nastavení. Při opakovaném použití přináší tato funkce působivé výsledky.
  • Přizpůsobitelné variace: Síla variací v Midjourney je nyní přizpůsobitelný. Uživatelé mohou bez námahy přepínat mezi slabými a silnými variacemi výběrem dvou tlačítek, což nabízí větší flexibilitu v kreativním procesu.
  • Transformace obrazu 1:1: Midjourney nyní umožňuje uživatelům transformovat jakýkoli obrázek do čtverce s poměrem stran 1:1, což umožňuje bezproblémovou integraci v různých kontextech.

Takže, Midjourney 5.2 zavedl novou funkci nazvanou prompt parser, která ještě více usnadňuje generování působivých obrázků. Pomocí příkazu „/shorten [vaše výzva] mohou nyní uživatelé identifikovat důležitá slova a odstranit nepotřebná, čímž optimalizují své vybízí k dosažení nejlepších výsledků. Analyzátor také přiřazuje každému slovu váhu, což uživatelům umožňuje vybrat si z pěti možností pro nejvhodnější výzvu. Jednodušeji řečeno, pomáhá přeměnit nejasné nápady na výzvu, která lépe odpovídá záměrům a potřebám uživatelů.

Pokud jde o řízení procesů, Midjourney dohání konkurenci. Co se však uživatelské přívětivosti týče, Midjourney zaostává. Ti, kteří hledají pohodlí před flexibilitou, mohou zjistit, že jsou přitahováni adobe světluška, konkurenční platforma známá pro své uživatelsky přívětivé funkce. Na druhou stranu, Stable Diffusion, se svou povahou open source a rozšířeními nabízí bezkonkurenční flexibilitu. I přes StabilityAIObčasná zpoždění a nejednoznačná prohlášení jako „50 % vyškoleno“ a „bude k dispozici v polovině července, ale to je nepřesné“, jakmile budou k dispozici váhy, vše se hladce srovná.

S těmito pokroky, Midjourney nadále poskytuje vzrušující funkce pro snadné a efektivní generování obrazu. Uživatelé si nyní mohou užívat větší kontrolu nad svými výzvami, což vede k lepším výstupům. Jak technologie pokračuje v pokroku, platformy jako Midjourney Cílem je zlepšit uživatelské zkušenosti a zpřístupnit kreativní úsilí všem.

Kromě toho nejnovější verze Midjourney zdůrazňuje realismus, zvláště patrný v umělecké generace. Pro zvýraznění těchto vylepšení bylo provedeno srovnání mezi výzvou a seed in Midjourney verze 5.1 a 5.2.

Čerstvě vytvořené příklady od Midjourney 5.2:

Nové funkce v jazyce Stable Diffusion SDXL 0.9

StabilityAI provedli vylepšení s uvedením svého nejnovějšího modelu, Stable Diffusion SDXL 0.9. Slibují lepší vnímání výzvy a vylepšené detaily obrazu, což uživatelům umožňuje vytvářet podmanivější vizuální prvky. Ještě lepší je, že si nový model můžete již nyní zdarma vyzkoušet Klip Drop.

Projekt Stable Diffusion Model SDXL 0.9 si získal pozornost od svého vydání StabilityAI. Oficiální potvrzení vydání je sice k dispozici, ale odkaz ještě nebyl poskytnut. V základní verzi se model SDXL 0.9 pyšní působivými parametry 3.5 miliardy. Kromě toho existují plány na další soubor dvou modelů, celkem pozoruhodných 6.6 miliardy parametrů.

Chcete-li dosáhnout lepšího generování obrazu, StabilityAI využívá zřetězení dvou modelů CLIP: základní klip z OpenAI a OpenCLIP ViT-G/14. Tato fúze umožňuje generování přesnějších detailů na snímcích. Srovnání párových obrázků mezi SDXL beta a nová verze SDXL 0.9 jasně demonstruje podstatné zlepšení kvality.

Stojí za zmínku, že použití modelu SDXL 0.9 během odvození vyžaduje grafickou kartu s alespoň 16 GB VRAM, aby byl zajištěn hladký výkon. Protože uživatelé netrpělivě očekávají obsáhlý blogový příspěvek se všemi podrobnostmi a vydáním kódu, očekává se další vylepšení a příležitosti.

Čerstvě vygenerované příklady pomocí SDXL 0.9:

Přečtěte si více o AI:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility

Zveřejnění prostřednictvím podání 13F odhaluje, že pozoruhodní institucionální investoři fušují do bitcoinových ETF, což podtrhuje rostoucí akceptaci...

Vědět více

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Digitální dluhopisy KfW založené na blockchainu: Skok k transparentnějšímu a efektivnějšímu finančnímu ekosystému
Business Vývoj Příběhy a recenze Technika
Digitální dluhopisy KfW založené na blockchainu: Skok k transparentnějšímu a efektivnějšímu finančnímu ekosystému
8
Revidovaný zákon o dárcovství Jižní Koreje: Je to pro krypto filantropii krok vpřed nebo zpět?
Crypto Wiki Strávit Business Trhy Technika
Revidovaný zákon o dárcovství Jižní Koreje: Je to pro krypto filantropii krok vpřed nebo zpět?
8
Generativní AI v roce 2024: Nové trendy, průlomy a výhled do budoucna
AI Wiki Vývoj Příběhy a recenze Technika
Generativní AI v roce 2024: Nové trendy, průlomy a výhled do budoucna
8
DODOchain odhaluje první fázi sítě MACH AVS Mainnet, spouští kampaň Launchpool s AltLayer, aby motivovala operátory odměnami za ekosystém
Trhy Novinky Technika
DODOchain odhaluje první fázi sítě MACH AVS Mainnet, spouští kampaň Launchpool s AltLayer, aby motivovala operátory odměnami za ekosystém
8
CRYPTOMERIA LABS PTE. LTD.