Midjourney 5.2 și Stable Diffusion Actualizări SDXL 0.9 pentru generarea creativă de text în imagine
Pe scurt
StabilityAI a lansat cel mai recent model, Stable Diffusion SDXL 0.9, care promite o percepție îmbunătățită a solicitări și detalii îmbunătățite ale imaginii.
Midjourney 5.2 introduce noi funcții precum Outpainting, comanda /shorten, variații personalizabile și transformarea imaginii 1:1.
Aceste actualizări sunt de așteptat să îmbunătățească experiența utilizatorului și să sporească creativitatea în procesul creativ.
Astăzi, ambii generatori majori de text-to-image au lansat actualizări semnificative. Precizie îmbunătățită în generarea de imagini realiste din descrierile textuale, precum și funcții noi care permit utilizatorilor să controleze stilul și compoziția imaginilor generate.
Caracteristici noi în Midjourney 5.2
În plus față de StabilityAIactualizările lui, Midjourney a introdus și caracteristici interesante odată cu lansarea Midjourney 5.2. O adăugare notabilă este caracteristica Zoom Out, care seamănă Umplerea generativă de la Adobe pentru Photoshop. Cu toate acestea, este important să rețineți că MidjourneyFuncția de micșorare a lui nu implică măști, iar rezultatul depinde în mare măsură de amploarea parametrului „do Out”.
Midjourney 5.2 aduce o serie de noi capabilități care îmbunătățesc experiența utilizatorului. În special, lansarea lui Stable Diffusion XL 0.9 a umbrit actualizarea puternică din Midjourney, pe care mulți utilizatori au trecut cu vederea inițial.
Unele dintre caracteristicile și îmbunătățirile cheie în Midjourney 5.2:
- Outpainting: utilizatorii pot explora acum caracteristica Outpainting cu opțiuni precum 1.5, 2 și setări personalizate. Când este utilizată în mod iterativ, această caracteristică dă rezultate impresionante.
- Variații personalizabile: puterea variațiilor în Midjourney este acum personalizabil. Utilizatorii pot comuta fără efort între variațiile slabe și cele puternice selectând două butoane, oferind o mai mare flexibilitate în procesul creativ.
- Transformarea imaginii 1:1: Midjourney acum permite utilizatorilor să transforme orice imagine într-un pătrat cu un raport de aspect 1:1, permițând integrarea perfectă în diverse contexte.
De asemenea, Midjourney 5.2 a introdus o nouă caracteristică numită parser prompt, ceea ce face și mai ușor generarea de imagini impresionante. Cu comanda „/scurten [promptul tău]”, utilizatorii pot acum identifica cuvintele importante și le pot elimina pe cele inutile, optimizând solicită cele mai bune rezultate. Analizatorul atribuie, de asemenea, ponderi fiecărui cuvânt, permițând utilizatorilor să aleagă dintre cinci opțiuni pentru cel mai potrivit prompt. În termeni mai simpli, ajută la transformarea ideilor vagi într-un prompt care se aliniază mai bine cu intențiile și nevoile utilizatorilor.
Când vine vorba de controlul procesului, Midjourney a ajuns din urmă concurenței. Cu toate acestea, în ceea ce privește ușurința de utilizare, Midjourney cade in urma. Cei care caută comoditate în detrimentul flexibilității se pot simți atrași de licurici de chirpici, o platformă rivală cunoscută pentru caracteristicile sale ușor de utilizat. Pe de altă parte, Stable Diffusion, cu natura și extensiile sale open-source, oferă o flexibilitate de neegalat. În ciuda StabilityAIîntârzierile ocazionale și afirmațiile ambigue precum „50% antrenat” și „vor fi disponibile la mijlocul lunii iulie, dar acest lucru este inexact”, odată ce ponderile devin disponibile, totul se va alinia fără probleme.
Cu aceste progrese, Midjourney continuă să ofere caracteristici interesante pentru generarea de imagini ușoară și eficientă. Utilizatorii se pot bucura acum de mai mult control asupra solicitărilor lor, rezultând rezultate mai bune. Pe măsură ce tehnologia continuă să progreseze, platformele ca Midjourney scopul de a îmbunătăți experiențele utilizatorilor și de a face eforturile creative mai accesibile tuturor.
În plus, cea mai recentă versiune a Midjourney pune accent pe realism, deosebit de vizibil în generație de artă. Pentru a evidenția aceste îmbunătățiri, a fost făcută o comparație între un prompt și un seed in Midjourney versiunile 5.1 și 5.2.
Exemple proaspăt generate de Midjourney 5.2:
Caracteristici noi în Stable Diffusion SDXL 0.9
StabilityAI a adus îmbunătățiri odată cu lansarea celui mai recent model, Stable Diffusion SDXL 0.9. Ei promit o percepție sporită a solicitări și detalii îmbunătățite ale imaginii, permițând utilizatorilor să creeze imagini mai captivante. Și mai bine, puteți încerca deja noul model gratuit Clip Drop.
Stable Diffusion Modelul SDXL 0.9 a atras atenția încă de la publicarea sa de StabilityAI. Deși este disponibilă confirmarea oficială a lansării, linkul nu a fost încă furnizat. În versiunea sa de bază, modelul SDXL 0.9 se mândrește cu o valoare impresionantă de 3.5 miliarde de parametri. În plus, există planuri pentru un alt ansamblu de două modele, însumând un parametri remarcabili de 6.6 miliarde.
Pentru a obține o generare îmbunătățită de imagini, StabilityAI folosește o concatenare a două modele CLIP: clema de bază de la OpenAI și OpenCLIP ViT-G/14. Această fuziune permite generarea de detalii mai precise în imagini. Comparații de imagini pereche între SDXL beta iar noua versiune, SDXL 0.9, demonstrează clar îmbunătățirea substanțială a calității.
Este demn de remarcat faptul că utilizarea modelului SDXL 0.9 în timpul inferenței necesită o placă video cu cel puțin 16 GB VRAM pentru a asigura o performanță fără probleme. Pe măsură ce utilizatorii așteaptă cu nerăbdare o postare cuprinzătoare pe blog cu toate detaliile și lansarea codului, există așteptări pentru îmbunătățiri și oportunități ulterioare.
Exemple proaspăt generate de SDXL 0.9:
Citiți mai multe despre AI:
Declinare a responsabilităţii
În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.
Despre autor
Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului.
Mai multe articoleDamir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului.