Stability AI Naglabas ng Bagong Modelong Tinatawag na SDXL Beta
Sa madaling sabi
Stability AI ay naglabas ng bagong modelo na tinatawag na SDXL Beta (Stable Diffusion XL Beta). Ito ay isang mas malaking modelo na may higit pang mga parameter at ilang hindi kilalang mga pagpapahusay. Available ito sa DreamStudio, Stability AIopisyal na image generator ni, at gumagamit ng mga advanced na algorithm at malalim na diskarte sa pag-aaral upang lumikha ng mga nakamamanghang visual.
Stability AI ay naglabas ng preview ng isang bagong modelo na tinatawag na SDXL Beta, maikli para sa Stable Diffusion XL Beta. Sa ngayon, ang kumpanya ay hindi nagbahagi ng maraming impormasyon tungkol sa modelo, ngunit ito ay magagamit para sa pagsubok para sa sinumang gustong gawin ito. Para saan ang nobela tungkol sa modelong SDXL na ito stable diffusion? Ano ang mga pakinabang at disadvantage nito? Mag-imbestiga tayo.
Magbasa nang higit pa: Midjourney at Dall-E Artist Styles Dump na may Mga Halimbawa: 130 Sikat na AI Painting Techniques |
Ano nga ba ang modelo ng SDXL?
Ang modelo ng SDXL ay isang bagong modelo na kasalukuyang sinasanay. Malayo pa itong matapos, at sa oras na maipalabas ito, maaaring magbago ang maraming detalye tungkol dito; para sa lahat ng alam namin, ito ay maaaring hindi kahit na tinatawag na SDXL modelo. Ang alam lang natin ay isa itong mas malaking modelo na may higit pang mga parameter at ilang hindi kilalang mga pagpapahusay. Ito ay isang v2 na modelo, hindi isang v3 na modelo (anuman ang ibig sabihin nito). Posible na ang mga pagpapahusay sa v2 na modelo ay maaaring mapabuti ang pagganap ng system, ngunit kung walang karagdagang impormasyon, mahirap matukoy kung gaano kahalaga ang mga pagpapahusay na ito. Bukod pa rito, makatutulong na malaman kung anong mga partikular na parameter ang idinagdag o inayos sa bersyong ito.
Ang modelo ng SDXL ay kasalukuyang magagamit sa DreamStudio, Stability AIopisyal na generator ng imahe. Piliin ang SDXL Beta mula sa menu ng modelo upang tingnan ito. Mukhang gumagamit ng mga advanced na algorithm at malalim na mga diskarte sa pag-aaral upang lumikha ng mga nakamamanghang visual na perpekto para sa isang malawak na hanay ng mga application.
Pagpapabuti
Nababasang teksto. Ang SDXL ay may kakayahang bumuo ng nababasang teksto at ito marahil ang pinakakapansin-pansing feature dahil hindi ito posible sa mga kasalukuyang v1 at v2.1 na modelo. Ang nabuong teksto ng SDXL ay hindi palaging tumpak tulad ng nakikita mo sa Stable Diffusion Text sa ibaba. Gayunpaman, ito ay higit na nakahihigit sa v2.1, pabayaan ang v1 na modelo. Ito ay dahil gumagamit ang SDXLs ng mas advanced na deep learning algorithm na nagbibigay-daan dito na maunawaan at bumuo ng mas kumplikadong mga istruktura ng wika. Sa karagdagang pag-unlad, ito ay may potensyal na maging mas tumpak at maaasahan.
Anatomy ng tao. Matagal nang naging hamon ang tumpak na henerasyon ng anatomically correct na mga figure ng tao stable diffusion. Ang pagkakaroon ng karagdagang o nawawalang mga paa ay karaniwan. Ang inpainting ay karaniwang ginagamit upang ayusin ang mga ito, o, mas kamakailan, maaari mong gamitin ang tampok na Open Pose ng ControlNet upang i-duplicate ang isang pose mula sa isang reference na imahe. Ikinalulugod naming tandaan na dito ay bumuti ang modelo ng SDXL Beta. Ang modelo ng SDXL Beta ay nagpakita ng makabuluhang pagpapabuti sa tumpak na pagdoble ng mga pose mula sa mga reference na larawan. Maaari itong maging isang mahalagang tool para sa iba't ibang mga application tulad ng animation at virtual reality.
Estilo ng portrait. Gumagawa ang SDXL Beta ng mahuhusay na portrait na parang mga larawan – isa itong upgrade kumpara sa bersyon 1.5. Pinapahusay ng pinahusay na algorithm sa SDXL Beta ang mga detalye at katumpakan ng kulay ng mga portrait, na nagreresulta sa mas natural at makatotohanang hitsura. Ang mga gumagamit ay maaari ring ayusin ang mga antas ng sharpness at saturation upang makamit ang kanilang ninanais na mga epekto.
Duotone. Ang keyword na duotone ay palaging gumagawa ng mga black-and-white na larawan sa v1.5 na modelo. Gayunpaman, ngayon, ang mga duotone na imahe na ginawa ng SDXL Beta ay may iba't ibang kulay. Ito ay malinaw na kumpara sa v1 modelo, ang kakayahan upang bigyang-kahulugan ang prompt ay bumuti, na nagreresulta sa mas tumpak at may-katuturang mga tugon mula sa mga modelong v2, na ginagawa silang isang mas maaasahang tool para sa mga gawain sa pagproseso ng natural na wika.
Mga istilong masining. Nagkaroon ng ilang menor de edad na pagsasaayos, ngunit mahirap matukoy kung ang bagong modelo ay nagbibigay ng mas magagandang resulta dahil natatangi lang ang mga ito. Posible na ang mga pagsasaayos na ito ay maaaring isang bagay ng personal na kagustuhan o pansariling opinyon, na nagpapahirap sa paggawa ng a definitive na paghuhusga sa kanilang kalidad. Gayunpaman, ang pagiging natatangi ng mga pagsasaayos ay maaaring kapansin-pansin at nagkakahalaga ng paggalugad pa.
Konklusyon
- Stable Diffusion sa wakas ay makakagawa ng tekstong may katuturan.
- Ang SDXL ay nagbibigay ng mas aesthetically kasiya-siyang mga larawan kaysa sa v2.1 at (sa mas mababang lawak) sa v1.5 na mga modelo.
- Ang bagong modelo ay gumagawa ng mga larawang mas tumpak.
- Ang anatomy ng tao ay bumuti.
- Ang mga negatibong senyas ay hindi kasing kinakailangan tulad ng sa v2.1.
- Maaari itong lumikha ng mga makatotohanang portait.
- Ang ilang mga kakaiba sa modelo ay aayusin bago ilabas.
Magbasa nang higit pa mga nauugnay na artikulo:
Pagtanggi sa pananagutan
Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.
Tungkol sa Ang May-akda
Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet.
Mas marami pang artikuloSi Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet.