Ulat sa Balita Teknolohiya
Hunyo 23, 2023

Midjourney 5.2 at Stable Diffusion SDXL 0.9 Update para sa Creative Text-to-Image Generation

Sa madaling sabi

StabilityAI ay naglabas ng pinakabagong modelo, Stable Diffusion SDXL 0.9, na nangangako ng pinahusay na pang-unawa sa mga senyas at pinahusay na detalye ng larawan.

Midjourney Ang 5.2 ay nagpapakilala ng mga bagong feature tulad ng Outpainting, /shorten command, mga nako-customize na variation, at 1:1 image transformation.

Inaasahang mapapahusay ng mga update na ito ang karanasan ng user at mapahusay ang pagkamalikhain sa proseso ng creative.

Ngayon, pareho sa mga pangunahing text-to-image generators ang naglabas ng mga makabuluhang update. Pinahusay na katumpakan sa pagbuo ng mga makatotohanang larawan mula sa mga tekstong paglalarawan, pati na rin ang mga bagong feature na nagbibigay-daan sa mga user na kontrolin ang istilo at komposisyon ng mga nabuong larawan.

Midjourney 5.2 at Stable Diffusion SDXL 0.9 Update para sa Creative Image Generation
Pinasasalamatan: Midjourney

Mga Bagong Tampok sa Midjourney 5.2

Bilang karagdagan sa StabilityAImga update ni, Midjourney ay nagpakilala rin ng mga kapana-panabik na tampok sa paglabas ng Midjourney 5.2. Ang isang kapansin-pansing karagdagan ay ang tampok na Zoom Out, na kahawig Generative Fill ng Adobe para sa Photoshop. Gayunpaman, mahalagang tandaan iyon MidjourneyAng tampok na Zoom Out ay hindi nagsasangkot ng mga maskara, at ang kinalabasan ay higit na nakadepende sa lawak ng parameter na “do Out”.

Midjourney 5.2 ay nagdadala ng isang hanay ng mga bagong kakayahan na nagpapahusay sa karanasan ng user. Kapansin-pansin, ang paglabas ng Stable Diffusion Na-overshadow ng XL 0.9 ang malakas na pag-update sa Midjourney, na una nang hindi napapansin ng maraming user.

Ilan sa mga pangunahing tampok at pagpapahusay sa Midjourney 5.2:

  • Outpainting: Maaari na ngayong tuklasin ng mga user ang feature na Outpainting na may mga opsyon gaya ng 1.5, 2, at custom na setting. Kapag ginamit nang paulit-ulit, ang tampok na ito ay nagbubunga ng mga kahanga-hangang resulta.
  • Nako-customize na mga variation: Ang lakas ng mga variation sa Midjourney ay nako-customize na ngayon. Ang mga user ay maaaring walang kahirap-hirap na lumipat sa pagitan ng mahina at malakas na mga variation sa pamamagitan ng pagpili ng dalawang button, na nag-aalok ng higit na kakayahang umangkop sa proseso ng creative.
  • 1:1 na pagbabago ng larawan: Midjourney ngayon ay nagbibigay-daan sa mga user na baguhin ang anumang imahe sa isang parisukat na may 1:1 aspect ratio, na nagbibigay-daan sa tuluy-tuloy na pagsasama sa iba't ibang konteksto.

Gayundin, Midjourney Ipinakilala ng 5.2 ang isang bagong tampok na tinatawag na prompt parser, na ginagawang mas madali ang pagbuo ng mga kahanga-hangang larawan. Gamit ang command na “/ikliin [iyong prompt],” matutukoy na ngayon ng mga user ang mahahalagang salita at alisin ang mga hindi kailangan, na ma-optimize ang kanilang prompt para sa pinakamahusay na mga resulta. Ang parser ay nagtatalaga din ng mga timbang sa bawat salita, na nagpapahintulot sa mga user na pumili mula sa limang mga opsyon para sa pinaka-angkop na prompt. Sa mas simpleng termino, nakakatulong ito na gawing isang prompt ang hindi malinaw na ideya na mas naaayon sa mga intensyon at pangangailangan ng mga user.

Pagdating sa kontrol sa proseso, Midjourney ay humahabol sa kumpetisyon. Gayunpaman, sa mga tuntunin ng pagiging kabaitan ng gumagamit, Midjourney nahuhulog sa likod. Ang mga naghahanap ng kaginhawahan sa flexibility ay maaaring maakit ang kanilang sarili adobe alitaptap, isang karibal na platform na kilala sa mga feature na madaling gamitin. Sa kabilang kamay, Stable Diffusion, kasama ang open-source na kalikasan at mga extension nito, ay nag-aalok ng walang kapantay na flexibility. Sa kabila StabilityAIAng mga paminsan-minsang pagkaantala at hindi malinaw na mga pahayag tulad ng "50% na sinanay" at "ay magiging available sa kalagitnaan ng Hulyo, ngunit ito ay hindi tumpak," kapag naging available na ang mga timbang, ang lahat ay magiging maayos.

Sa mga pagsulong na ito, Midjourney patuloy na nagbibigay ng mga kapana-panabik na tampok para sa madali at mahusay na pagbuo ng imahe. Mae-enjoy na ng mga user ang higit na kontrol sa kanilang mga senyas, na nagreresulta sa mas mahusay na mga output. Habang patuloy na umuunlad ang teknolohiya, gusto ng mga platform Midjourney layuning mapahusay ang mga karanasan ng user at gawing mas naa-access ng lahat ang mga malikhaing pagsisikap.

Higit pa rito, ang pinakabagong bersyon ng Midjourney binibigyang-diin ang pagiging totoo, partikular na kapansin-pansin sa henerasyon ng sining. Upang i-highlight ang mga pagpapahusay na ito, ginawa ang isang paghahambing sa pagitan ng isang prompt at isang seed in Midjourney bersyon 5.1 at 5.2.

Mga bagong nabuong halimbawa ni Midjourney 5.2:

Mga Bagong Tampok sa Stable Diffusion SDXL 0.9

StabilityAI ay gumawa ng mga pagpapabuti sa paglabas ng kanilang pinakabagong modelo, Stable Diffusion SDXL 0.9. Nangangako sila ng pinahusay na pang-unawa sa mga senyas at pinahusay na detalye ng larawan, na nagbibigay-daan sa mga user na lumikha ng mas mapang-akit na mga visual. Mas mabuti pa, maaari mo nang subukan ang bagong modelo nang libre sa Clip Drop.

Ang Stable Diffusion Ang modelo ng SDXL 0.9 ay nakakuha ng pansin mula noong ito ay inilathala ni StabilityAI. Kahit na ang opisyal na kumpirmasyon ng paglabas ay magagamit, ngunit ang link ay hindi pa ibinigay. Sa pangunahing bersyon nito, ipinagmamalaki ng modelong SDXL 0.9 ang kahanga-hangang 3.5 Bln na parameter. Bukod pa rito, may mga plano para sa isa pang grupo ng dalawang modelo, na may kabuuang 6.6 Bln na parameter.

Upang makamit ang pinahusay na pagbuo ng imahe, StabilityAI gumagamit ng pinagsama-samang dalawang modelo ng CLIP: ang base clip mula sa OpenAI at OpenCLIP ViT-G/14. Ang pagsasanib na ito ay nagbibigay-daan para sa pagbuo ng mas tumpak na mga detalye sa mga larawan. Ipinares na mga paghahambing ng larawan sa pagitan ng SDXL beta at ang bagong bersyon, SDXL 0.9, ay malinaw na nagpapakita ng malaking pagpapabuti sa kalidad.

Kapansin-pansin na ang paggamit ng modelong SDXL 0.9 sa panahon ng inference ay nangangailangan ng video card na may hindi bababa sa 16 GB VRAM upang matiyak ang maayos na pagganap. Habang ang mga gumagamit ay sabik na naghihintay ng isang komprehensibong post sa blog na may lahat ng mga detalye at ang paglabas ng code, mayroong pag-asa para sa karagdagang mga pagpapahusay at pagkakataon.

Mga bagong nabuong halimbawa ng SDXL 0.9:

Magbasa pa tungkol sa AI:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Mas marami pang artikulo
Damir Yalalov
Damir Yalalov

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Ang Institutional Appetite ay Lumalaki Patungo sa Bitcoin ETFs Sa gitna ng Volatility

Ang mga pagsisiwalat sa pamamagitan ng 13F filing ay nagpapakita ng mga kilalang institusyonal na mamumuhunan na nakikipag-ugnayan sa mga Bitcoin ETF, na binibigyang-diin ang lumalaking pagtanggap ng ...

Malaman Higit Pa

Dumating na ang Araw ng Pagsentensiya: Ang Kapalaran ni CZ ay Nagbabalanse habang Isinasaalang-alang ng Korte ng US ang Panawagan ng DOJ

Si Changpeng Zhao ay handang harapin ang sentensiya sa korte ng US sa Seattle ngayon.

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Ang Paglipat ni Donald Trump sa Crypto: Mula sa Kalaban hanggang sa Tagapagtaguyod, at Ano ang Kahulugan Nito para sa US Cryptocurrency Market
Negosyo markets Mga Kuwento at Pagsusuri Teknolohiya
Ang Paglipat ni Donald Trump sa Crypto: Mula sa Kalaban hanggang sa Tagapagtaguyod, at Ano ang Kahulugan Nito para sa US Cryptocurrency Market
Mayo 10, 2024
Layer3 Upang Ilunsad ang L3 Token Ngayong Tag-init, Naglalaan ng 51% Ng Kabuuang Supply Sa Komunidad
markets Ulat sa Balita Teknolohiya
Layer3 Upang Ilunsad ang L3 Token Ngayong Tag-init, Naglalaan ng 51% Ng Kabuuang Supply Sa Komunidad
Mayo 10, 2024
Ang Pangwakas na Babala ni Edward Snowden sa Mga Nag-develop ng Bitcoin: “Gawing Priyoridad sa Antas ng Protokol ang Pagkapribado o Panganib na Mawala Ito
markets Katiwasayan Wiki software Mga Kuwento at Pagsusuri Teknolohiya
Ang Pangwakas na Babala ni Edward Snowden sa Mga Nag-develop ng Bitcoin: “Gawing Priyoridad sa Antas ng Protokol ang Pagkapribado o Panganib na Mawala Ito
Mayo 10, 2024
Optimism-Powered Ethereum Layer 2 Network Mint Upang Ilunsad ang Mainnet Nito Sa Mayo 15
Ulat sa Balita Teknolohiya
Optimism-Powered Ethereum Layer 2 Network Mint Upang Ilunsad ang Mainnet Nito Sa Mayo 15
Mayo 10, 2024
CRYPTOMERIA LABS PTE. LTD.