AI Wiki Sining Teknolohiya
Oktubre 02, 2023

Dall-E 3 vs. Midjourney: Isang Malaking Paghahambing ng Pinakamahusay na AI Art Generator

Samahan kami sa kapanapanabik na paglalakbay na ito habang ginalugad namin ang Dall-E 3 at Midjourneymga subtlety, kumplikado, at hindi pa nagagamit na potensyal. Itinatampok ng artikulong ito ang mga pinaka nakakaintriga na paghahambing batay sa pananaliksik na ginawa ng mahilig sa AI na si Atachkina; kung interesado kang matuto nang higit pa, i-click ang link.

Dall-E 3 vs. Midjourney: Isang Malaking Paghahambing ng Pinakamahusay na AI Art Generator
Mga Tip sa Pro
1. Alisan ng takip ang Nangungunang 50 Text-to-Image Prompt para sa AI Art Generators Midjourney at DALL-E.
2. Pag-alabin ang Iyong Pagkamalikhain gamit ang Nangungunang 20 AI Text-to-Image Art Generator ng 2023.

Ang artikulong ito ay nagbibigay ng text-to-image prompt, isang larawang nagpapakita ng mga resulta mula sa Dall-E 3 at Midjourney, at isang paliwanag ng mga pagkakaiba sa pagitan ng dalawa mga tagalikha ng sining. Magsimula tayo.

prompt: Isang spaceman ang nakatayo sa Jupiter at pinagmamasdan ang pagsikat ng araw. futuristic na interface, first-person perspective, space commander, rainmeter, at HUD Rise UI

Kahanga-hangang gumanap ang parehong neural network sa kasong ito, kasama ang Midjourney bahagyang outperforming ang iba.

prompt: kinunan ni Slim Aarons ng Wonder Woman sa silid, kumplikadong mga layer at texture, detalyadong disenyo ng character, background na may maliwanag, kapritso at makulay na mga eksena, pastel color correction tulad ng mga pelikula ni Wes Anderson, film grain at Tokina AT-X 11-16mm f /2.8 pro dx ii

Ang Dall-E 3 ay gumawa ng mas masahol na trabaho dito; nakuha nito ang maliliwanag na kulay ng mga estilo, ngunit hindi ang kalinawan ng mga detalye; Ang mga deformed na katawan ay lumitaw sa background, at ang mga mukha ay hindi matagumpay.

prompt: larawan ng isang cute, chubby cybercot sa kanyang online na paninirahan
prompt: propesyonal na komersyal na studio photography para sa Nike; modelo na may mahabang buhok; buong body shot; nakasuot ng beige na Nike T-shirt; hindi pangkaraniwang Nike denim jacket; malambot na beige plush nike bag; malambot na lilang nike sneakers; nakatayo sa mapusyaw na kulay-rosas-asul na background; futuristic na background ng isang kumplikadong naka-streamline na hugis na may backlight; kinunan sa Hasselblad X1D;

Ito ay naging kawili-wili sa parehong mga lugar, ngunit ang Dall-E 3 ay muling nakipagpunyagi sa mga mukha. Sa halip, gumawa ito ng plush beige bag gaya ng itinuro sa prompt, at Midjourney binalewala ito. Sa pagkakataong ito, napakamasunurin ng Dall-E 3 sa pagsasagawa ng prompt.

prompt: ray-traced bubble figure sa mga kulay pastel, babaeng sculpture na may metallic finish, makintab/makintab, makulay na turbulence, pigeoncore, hindi kinaugalian na pose, anamorphic na sining, iridescence/opalescence, video feedback loops, makintab na mata, bold curves, makintab, fluid figuratism
prompt: isang vintage retro collage ng mga superhero, kabilang ang Wonder Woman, Captain America, Batman, at The Joker

At minsan pa, habang ang parehong grid ay gumagawa ng mahusay na mga collage, ang Dall-E 3 ay mas tapat sa prompt; idinagdag lamang nito ang mga bayani na tinukoy namin, hindi ito maaaring maging isang joker, at tinawid nito ang kapitan kasama si Batman.

prompt: metallic ray tracing blob, anamorphic art, eye catching detail, precisionist lines, bold curves, makintab, fluid figuratism, pastel color, dark background
prompt: Mga simpleng layer at texture, masalimuot na disenyo ng character, matingkad, kakaiba, at makulay na background, pastel color correction a la Wes Anderson na mga pelikula, film grain, at Tokina at-x 11-16mm f/2.8 pro dx ii lens ay naroroon lahat sa larawang ito ng Spider-Man na nagpapahinga sa isang sofa na kinunan ni Slim Aarons.

Midjourney nagawang pagsamahin ang kani-kanilang istilo ng dalawang artist mula sa prompt, samantalang nagdagdag lang ang Dall-E 3 ng maraming abalang detalye at maliliwanag na kulay sa background.

prompt: 80s na larawan ng mga chubby cute fat cats na nakikilahok sa isang aerobics class habang ang sporting nakakatuwang leopard leggings at pink na bodysuit ay kinunan sa Kodak Gold 200.

Minsan pa, ang mga pusa ay nasa pinakamataas na anyo, at ang parehong neural network ay lubos na nakakaintindi sa mga film camera. Gayunpaman, ang Dall-E 3 ay nagdaragdag pa ng butil sa mga larawan.

1990s, si Leonardo DiCaprio ay gumaganap bilang isang Jedi master sa isang Russian dacha habang may hawak na lightsaber at nakasuot ng knitted green jumper.

Lumikha ang Dall-E 3 ng isang batang Leonardo DiCaprio na may mga cool na jumper texture, nagdagdag ng film grain at scheme ng kulay at napaka-cool na sumasalamin sa pakiramdam ng isang Russian dacha. Midjourney ay isang magandang reflector ng kulay para sa pelikula, at binigyan siya ni DiCaprio ng mas mature na hitsura.

prompt: isang collage ng Star Wars mga larawan sa isang vintage na istilong retro

Kahit pareho neural network ay bihasa sa paglikha ng mga collage, kung titingnan mong mabuti, Midjourney distorts ang mga mukha at ilang mga hugis ng bagay, habang ang Dall-E 3 ay mas tumpak sa pagpapatupad ng mga character mismo-ito ay naging Chewbacca.

prompt: isang larawan ng isang russian gorgon medusa na nakasuot ng Balenciaga hypebeast streetwear at naglalakad sa isang kalye sa Manhattan na may mga ahas para sa buhok

Kapag nag-zoom in ka sa mga litrato, mapapansin mo na ang Dall-E 3 ay may malabong mata; Midjourney, sa kabilang banda, ay walang kamali-mali. Ang Dall-E 3 ay nagreseta din ng isang tatak; ang mga ahas sa ulo ay tila mas buhay at gumagalaw; Midjourney lagi silang pinahiga, kaysa sa ulo.

Prompt: Ang award-winning na larawang ito ni Slim Aarons ay nagtatampok ng spider-man na disguised bilang isang fairy na nakasuot ng pink fluffy na damit at may hawak na magic wand. Kinuha ito gamit ang Fuji Superia X-TRA 800 camera.

Parehong cool, ngunit Midjourney Isinasaalang-alang ang estilo ng artist pati na rin ang epekto ng isang film camera, samantalang ang Dall-E 3 ay hindi pinansin ang full-length na shot at hindi ito isinasaalang-alang.

prompt: USSR fairy na may mga pakpak at isang astronaut costume

Nagpasya din kaming subukan ang isang larawan kasama ang mga engkanto, ngunit matigas na tumanggi ang Dall-E 3 na makipagtulungan. Midjourney hindi pinansin ang mga pakpak dahil idinagdag ang sanggunian na may mga pakpak. Nang kumuha ng litrato ang Dall-E 3, nag-alok ito ng ilang nakakaintriga na posibilidad, ngunit may isang babaeng Amerikano.

prompt: isang snail na nagpo-pose para sa isang portrait habang nakasuot ng kontemporaryong hipster attire, 4K complex na mga layer at texture, detalyadong disenyo ng character, at film grain. Nagtatampok ang background ng makulay, kapritso, at makulay na mga eksena.

Midjourney gumawa ng kamangha-manghang trabaho, ngunit gusto naming bigyan ng espesyal na pansin kung paano nilikha ng Dall-E 3 ang mga epekto ng pelikula sa kanang itaas na larawan at nagdagdag ng sariling puting sulat-kamay; ito ay naging mahusay.

prompt: Nagsama-sama sina Spider-Man, Batman, at Iron Man para sa isang beer sa isang bar.

Ang Dall-E 3 ay nagawang lubos na masunurin na mapagtanto ang lahat ng mga bayani ng prompt sa isang larawan muli. Midjourney sinubukan nang husto at napalapit pa nga sa tagumpay.

Prompt: Summer salad ng mga kamatis at cucumber, macro, full scene, warm color, high quality photorealistic hyperrealistic, natural lighting, Unreal Engine 5, color grading, editorial photography, photography, photoshoot, Matangkad, epic, artgerm, kuha gamit ang 70mm lens, Depth of Field, DOF, Tilt Blur, Shutter Speed ​​1/1000, F/22, White Balance, 32k, Super-Resolution

Sa unang sulyap, mukhang pareho silang magaling, ngunit ang mas malapit na pagsisiyasat ay nagpapakita na ang Dall-E 3 ay walang photorealistic volume at iyon Midjourney Hinawakan ang mga joints gamit ang mga tinidor na may putok.

prompt: isang McDonald's sa istilo ng mga mapanlikhang spacescape na may makatotohanang mga pigura ng tao, dalawang kotse, at isang traktor, na may buwan sa ibabaw nito. Les Nasbis, Pierre Pellegrini, batay sa agham, nangunguna sa bold saturation, firecore

Ang parehong mga generator ay mahusay sa kani-kanilang mga larangan, kasama ang Dall-E 3 na mahusay sa teksto at Midjourney mahusay sa photorealism.

Ang hair dryer na BaByliss D570DE ay ginagamit sa isang modernong interior na may panggabing ilaw, pang-industriya na disenyo, at mga kulay na pastel, perpekto para sa isang studio shoot.

Ang pisika at geometry ng mga hair dryer ay mahirap para sa Midjourney. Maaari kang gumugol ng maraming oras sa pakikibaka sa mga pagsubok at mga sanggunian, at paminsan-minsan ang mga resulta ay kahawig ng isang hair dryer, ngunit ang Dall-E 3 ay gumawa ng isang katanggap-tanggap na resulta sa unang pagsubok at kahit na nagsulat ng teksto.

prompt: larawan ng isang mata na Turanga Leela mula sa futurama

Ang tanging mata ay mabuti, ngunit iyon ay ibang kuwento. Sa Midjourney, sumulat kami ng negatibong prompt – walang cartoon, ilustrasyon, flat, dalawang mata. Agad namang sumunod si Dall-E 3 at inalis ang isang mata, ngiti, at sumbrero, ngunit panay itong tumanggi na sinuman ang kumuha ng litrato sa kanya.

Ang aktor na si Brad Pitt ay nakita noong 1990s na nagdidilig sa mga gulayan sa hardin sa isang Russian dacha habang nakasuot ng striped tank top at sweatpants mula sa adidas. Ang eksena ay nakunan sa Agfa Vista 400.

Midjourney ginawa ang henerasyon na hindi katulad ni Brad, kaya ginamit namin ang karagdagang serbisyo ng Insight Pagpalit ng Face upang ilagay ang mukha ni Brad sa henerasyon; may post tungkol dito. Alam ng Dall-E 3 kung sino si Brad Pitt at maaaring gumuhit ng mga bituin nang walang karagdagang software.

prompt: isang magandang babae, mga unicorn, mga teknolohiya ng mansanas, at isang vintage retro collage ng mga galaxy

Ang parehong mga mesh ay mabuti, ngunit ang Dall-E 3 ay maaaring lumikha ng mga sungay ng unicorn habang Midjourney karaniwang hindi maaari.

prompt: ice cream sa kamay, nike sportswear, at isang nakamamanghang fantasy elf na nakaupo sa tabi ng isang orc sa isang larawan sa kalye.

Ang Dall-E 3 ay gumawa ng isang mahusay na trabaho ng paglalagay ng mga character sa aksyon; may makikita tayong orc at duwende na may tenga ng duwende. Meron ding nakasuot ng Nike tracksuit, pero mapupungay ang mata. Ang mga elven pointed ears ay kadalasang hindi pinapansin ng Midjourney, at hindi rin pinapansin ang Nike.

prompt: pagguhit ng isang engkanto ng USSR na nakadamit bilang isang astronaut

Kapag ang postscript na "ilustrasyon" ay unang iniwan sa prompt, gumawa ng isa ang Dall-E 3. Pagkatapos ay nagpasya kaming ihambing ito sa Midjourneyilustrasyon ni. Habang Midjourney mas malapit na kahawig ng mga guhit sa panahon ng Sobyet at hindi kasama ang mga pakpak ng engkanto, ang Dall-E 3 ay gumawa ng isang kamangha-manghang trabaho sa pagguhit ng martilyo at karit. Ang halimbawa sa kanan ay nagpapakita kung paano maaaring lumitaw ang Dall-E 3 sa teksto.

prompt: Isang dacha sa Jupiter, ang mga orbital ring ng planeta ay makikita sa malayo, isang alien na nagluluto ng barbecue, masalimuot na disenyo ng character, maliwanag, wacky at makulay na background, pastel color correction a la Wes Anderson na mga pelikula, film grain at isang Tokina AT -X 11-16mm f/2.8 Pro dX II lens

Gayunpaman, Midjourney napunta sa photorealism; walang pangunahing karakter sa mga imahe, tanging ang paligid, ngunit cool pa rin. Dall-E 3 ay hindi nais na maging sa larawan muli.

prompt: butil ng pelikula, dog food, masalimuot na disenyo ng character, mga layer at texture, maliwanag, kakaiba, at makulay na mga eksena sa background, at pastel color correction tulad ng sa isang Wes Anderson film

Dall-E 3 vs. Midjourney: Mga kalamangan at kahinaan

Habang ginagalugad ng mga user ang teknolohiyang ito, maraming kapansin-pansing kalakasan at limitasyon ang nalaman, na nagbibigay ng karagdagang insight sa functionality nito.

Pros:

  1. Maagap na Pagsunod: Ang isa sa mga namumukod-tanging feature ng Dall-E 3 ay ang kahanga-hangang kakayahang sundin nang tumpak ang mga senyas. Iniulat ng mga gumagamit na ang modelo ng AI ay epektibong tumutugon sa isang malawak na hanay ng input, na ginagawa itong isang maraming nalalaman na tool para sa iba't ibang mga gawain.
  2. Multifaceted Creativity: Ang Dall-E 3 ay nagpapakita ng kakayahang maglarawan ng maraming karakter sa loob ng iisang larawan, na nagpapalawak ng potensyal nito para sa pagkukuwento at mga malikhaing proyekto. Ang multifaceted approach na ito ay nagpapahusay sa utility nito sa iba't ibang domain.
  3. Pagsasama ng Teksto: Napansin ng mga gumagamit ang kahusayan ng Dall-E 3 sa pagsasama ng teksto nang walang putol sa mga larawan. Pinapadali ng feature na ito ang paglikha ng visually engaging content na may mga naka-embed na textual na elemento.

cons:

  1. Kalinawan ng Imahe: Ang isang kapansin-pansing limitasyon ay ang ugali ng AI na gumawa ng mga larawang may malabong mukha at mata. Bagama't mahusay ito sa pagkamalikhain, kung minsan ay kulang ito sa kalinawan at katumpakan na nakikita sa nilalamang nabuo ng tao.
  2. Pagkakatugma ng Estilo: Ang Dall-E 3 ay hindi patuloy na ginagaya ang mga partikular na istilo ng mga artist, na maaaring isang disbentaha para sa mga naghahanap ng tumpak na artistikong pagtulad.
  3. Kinakailangan sa VPN: Ang pag-access sa Dall-E 3 ay kasalukuyang nangangailangan ng paggamit ng VPN, na maaaring magdulot ng mga hamon sa accessibility para sa ilang mga user.
  4. Pamamahala ng Larawan: Nakatagpo ng mga limitasyon ang mga user kapag namamahala ng mga nabuong larawan sa website ng Microsoft Bing. Kapansin-pansin, walang function ng oryentasyon ng format, at ang kasaysayan ng imahe ay limitado sa mga kamakailang pag-upload, na nangangailangan ng agarang pagkopya para magamit sa ibang pagkakataon.
  5. Bilis ng Pagbuo: Sa ilang mga kaso, ang proseso ng pagbuo sa Dall-E 3 ay naiulat na mas mabagal kumpara sa iba pang mga modelo ng AI.

Sa kabila ng mga limitasyong ito, ang Dall-E 3 ay may malaking pangako. Kinikilala ng mga user at eksperto ang potensyal nito na baguhin ang paggawa ng content at pagkukuwento. Bilang OpenAI patuloy na pinipino at pinapalawak ang mga handog nito, inaasahan na ang mga lakas ng Dall-E 3 ay magniningning pa nang mas maliwanag, na ginagawa itong isang mahalagang tool sa iba't ibang larangan.

FAQs

Parehong Dall-E 3 at Midjourney may kanilang mga kalakasan at kahinaan. Ang Dall-E 3 ay kapansin-pansing masunurin sa mga senyas at maaaring isama ang teksto nang walang putol sa mga larawan. Gayunpaman, kung minsan ay gumagawa ito ng mga larawang may malabong mga mukha at mata at maaaring hindi tuloy-tuloy na ginagaya ang mga partikular na istilo ng mga artist. Sa kabilang kamay, Midjourney mahusay sa photorealism ngunit maaaring hindi palaging makuha ang kakanyahan ng ilang partikular na senyales na kasing tumpak ng Dall-E 3.

Nagbibigay ang artikulo ng mga text-to-image na prompt, na nagpapakita ng mga resulta mula sa parehong Dall-E 3 at Midjourney, at ipinapaliwanag ang mga pagkakaiba sa pagitan ng dalawang tagalikha ng sining.

Ang parehong mga modelo ng AI ay may kanilang mga lakas at kahinaan. Halimbawa, sa isang prompt tungkol sa isang spaceman sa Jupiter, Midjourney bahagyang outperformed Dall-E 3. Gayunpaman, sa isa pang prompt tungkol sa Wonder Woman, Dall-E 3 ay mas tumpak sa pagkuha ng kakanyahan ng prompt.

  • Maagap na Pagsunod: Ang Dall-E 3 ay tumpak na sumusunod sa mga senyas.
  • Multifaceted Creativity: Maaari itong maglarawan ng maraming karakter sa isang larawan.
  • Pagsasama ng Teksto: Maaaring maayos na isama ng Dall-E 3 ang teksto sa mga larawan.
  • Kalinawan ng Imahe: Minsan ay gumagawa ito ng mga larawang may malabong mukha at mata.
  • Pagkakatugma ng Estilo: Ang Dall-E 3 ay hindi patuloy na ginagaya ang mga partikular na istilo ng mga artist.
  • Pangangasiwa ng Imahe: May mga limitasyon kapag namamahala ng mga nabuong larawan sa website ng Microsoft Bing.
  • Bilis ng Henerasyon: Maaaring mas mabagal ang proseso ng pagbuo ng Dall-E 3 kumpara sa iba pang mga modelo ng AI.

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Mas marami pang artikulo
Damir Yalalov
Damir Yalalov

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Hot Stories
Sumali sa Aming Newsletter.
Pinakabagong Balita

Ang Institutional Appetite ay Lumalaki Patungo sa Bitcoin ETFs Sa gitna ng Volatility

Ang mga pagsisiwalat sa pamamagitan ng 13F filing ay nagpapakita ng mga kilalang institusyonal na mamumuhunan na nakikipag-ugnayan sa mga Bitcoin ETF, na binibigyang-diin ang lumalaking pagtanggap ng ...

Malaman Higit Pa

Dumating na ang Araw ng Pagsentensiya: Ang Kapalaran ni CZ ay Nagbabalanse habang Isinasaalang-alang ng Korte ng US ang Panawagan ng DOJ

Si Changpeng Zhao ay handang harapin ang sentensiya sa korte ng US sa Seattle ngayon.

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Sinimulan ng Nexo ang 'The Hunt' Upang Gantimpalaan ang mga User ng $12M Sa ​​NEXO Token Para sa Pakikipag-ugnayan sa Ecosystem Nito
markets Ulat sa Balita Teknolohiya
Sinimulan ng Nexo ang 'The Hunt' Upang Gantimpalaan ang mga User ng $12M Sa ​​NEXO Token Para sa Pakikipag-ugnayan sa Ecosystem Nito
Mayo 8, 2024
Ang Revolut X Exchange ng Revolut ay Nakakaakit sa Mga Crypto Trader na may Zero Maker Fees, at Advanced na Analytics
markets software Mga Kuwento at Pagsusuri Teknolohiya
Ang Revolut X Exchange ng Revolut ay Nakakaakit sa Mga Crypto Trader na may Zero Maker Fees, at Advanced na Analytics
Mayo 8, 2024
Opisyal na Naglilipat ang Lisk Sa Ethereum Layer 2 At Inilabas ang Core v4.0.6
Ulat sa Balita Teknolohiya
Opisyal na Naglilipat ang Lisk Sa Ethereum Layer 2 At Inilabas ang Core v4.0.6
Mayo 8, 2024
Bagong Meme Coins ng Mayo 2024: 7 Pinili para sa Crypto Fans
Digest markets Teknolohiya
Bagong Meme Coins ng Mayo 2024: 7 Pinili para sa Crypto Fans
Mayo 8, 2024
CRYPTOMERIA LABS PTE. LTD.