Dall-E 3 vs. Midjourney: Isang Malaking Paghahambing ng Pinakamahusay na AI Art Generator
Samahan kami sa kapanapanabik na paglalakbay na ito habang ginalugad namin ang Dall-E 3 at Midjourneymga subtlety, kumplikado, at hindi pa nagagamit na potensyal. Itinatampok ng artikulong ito ang mga pinaka nakakaintriga na paghahambing batay sa pananaliksik na ginawa ng mahilig sa AI na si Atachkina; kung interesado kang matuto nang higit pa, i-click ang link.
Mga Tip sa Pro |
---|
1. Alisan ng takip ang Nangungunang 50 Text-to-Image Prompt para sa AI Art Generators Midjourney at DALL-E. |
2. Pag-alabin ang Iyong Pagkamalikhain gamit ang Nangungunang 20 AI Text-to-Image Art Generator ng 2023. |
Ang artikulong ito ay nagbibigay ng text-to-image prompt, isang larawang nagpapakita ng mga resulta mula sa Dall-E 3 at Midjourney, at isang paliwanag ng mga pagkakaiba sa pagitan ng dalawa mga tagalikha ng sining. Magsimula tayo.
Kahanga-hangang gumanap ang parehong neural network sa kasong ito, kasama ang Midjourney bahagyang outperforming ang iba.
Ang Dall-E 3 ay gumawa ng mas masahol na trabaho dito; nakuha nito ang maliliwanag na kulay ng mga estilo, ngunit hindi ang kalinawan ng mga detalye; Ang mga deformed na katawan ay lumitaw sa background, at ang mga mukha ay hindi matagumpay.
Ito ay naging kawili-wili sa parehong mga lugar, ngunit ang Dall-E 3 ay muling nakipagpunyagi sa mga mukha. Sa halip, gumawa ito ng plush beige bag gaya ng itinuro sa prompt, at Midjourney binalewala ito. Sa pagkakataong ito, napakamasunurin ng Dall-E 3 sa pagsasagawa ng prompt.
At minsan pa, habang ang parehong grid ay gumagawa ng mahusay na mga collage, ang Dall-E 3 ay mas tapat sa prompt; idinagdag lamang nito ang mga bayani na tinukoy namin, hindi ito maaaring maging isang joker, at tinawid nito ang kapitan kasama si Batman.
Midjourney nagawang pagsamahin ang kani-kanilang istilo ng dalawang artist mula sa prompt, samantalang nagdagdag lang ang Dall-E 3 ng maraming abalang detalye at maliliwanag na kulay sa background.
Minsan pa, ang mga pusa ay nasa pinakamataas na anyo, at ang parehong neural network ay lubos na nakakaintindi sa mga film camera. Gayunpaman, ang Dall-E 3 ay nagdaragdag pa ng butil sa mga larawan.
Lumikha ang Dall-E 3 ng isang batang Leonardo DiCaprio na may mga cool na jumper texture, nagdagdag ng film grain at scheme ng kulay at napaka-cool na sumasalamin sa pakiramdam ng isang Russian dacha. Midjourney ay isang magandang reflector ng kulay para sa pelikula, at binigyan siya ni DiCaprio ng mas mature na hitsura.
Kahit pareho neural network ay bihasa sa paglikha ng mga collage, kung titingnan mong mabuti, Midjourney distorts ang mga mukha at ilang mga hugis ng bagay, habang ang Dall-E 3 ay mas tumpak sa pagpapatupad ng mga character mismo-ito ay naging Chewbacca.
Kapag nag-zoom in ka sa mga litrato, mapapansin mo na ang Dall-E 3 ay may malabong mata; Midjourney, sa kabilang banda, ay walang kamali-mali. Ang Dall-E 3 ay nagreseta din ng isang tatak; ang mga ahas sa ulo ay tila mas buhay at gumagalaw; Midjourney lagi silang pinahiga, kaysa sa ulo.
Parehong cool, ngunit Midjourney Isinasaalang-alang ang estilo ng artist pati na rin ang epekto ng isang film camera, samantalang ang Dall-E 3 ay hindi pinansin ang full-length na shot at hindi ito isinasaalang-alang.
Nagpasya din kaming subukan ang isang larawan kasama ang mga engkanto, ngunit matigas na tumanggi ang Dall-E 3 na makipagtulungan. Midjourney hindi pinansin ang mga pakpak dahil idinagdag ang sanggunian na may mga pakpak. Nang kumuha ng litrato ang Dall-E 3, nag-alok ito ng ilang nakakaintriga na posibilidad, ngunit may isang babaeng Amerikano.
Midjourney gumawa ng kamangha-manghang trabaho, ngunit gusto naming bigyan ng espesyal na pansin kung paano nilikha ng Dall-E 3 ang mga epekto ng pelikula sa kanang itaas na larawan at nagdagdag ng sariling puting sulat-kamay; ito ay naging mahusay.
Ang Dall-E 3 ay nagawang lubos na masunurin na mapagtanto ang lahat ng mga bayani ng prompt sa isang larawan muli. Midjourney sinubukan nang husto at napalapit pa nga sa tagumpay.
Sa unang sulyap, mukhang pareho silang magaling, ngunit ang mas malapit na pagsisiyasat ay nagpapakita na ang Dall-E 3 ay walang photorealistic volume at iyon Midjourney Hinawakan ang mga joints gamit ang mga tinidor na may putok.
Ang parehong mga generator ay mahusay sa kani-kanilang mga larangan, kasama ang Dall-E 3 na mahusay sa teksto at Midjourney mahusay sa photorealism.
Ang pisika at geometry ng mga hair dryer ay mahirap para sa Midjourney. Maaari kang gumugol ng maraming oras sa pakikibaka sa mga pagsubok at mga sanggunian, at paminsan-minsan ang mga resulta ay kahawig ng isang hair dryer, ngunit ang Dall-E 3 ay gumawa ng isang katanggap-tanggap na resulta sa unang pagsubok at kahit na nagsulat ng teksto.
Ang tanging mata ay mabuti, ngunit iyon ay ibang kuwento. Sa Midjourney, sumulat kami ng negatibong prompt – walang cartoon, ilustrasyon, flat, dalawang mata. Agad namang sumunod si Dall-E 3 at inalis ang isang mata, ngiti, at sumbrero, ngunit panay itong tumanggi na sinuman ang kumuha ng litrato sa kanya.
Midjourney ginawa ang henerasyon na hindi katulad ni Brad, kaya ginamit namin ang karagdagang serbisyo ng Insight Pagpalit ng Face upang ilagay ang mukha ni Brad sa henerasyon; may post tungkol dito. Alam ng Dall-E 3 kung sino si Brad Pitt at maaaring gumuhit ng mga bituin nang walang karagdagang software.
Ang parehong mga mesh ay mabuti, ngunit ang Dall-E 3 ay maaaring lumikha ng mga sungay ng unicorn habang Midjourney karaniwang hindi maaari.
Ang Dall-E 3 ay gumawa ng isang mahusay na trabaho ng paglalagay ng mga character sa aksyon; may makikita tayong orc at duwende na may tenga ng duwende. Meron ding nakasuot ng Nike tracksuit, pero mapupungay ang mata. Ang mga elven pointed ears ay kadalasang hindi pinapansin ng Midjourney, at hindi rin pinapansin ang Nike.
Kapag ang postscript na "ilustrasyon" ay unang iniwan sa prompt, gumawa ng isa ang Dall-E 3. Pagkatapos ay nagpasya kaming ihambing ito sa Midjourneyilustrasyon ni. Habang Midjourney mas malapit na kahawig ng mga guhit sa panahon ng Sobyet at hindi kasama ang mga pakpak ng engkanto, ang Dall-E 3 ay gumawa ng isang kamangha-manghang trabaho sa pagguhit ng martilyo at karit. Ang halimbawa sa kanan ay nagpapakita kung paano maaaring lumitaw ang Dall-E 3 sa teksto.
Gayunpaman, Midjourney napunta sa photorealism; walang pangunahing karakter sa mga imahe, tanging ang paligid, ngunit cool pa rin. Dall-E 3 ay hindi nais na maging sa larawan muli.
Dall-E 3 vs. Midjourney: Mga kalamangan at kahinaan
Habang ginagalugad ng mga user ang teknolohiyang ito, maraming kapansin-pansing kalakasan at limitasyon ang nalaman, na nagbibigay ng karagdagang insight sa functionality nito.
Pros:
- Maagap na Pagsunod: Ang isa sa mga namumukod-tanging feature ng Dall-E 3 ay ang kahanga-hangang kakayahang sundin nang tumpak ang mga senyas. Iniulat ng mga gumagamit na ang modelo ng AI ay epektibong tumutugon sa isang malawak na hanay ng input, na ginagawa itong isang maraming nalalaman na tool para sa iba't ibang mga gawain.
- Multifaceted Creativity: Ang Dall-E 3 ay nagpapakita ng kakayahang maglarawan ng maraming karakter sa loob ng iisang larawan, na nagpapalawak ng potensyal nito para sa pagkukuwento at mga malikhaing proyekto. Ang multifaceted approach na ito ay nagpapahusay sa utility nito sa iba't ibang domain.
- Pagsasama ng Teksto: Napansin ng mga gumagamit ang kahusayan ng Dall-E 3 sa pagsasama ng teksto nang walang putol sa mga larawan. Pinapadali ng feature na ito ang paglikha ng visually engaging content na may mga naka-embed na textual na elemento.
cons:
- Kalinawan ng Imahe: Ang isang kapansin-pansing limitasyon ay ang ugali ng AI na gumawa ng mga larawang may malabong mukha at mata. Bagama't mahusay ito sa pagkamalikhain, kung minsan ay kulang ito sa kalinawan at katumpakan na nakikita sa nilalamang nabuo ng tao.
- Pagkakatugma ng Estilo: Ang Dall-E 3 ay hindi patuloy na ginagaya ang mga partikular na istilo ng mga artist, na maaaring isang disbentaha para sa mga naghahanap ng tumpak na artistikong pagtulad.
- Kinakailangan sa VPN: Ang pag-access sa Dall-E 3 ay kasalukuyang nangangailangan ng paggamit ng VPN, na maaaring magdulot ng mga hamon sa accessibility para sa ilang mga user.
- Pamamahala ng Larawan: Nakatagpo ng mga limitasyon ang mga user kapag namamahala ng mga nabuong larawan sa website ng Microsoft Bing. Kapansin-pansin, walang function ng oryentasyon ng format, at ang kasaysayan ng imahe ay limitado sa mga kamakailang pag-upload, na nangangailangan ng agarang pagkopya para magamit sa ibang pagkakataon.
- Bilis ng Pagbuo: Sa ilang mga kaso, ang proseso ng pagbuo sa Dall-E 3 ay naiulat na mas mabagal kumpara sa iba pang mga modelo ng AI.
Sa kabila ng mga limitasyong ito, ang Dall-E 3 ay may malaking pangako. Kinikilala ng mga user at eksperto ang potensyal nito na baguhin ang paggawa ng content at pagkukuwento. Bilang OpenAI patuloy na pinipino at pinapalawak ang mga handog nito, inaasahan na ang mga lakas ng Dall-E 3 ay magniningning pa nang mas maliwanag, na ginagawa itong isang mahalagang tool sa iba't ibang larangan.
FAQs
Parehong Dall-E 3 at Midjourney may kanilang mga kalakasan at kahinaan. Ang Dall-E 3 ay kapansin-pansing masunurin sa mga senyas at maaaring isama ang teksto nang walang putol sa mga larawan. Gayunpaman, kung minsan ay gumagawa ito ng mga larawang may malabong mga mukha at mata at maaaring hindi tuloy-tuloy na ginagaya ang mga partikular na istilo ng mga artist. Sa kabilang kamay, Midjourney mahusay sa photorealism ngunit maaaring hindi palaging makuha ang kakanyahan ng ilang partikular na senyales na kasing tumpak ng Dall-E 3.
Nagbibigay ang artikulo ng mga text-to-image na prompt, na nagpapakita ng mga resulta mula sa parehong Dall-E 3 at Midjourney, at ipinapaliwanag ang mga pagkakaiba sa pagitan ng dalawang tagalikha ng sining.
Ang parehong mga modelo ng AI ay may kanilang mga lakas at kahinaan. Halimbawa, sa isang prompt tungkol sa isang spaceman sa Jupiter, Midjourney bahagyang outperformed Dall-E 3. Gayunpaman, sa isa pang prompt tungkol sa Wonder Woman, Dall-E 3 ay mas tumpak sa pagkuha ng kakanyahan ng prompt.
- Maagap na Pagsunod: Ang Dall-E 3 ay tumpak na sumusunod sa mga senyas.
- Multifaceted Creativity: Maaari itong maglarawan ng maraming karakter sa isang larawan.
- Pagsasama ng Teksto: Maaaring maayos na isama ng Dall-E 3 ang teksto sa mga larawan.
- Kalinawan ng Imahe: Minsan ay gumagawa ito ng mga larawang may malabong mukha at mata.
- Pagkakatugma ng Estilo: Ang Dall-E 3 ay hindi patuloy na ginagaya ang mga partikular na istilo ng mga artist.
- Pangangasiwa ng Imahe: May mga limitasyon kapag namamahala ng mga nabuong larawan sa website ng Microsoft Bing.
- Bilis ng Henerasyon: Maaaring mas mabagal ang proseso ng pagbuo ng Dall-E 3 kumpara sa iba pang mga modelo ng AI.
Pagtanggi sa pananagutan
Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.
Tungkol sa Ang May-akda
Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet.
Mas marami pang artikuloSi Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet.