Dall-E 3 vs. Midjourney: Liels vismodernāko AI mākslas ģeneratoru salīdzinājums
Pievienojieties mums šajā aizraujošajā ceļojumā, izpētot Dall-E 3 un Midjourneysmalkumus, sarežģījumus un neizmantoto potenciālu. Šajā rakstā ir izcelti intriģējošākie salīdzinājumi, kuru pamatā ir AI entuziastes Atačkinas pētījumi; ja vēlaties uzzināt vairāk, noklikšķiniet uz saite.
Pro padomi |
---|
1. Atklājiet 50 populārākās teksta pārveides uzvednes AI mākslas ģeneratoriem Midjourney un DALL-E. |
2. Aizdedzina savu radošumu ar 20 populārākie AI teksta-attēlu mākslas ģeneratori no 2023. |
Šajā rakstā ir sniegta teksta pārveides uzvedne — attēls, kurā parādīti Dall-E 3 un rezultāti Midjourney, un skaidrojums par atšķirībām starp abiem mākslas ģeneratori. Sāksim.
Abi neironu tīkli šajā gadījumā darbojās apbrīnojami ar Midjourney nedaudz pārspējot pārējos.
Dall-E 3 šeit paveica daudz sliktāku darbu; tas ieguva stilu spilgtās krāsas, bet ne detaļu skaidrību; fonā parādījās deformēti ķermeņi, un sejas nepavisam nebija veiksmīgas.
Abas vietas izrādījās interesantas, bet Dall-E 3 atkal cīnījās ar sejām. Tā vietā tas izveidoja plīša smilškrāsas somu, kā norādīts uzvednē, un Midjourney to neņēma vērā. Šajā gadījumā Dall-E 3 bija ļoti paklausīgs, izpildot uzvedni.
Un vēlreiz, lai gan abi režģi veido lieliskas kolāžas, Dall-E 3 ir vairāk uzticīgs uzvednei; tas pievienoja tikai mūsu norādītos varoņus, tas nevarēja pārvērsties par jokdari, un tas krustoja kapteini ar Betmenu.
Midjourney spēja apvienot abu mākslinieku attiecīgos stilus no uzvednes, savukārt Dall-E 3 fonam pievienoja daudz intensīvu detaļu un spilgtas krāsas.
Atkal kaķi ir vislabākajā formā, un abi neironu tīkli lieliski uztver filmu kameras. Tomēr Dall-E 3 attēliem pat pievieno graudus.
Dall-E 3 radīja jaunu Leonardo DiCaprio ar foršām džemperu faktūrām, pievienoja plēves graudu un krāsu shēmu, un ļoti forši atspoguļoja krievu vasarnīcas sajūtu. Midjourney bija labs krāsu atstarotājs filmai, un Di Kaprio piešķīra viņai nobriedušāku izskatu.
Lai gan abi neironu tīkli ir prasmīgi veidot kolāžas, ja paskatās uzmanīgi, Midjourney izkropļo sejas un dažas objektu formas, savukārt Dall-E 3 ir precīzāks pašu varoņu izpildījumā — tā pat izrādījās Chewbacca.
Tuvinot fotogrāfijas, pamanīsit, ka Dall-E 3 ir izplūdušas acis; Midjourney, no otras puses, ir nevainojams. Dall-E 3 arī noteica zīmolu; čūskas uz galvām šķiet dzīvākas un kustīgākas; Midjourney vienmēr lika viņiem gulēt, nevis uz galvas.
Abi ir forši, bet Midjourney ņēma vērā mākslinieka stilu, kā arī filmas kameras efektu, savukārt Dall-E 3 ignorēja pilna garuma kadru un neņēma vērā to.
Mēs arī pieņēmām lēmumu pārbaudīt fotoattēlu ar fejām, taču Dall-E 3 spītīgi atteicās sadarboties. Midjourney neignorēja spārnus, jo bija pievienota atsauce ar spārniem. Kad Dall-E 3 uzņēma attēlu, tas piedāvāja dažas intriģējošas iespējas, taču ar amerikānieti.
Midjourney paveica fantastisku darbu, taču mēs vēlamies pievērst īpašu uzmanību tam, kā Dall-E 3 izveidoja filmas efektus augšējā labajā attēlā un pievienoja savu balto rokrakstu; tas izrādījās lieliski.
Dall-E 3 spēja ļoti paklausīgi realizēt visus uzvednes varoņus vēlreiz vienā attēlā. Midjourney ļoti centās un pat bija tuvu panākumam.
No pirmā acu uzmetiena šķiet, ka abi ir labi, taču, rūpīgāk pārbaudot, atklājas, ka Dall-E 3 trūkst fotoreālistiskā skaļuma un ka Midjourney ar blīkšķi apstrādāja savienojumus ar dakšām.
Abi ģeneratori ir lietpratīgi savās attiecīgajās jomās, un Dall-E 3 ir izcili teksta un Midjourney izcils fotoreālismā.
Matu fēnu fizika un ģeometrija ir sarežģīta Midjourney. Jūs varat pavadīt daudz laika, cīnoties ar mēģinājumiem un atsaucēm, un dažkārt rezultāti atgādina matu žāvētāju, taču Dall-E 3 jau pirmajā mēģinājumā radīja pieņemamu rezultātu un pat uzrakstīja tekstu.
Vienīgā acs ir laba, bet tas ir cits stāsts. In Midjourney, uzrakstījām negatīvu uzvedni – nav multfilmas, ilustrācija, dzīvoklis, divas acis. Dall-E 3 nekavējoties paklausīja un padarīja vienu aci, smaidu un nost cepuri, taču tā kategoriski atteicās ļaut nevienam uzņemt savu attēlu.
Midjourney padarīja paaudzei Bredu nepatiku, tāpēc izmantojām papildu pakalpojumu Insight Seja apmainīt likt Breda sejai paaudzei; te bija raksts par to. Dall-E 3 zina, kas ir Breds Pits, un var zīmēt zvaigznes bez papildu programmatūras.
Abas sietas ir labas, taču Dall-E 3 vienlaikus var izveidot vienradža ragus Midjourney parasti nevar.
Dall-E 3 paveica labu darbu, ieviešot varoņus darbībā; mēs varam redzēt orku un elfu ar elfa ausīm. Ir arī kāds cilvēks, kurš valkā Nike treniņtērpu, taču viņam ir izsmērētas acis. Elfu smailās ausis lielākoties ignorē Midjourney, un arī Nike netiek ņemts vērā.
Kad pēcraksta “ilustrācija” sākotnēji netika iekļauta uzvednē, Dall-E 3 to izveidoja. Tad mēs nolēmām to salīdzināt ar Midjourneyilustrācija. Kamēr Midjourney vairāk līdzinājās padomju laika ilustrācijām un neietvēra pasaku spārnus, Dall-E 3 paveica fantastisku darbu, uzzīmējot āmuru un sirpi. Labajā pusē esošajā piemērā parādīts, kā Dall-E 3 varētu parādīties tekstā.
Tomēr, Midjourney iegāja fotoreālismā; tēlos nav galvenā varoņa, tikai apkārtne, bet tomēr forši. Dall-E 3 vairs nevēlējās būt fotoattēlā.
Dall-E 3 vs. Midjourney: Plusi un mīnusi
Lietotājiem pētot šo tehnoloģiju, ir atklājušās vairākas ievērojamas priekšrocības un ierobežojumi, kas ļauj iegūt plašāku ieskatu tās funkcionalitātē.
Pros:
- Ātra paklausība: Viena no Dall-E 3 izcilajām iezīmēm ir tā ievērojamā spēja precīzi sekot uzvednēm. Lietotāji ir ziņojuši, ka AI modelis efektīvi reaģē uz plašu ievades diapazonu, padarot to par daudzpusīgu rīku dažādiem uzdevumiem.
- Daudzpusīga radošums: Dall-E 3 spēj attēlot vairākus varoņus vienā attēlā, paplašinot tā stāstu un radošu projektu potenciālu. Šī daudzpusīgā pieeja uzlabo tās lietderību dažādās jomās.
- Teksta integrācija: Lietotāji ir atzīmējuši Dall-E 3 prasmi nevainojami integrēt tekstu attēlos. Šī funkcija atvieglo vizuāli saistoša satura izveidi ar iegultiem teksta elementiem.
Mīnusi:
- Attēla skaidrība: Ievērojams ierobežojums ir AI tendence radīt attēlus ar izplūdušām sejām un acīm. Lai gan tas izceļas ar radošumu, dažkārt tai trūkst skaidrības un precizitātes, kas redzams cilvēku radītajā saturā.
- Stila konsekvence: Dall-E 3 konsekventi neatkārto konkrētu mākslinieku stilus, kas var būt trūkums tiem, kas meklē precīzu māksliniecisku emulāciju.
- VPN prasība: Lai piekļūtu Dall-E 3, pašlaik ir jāizmanto VPN, kas dažiem lietotājiem var radīt pieejamības problēmas.
- Attēlu pārvaldība: Lietotāji ir saskārušies ar ierobežojumiem, pārvaldot ģenerētos attēlus Microsoft Bing vietnē. Konkrēti, nav formāta orientācijas funkcijas, un attēlu vēsture ir ierobežota ar nesenajām augšupielādēm, tādēļ ir nepieciešama tūlītēja kopēšana vēlākai lietošanai.
- Paaudzes ātrums: Ir ziņots, ka dažos gadījumos Dall-E 3 ģenerēšanas process ir lēnāks salīdzinājumā ar citiem AI modeļiem.
Neskatoties uz šiem ierobežojumiem, Dall-E 3 ir daudzsološs. Lietotāji un eksperti apzinās tā potenciālu revolucionizēt satura veidošanu un stāstu stāstīšanu. Kā OpenAI turpina pilnveidot un paplašināt savu piedāvājumu, sagaidāms, ka Dall-E 3 stiprās puses spīdēs vēl spožāk, padarot to par vērtīgu rīku dažādās jomās.
FAQ
Gan Dall-E 3, gan Midjourney ir savas stiprās un vājās puses. Dall-E 3 ir īpaši paklausīgs uzvednēm un var nemanāmi integrēt tekstu attēlos. Tomēr dažreiz tiek radīti attēli ar aizmiglotām sejām un acīm, un tas var konsekventi neatkārtot konkrētu mākslinieku stilus. No otras puses, Midjourney izceļas ar fotoreālismu, taču ne vienmēr var tvert noteiktu uzvedņu būtību tik precīzi kā Dall-E 3.
Rakstā ir sniegtas teksta pārveides uzvednes, parādot rezultātus gan no Dall-E 3, gan Midjourney, un izskaidro atšķirības starp diviem mākslas radītājiem.
Abiem AI modeļiem ir savas stiprās un vājās puses. Piemēram, uzvednē par kosmosa cilvēku uz Jupitera, Midjourney nedaudz pārspēja Dall-E 3. Tomēr citā uzvednē par Wonder Woman Dall-E 3 precīzāk tvēra uzvednes būtību.
- Ātra paklausība: Dall-E 3 precīzi izpilda norādījumus.
- Daudzpusīga radošums: vienā attēlā var attēlot vairākas rakstzīmes.
- Teksta integrācija: Dall-E 3 var nemanāmi integrēt tekstu attēlos.
- Attēla skaidrība: dažreiz tiek radīti attēli ar izplūdušām sejām un acīm.
- Stila konsekvence: Dall-E 3 konsekventi neatkārto konkrētu mākslinieku stilus.
- Attēlu pārvaldība: ģenerēto attēlu pārvaldībai Microsoft Bing vietnē ir ierobežojumi.
- Paaudzes ātrums: Dall-E 3 ģenerēšanas process var būt lēnāks salīdzinājumā ar citiem AI modeļiem.
Atbildības noraidīšana
Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.
Par Autors
Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē.
Vairāk rakstusDamirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē.