Dall-E 3 در مقابل Midjourney: مقایسه ای بزرگ از پیشرفته ترین مولدهای هنر هوش مصنوعی
در این سفر هیجان انگیز به ما بپیوندید تا Dall-E 3 و را بررسی کنیم Midjourneyظرافت ها، پیچیدگی ها و پتانسیل های بکر. این مقاله جذابترین مقایسهها را بر اساس تحقیقات انجام شده توسط آتاچکینا، علاقهمند به هوش مصنوعی، برجسته میکند. اگر علاقه مند به یادگیری بیشتر هستید، روی آن کلیک کنید پیوند.
نکات طرفدار |
---|
1. کشف کنید 50 درخواست برتر تبدیل متن به تصویر برای تولیدکنندگان هنر هوش مصنوعی Midjourney و DALL-E. |
2. خلاقیت خود را با 20 مولد هنر متن به تصویر برتر هوش مصنوعی از 2023. |
این مقاله یک پیام متن به تصویر ارائه می دهد، تصویری که نتایج Dall-E 3 و Midjourney، و توضیحی در مورد تفاوت های این دو مولدهای هنری. شروع کنیم.
هر دو شبکه عصبی در این مورد عملکرد تحسین برانگیزی داشتند Midjourney کمی بهتر از بقیه
Dall-E 3 در اینجا کار بسیار بدتری انجام داد. رنگ های روشن سبک ها را دریافت کرد، اما وضوح جزئیات را نداشت. بدن های تغییر شکل یافته در پس زمینه ظاهر می شدند و چهره ها اصلا موفق نبودند.
هر دو مکان جالب بود، اما Dall-E 3 یک بار دیگر با چهره ها مبارزه کرد. درعوض، طبق دستور العمل یک کیف بژ مخملی درست کرد و Midjourney آن را نادیده گرفت. در این مثال، Dall-E 3 در اجرای دستور بسیار مطیع بود.
و یک بار دیگر، در حالی که هر دو شبکه کلاژهای عالی میسازند، Dall-E 3 به اعلان وفادارتر است. فقط قهرمانهایی را که ما مشخص کردیم اضافه کرد، نمیتوانست به جوکر تبدیل شود و کاپیتان را با بتمن عبور داد.
Midjourney توانست سبک های مربوط به دو هنرمند را از همان لحظه ترکیب کند، در حالی که Dall-E 3 فقط جزئیات شلوغ و رنگ های روشن زیادی را به پس زمینه اضافه کرد.
یک بار دیگر، گربهها در بهترین فرم هستند و هر دو شبکه عصبی دوربینهای فیلم را کاملاً درک میکنند. با این حال، Dall-E 3 حتی به تصاویر نیز دانه بندی می کند.
Dall-E 3 یک لئوناردو دی کاپریو جوان را با بافت های جامپر خنک، دانه بندی فیلم و طرح رنگی اضافه کرد و بسیار سرد حس یک ویلا روسی را منعکس کرد. Midjourney بازتاب دهنده رنگ خوبی برای فیلم بود و دی کاپریو ظاهر بالغ تری به او داد.
هر چند هر دو شبکه های عصبی در ایجاد کلاژ مهارت دارند، اگر دقت کنید، Midjourney چهره ها و برخی از اشکال اشیاء را تحریف می کند، در حالی که Dall-E 3 در اجرای خود شخصیت ها دقیق تر است - حتی معلوم شد که Chewbacca است.
وقتی روی عکسها زوم میکنید، متوجه میشوید که Dall-E 3 چشمهای تاری دارد. Midjourneyاز سوی دیگر، بی عیب و نقص است. Dall-E 3 همچنین یک نام تجاری را تجویز کرد. به نظر می رسد مارهای روی سر زنده تر و در حال حرکت هستند. Midjourney همیشه آنها را به جای روی سر، دراز کشیده بودند.
هر دو باحال هستند اما Midjourney سبک هنرمند و همچنین جلوه دوربین فیلم را در نظر گرفت، در حالی که Dall-E 3 شات تمام قد را نادیده گرفت و آن را در نظر نگرفت.
ما همچنین تصمیم گرفتیم عکسی را با پری آزمایش کنیم، اما Dall-E 3 سرسختانه از همکاری امتناع کرد. Midjourney بالها را نادیده نگرفت زیرا مرجع با بال اضافه شده بود. وقتی Dall-E 3 یک عکس گرفت، امکانات جالبی را ارائه داد، اما با یک زن آمریکایی.
Midjourney کار فوقالعادهای انجام داد، اما میخواهیم توجه ویژهای را به این موضوع جلب کنیم که چگونه Dall-E 3 جلوههای فیلم را در تصویر بالا سمت راست ایجاد کرد و دستخط سفید خود را اضافه کرد. عالی شد
Dall-E 3 توانست یک بار دیگر همه قهرمانان دستور را در یک تصویر به خوبی درک کند. Midjourney خیلی تلاش کرد و حتی به موفقیت نزدیک شد.
در نگاه اول، به نظر می رسد که هر دو خوب هستند، اما بررسی دقیق تر نشان می دهد که Dall-E 3 فاقد حجم واقعی نوری است و Midjourney مفاصل را با چنگال با صدای انفجاری اداره کرد.
هر دو مولد در زمینه های مربوطه خود مهارت دارند، با Dall-E 3 در متن و Midjourney برتری در فوتورئالیسم
فیزیک و هندسه سشوار دشوار است Midjourney. میتوانید زمان زیادی را صرف تلاشها و مراجع کنید، و گاهاً نتایج شبیه به یک سشوار است، اما Dall-E 3 در اولین تلاش نتیجه قابل قبولی داشت و حتی متن را نوشت.
تنها چشم خوب است، اما این داستان دیگری است. که در Midjourney، یک اعلان منفی نوشتیم – بدون کارتون، تصویر، صاف، دو چشم. Dall-E 3 فوراً اطاعت کرد و یک چشم، لبخند و کلاه از سر برداشت، اما صراحتاً اجازه نداد کسی از او عکس بگیرد.
Midjourney باعث شد این نسل مانند براد نباشد، بنابراین از سرویس اضافی Insight استفاده کردیم تعویض چهره قرار دادن چهره براد بر روی نسل. یک پست در مورد آن در اینجا وجود دارد Dall-E 3 می داند برد پیت کیست و می تواند ستاره ها را بدون هیچ نرم افزار اضافی ترسیم کند.
هر دو مش خوب هستند، اما Dall-E 3 می تواند شاخ های تک شاخ ایجاد کند Midjourney معمولا نمی تواند
Dall-E 3 به خوبی کاراکترها را عملی کرد. ما می توانیم یک اورک و یک جن را با گوش های جن ببینیم. یک نفر هم لباس ورزشی نایکی پوشیده اما چشمانش لک شده است. گوش های نوک تیز جن اغلب توسط نادیده گرفته می شوند Midjourneyو نایک نیز نادیده گرفته شده است.
هنگامی که "تصویر" پساسکریپ در ابتدا از دستور خارج شد، Dall-E 3 یکی را ایجاد کرد. سپس تصمیم گرفتیم آن را با هم مقایسه کنیم Midjourneyتصویرسازی در حالی که Midjourney Dall-E 3 که بیشتر شبیه تصاویر دوران شوروی بود و بالهای پری را در بر نمیگرفت، کار فوقالعادهای را در کشیدن چکش و داس انجام داد. مثال سمت راست نشان می دهد که چگونه Dall-E 3 ممکن است در متن ظاهر شود.
با این حال، Midjourney وارد فوتورئالیسم شد. هیچ شخصیت اصلی در تصاویر وجود ندارد، فقط محیط اطراف است، اما هنوز هم جالب است. Dall-E 3 نمی خواست دوباره در عکس باشد.
Dall-E 3 در مقابل Midjourney: مزایا و معایب
همانطور که کاربران این فناوری را بررسی می کنند، چندین نقطه قوت و محدودیت قابل توجه آشکار شده است که بینش بیشتری در مورد عملکرد آن ایجاد می کند.
مزایا:
- اطاعت سریع: یکی از ویژگی های برجسته Dall-E 3 توانایی قابل توجه آن در پیگیری دقیق دستورات است. کاربران گزارش کرده اند که مدل هوش مصنوعی به طور موثری به طیف وسیعی از ورودی ها پاسخ می دهد و آن را به ابزاری همه کاره برای کارهای مختلف تبدیل می کند.
- خلاقیت چند وجهی: Dall-E 3 قابلیت به تصویر کشیدن چندین شخصیت در یک تصویر واحد را نشان می دهد و پتانسیل خود را برای داستان سرایی و پروژه های خلاقانه گسترش می دهد. این رویکرد چند وجهی کاربرد آن را در حوزه های مختلف افزایش می دهد.
- یکپارچه سازی متن: کاربران به مهارت Dall-E 3 در ادغام یکپارچه متن در تصاویر اشاره کرده اند. این ویژگی ایجاد محتوای جذاب بصری با عناصر متنی تعبیه شده را تسهیل می کند.
منفی:
- وضوح تصویر: یک محدودیت قابل توجه تمایل هوش مصنوعی به تولید تصاویر با صورت و چشم های تار است. در حالی که از نظر خلاقیت عالی است، گاهی اوقات فاقد وضوح و دقتی است که در محتوای تولید شده توسط انسان مشاهده می شود.
- سازگاری سبک: Dall-E 3 به طور مداوم سبک هنرمندان خاصی را تکرار نمی کند، که ممکن است برای کسانی که به دنبال تقلید دقیق هنری هستند یک اشکال باشد.
- مورد نیاز VPN: دسترسی به Dall-E 3 در حال حاضر نیاز به استفاده از VPN دارد، که ممکن است برای برخی از کاربران چالشهای دسترسی ایجاد کند.
- مدیریت تصویر: کاربران هنگام مدیریت تصاویر تولید شده در وب سایت مایکروسافت بینگ با محدودیت هایی مواجه شده اند. قابل ذکر است، هیچ عملکرد جهتگیری فرمت وجود ندارد، و تاریخچه تصویر به آپلودهای اخیر محدود شده است، که نیاز به کپی فوری برای استفاده بعدی دارد.
- سرعت نسل: در برخی موارد، روند تولید در Dall-E 3 در مقایسه با سایر مدلهای هوش مصنوعی کندتر گزارش شده است.
با وجود این محدودیتها، Dall-E 3 نوید قابل توجهی دارد. کاربران و کارشناسان به طور یکسان به پتانسیل آن برای ایجاد انقلاب در تولید محتوا و داستان سرایی پی می برند. مانند OpenAI به اصلاح و گسترش محصولات خود ادامه می دهد، انتظار می رود که نقاط قوت Dall-E 3 حتی بیشتر بدرخشد و آن را به ابزاری ارزشمند در زمینه های مختلف تبدیل کند.
پرسش های متداول
هم Dall-E 3 و هم Midjourney نقاط قوت و ضعف خود را دارند. Dall-E 3 به طور قابل توجهی مطیع دستورات است و می تواند متن را به طور یکپارچه در تصاویر ادغام کند. با این حال، گاهی اوقات تصاویری با صورت و چشمهای تار تولید میکند و ممکن است به طور مداوم سبکهای هنرمندان خاصی را تکرار نکند. از سوی دیگر، Midjourney در فوتورئالیسم برتر است، اما ممکن است همیشه به اندازه Dall-E 3 ماهیت برخی از اعلانها را درک نکند.
این مقاله اعلانهای متن به تصویر را ارائه میکند که نتایج را از Dall-E 3 و هم به نمایش میگذارد Midjourney، و تفاوت های بین دو مولد هنر را توضیح می دهد.
هر دو مدل هوش مصنوعی نقاط قوت و ضعف خود را دارند. به عنوان مثال، در یک درخواست در مورد یک انسان فضایی در مشتری، Midjourney عملکرد کمی بهتر از Dall-E 3 داشت. با این حال، در یک درخواست دیگر در مورد Wonder Woman، Dall-E 3 در به تصویر کشیدن ماهیت اعلان دقیق تر بود.
- اطاعت سریع: Dall-E 3 به دقت از دستورات پیروی می کند.
- خلاقیت چند وجهی: می تواند چندین کاراکتر را در یک تصویر به تصویر بکشد.
- یکپارچه سازی متن: Dall-E 3 می تواند متن را به صورت یکپارچه در تصاویر ادغام کند.
- وضوح تصویر: گاهی اوقات تصاویری با صورت و چشم های تار تولید می کند.
- سازگاری سبک: Dall-E 3 به طور مداوم سبک های هنرمندان خاصی را تکرار نمی کند.
- مدیریت تصویر: هنگام مدیریت تصاویر تولید شده در وب سایت Microsoft Bing محدودیت هایی وجود دارد.
- سرعت نسل: روند تولید Dall-E 3 در مقایسه با سایر مدل های هوش مصنوعی می تواند کندتر باشد.
سلب مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.
مقالات بیشترDamir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.