ดัล-อี 3 ต่อ Midjourney: การเปรียบเทียบครั้งใหญ่ของเครื่องกำเนิดงานศิลปะ AI ที่ทันสมัยที่สุด
เข้าร่วมกับเราในการเดินทางที่น่าตื่นเต้นนี้ในขณะที่เราสำรวจ Dall-E 3 และ Midjourneyรายละเอียดปลีกย่อย ความซับซ้อน และศักยภาพที่ยังไม่ได้ใช้ประโยชน์ บทความนี้เน้นการเปรียบเทียบที่น่าสนใจที่สุดจากการวิจัยที่ทำโดย Atachkina ผู้ชื่นชอบ AI หากคุณสนใจที่จะเรียนรู้เพิ่มเติม คลิก ลิงค์.
Pro Tips |
---|
1. ค้นพบ ข้อความเป็นรูปภาพ 50 อันดับแรก สำหรับเครื่องกำเนิดศิลปะ AI Midjourney และ DALL-E |
2. จุดประกายความคิดสร้างสรรค์ของคุณด้วย เครื่องกำเนิดศิลปะข้อความเป็นรูปภาพ AI 20 อันดับแรก จาก 2023 |
บทความนี้จะแสดงข้อความเป็นรูปภาพ รูปภาพที่แสดงผลลัพธ์จาก Dall-E 3 และ Midjourneyและคำอธิบายความแตกต่างระหว่างทั้งสอง เครื่องกำเนิดงานศิลปะ. เอาล่ะ.
โครงข่ายประสาทเทียมทั้งสองทำงานได้อย่างน่าชื่นชมในกรณีนี้ พร้อมด้วย Midjourney ทำได้ดีกว่าคนอื่นๆ เล็กน้อย
Dall-E 3 ทำงานได้แย่กว่ามากที่นี่ มันมีสีสันที่สดใสของสไตล์ แต่ไม่ใช่ความชัดเจนของรายละเอียด ร่างกายที่มีรูปร่างผิดปกติปรากฏขึ้นในพื้นหลัง และใบหน้าก็ไม่ประสบผลสำเร็จเลย
มันกลายเป็นเรื่องที่น่าสนใจทั้งสองแห่ง แต่ Dall-E 3 ต้องดิ้นรนกับใบหน้าอีกครั้ง แต่มันกลับทำกระเป๋าสีเบจหรูหราตามคำแนะนำในข้อความแจ้ง และ Midjourney ไม่สนใจมัน ในกรณีนี้ Dall-E 3 เชื่อฟังอย่างมากในการดำเนินการตามคำสั่ง
และอีกครั้งหนึ่ง ในขณะที่ทั้งสองกริดสร้างภาพต่อกันที่ยอดเยี่ยม Dall-E 3 ซื่อสัตย์ต่อข้อความแจ้งมากกว่า มันเพิ่มเฉพาะฮีโร่ที่เราระบุ ไม่สามารถกลายเป็นโจ๊กเกอร์ได้ และมันข้ามกัปตันกับแบทแมน
Midjourney สามารถผสมผสานสไตล์ของศิลปินทั้งสองเข้าด้วยกันได้จากพรอมต์ ในขณะที่ Dall-E 3 เพิ่งเพิ่มรายละเอียดที่ยุ่งวุ่นวายและสีสันที่สดใสให้กับพื้นหลัง
เป็นอีกครั้งที่แมวอยู่ในฟอร์มที่ยอดเยี่ยม และโครงข่ายประสาทเทียมทั้งสองก็สามารถเข้าใจกล้องฟิล์มได้อย่างสมบูรณ์แบบ อย่างไรก็ตาม Dall-E 3 ยังเพิ่มเกรนให้กับรูปภาพอีกด้วย
Dall-E 3 สร้าง Leonardo DiCaprio รุ่นเยาว์ด้วยพื้นผิวจัมเปอร์สุดเท่ เพิ่มเกรนของฟิล์มและโทนสี และสะท้อนความรู้สึกของเดชารัสเซียได้อย่างยอดเยี่ยมมาก Midjourney เป็นตัวสะท้อนแสงที่ดีสำหรับภาพยนตร์เรื่องนี้ และดิคาปริโอทำให้เธอดูเป็นผู้ใหญ่มากขึ้น
ถึงแม้ว่าทั้งคู่ เครือข่ายประสาทเทียม เชี่ยวชาญในการสร้างภาพต่อกันหากมองใกล้ ๆ Midjourney บิดเบือนใบหน้าและรูปร่างของวัตถุบางส่วน ในขณะที่ Dall-E 3 มีความแม่นยำมากกว่าในการแสดงตัวละครด้วยตัวเอง—มันกลายเป็นชิวแบ็กก้าด้วยซ้ำ
เมื่อคุณขยายภาพ คุณจะสังเกตเห็นว่า Dall-E 3 มีดวงตาพร่ามัว Midjourneyในทางกลับกันไม่มีที่ติ Dall-E 3 ยังกำหนดแบรนด์ด้วย งูบนหัวดูมีชีวิตชีวาและเคลื่อนไหวได้มากกว่า Midjourney มักจะให้พวกเขานอนราบแทนที่จะนอนบนศีรษะ
เจ๋งทั้งคู่ แต่. Midjourney คำนึงถึงสไตล์ของศิลปินและเอฟเฟกต์ของกล้องฟิล์ม ในขณะที่ Dall-E 3 เพิกเฉยต่อช็อตเต็มความยาวและไม่ได้คำนึงถึงมัน
นอกจากนี้เรายังตัดสินใจทดสอบภาพถ่ายกับนางฟ้าด้วย แต่ Dall-E 3 ปฏิเสธที่จะให้ความร่วมมืออย่างดื้อรั้น Midjourney ไม่ได้ละเลยปีกเพราะมีการเพิ่มการอ้างอิงด้วยปีกแล้ว เมื่อ Dall-E 3 ถ่ายภาพ ก็มีความเป็นไปได้ที่น่าสนใจอยู่บ้าง แต่กับผู้หญิงอเมริกันคนหนึ่ง
Midjourney ทำงานได้ยอดเยี่ยมมาก แต่เราต้องการดึงความสนใจเป็นพิเศษว่า Dall-E 3 สร้างเอฟเฟ็กต์ฟิล์มในภาพขวาบนและเพิ่มลายมือสีขาวของตัวเองได้อย่างไร มันดูดีมาก
Dall-E 3 สามารถจดจำฮีโร่ทุกคนในภาพเดียวได้อย่างเชื่อฟังอีกครั้ง Midjourney พยายามอย่างหนักและเกือบจะประสบความสำเร็จด้วยซ้ำ
เมื่อมองแวบแรก ดูเหมือนว่าทั้งคู่จะดี แต่เมื่อตรวจสอบอย่างใกล้ชิดพบว่า Dall-E 3 ขาดปริมาณภาพที่สมจริง และนั่น Midjourney จัดการข้อต่อด้วยส้อมอย่างปัง
เครื่องกำเนิดไฟฟ้าทั้งสองมีความเชี่ยวชาญในสาขาของตน โดย Dall-E 3 เป็นเลิศในด้านข้อความและ Midjourney ความเป็นเลิศในด้านความสมจริงด้วยแสง
ฟิสิกส์และรูปทรงของเครื่องเป่าผมเป็นเรื่องยากสำหรับ Midjourney. คุณสามารถใช้เวลามากมายกับการพยายามและการอ้างอิง และในบางครั้งผลลัพธ์จะคล้ายกับเครื่องเป่าผม แต่ Dall-E 3 ให้ผลลัพธ์ที่ยอมรับได้ในการลองครั้งแรกและแม้แต่การเขียนข้อความด้วยซ้ำ
ตาข้างเดียวก็ดีแต่นั่นเป็นอีกเรื่องหนึ่ง ใน Midjourneyเราเขียนข้อความเชิงลบ – ไม่มีการ์ตูน ภาพประกอบ แบน สองตา Dall-E 3 เชื่อฟังทันทีและทำตาข้างหนึ่ง ยิ้ม และถอดหมวกออก แต่กลับไม่ยอมให้ใครถ่ายรูปเธออย่างเด็ดขาด
Midjourney ทำให้คนรุ่นไม่เหมือนแบรด เราจึงใช้บริการเสริม Insight Face Swap เพื่อนำหน้าแบรดมาสู่รุ่น; มีโพสต์เกี่ยวกับเรื่องนี้ที่นี่ Dall-E 3 รู้ว่า Brad Pitt คือใคร และสามารถดึงดูดดวงดาวได้โดยไม่ต้องใช้ซอฟต์แวร์เพิ่มเติม
ตาข่ายทั้งสองนั้นดี แต่ Dall-E 3 สามารถสร้างเขายูนิคอร์นได้ในขณะนั้น Midjourney โดยทั่วไปไม่สามารถ
Dall-E 3 ทำงานได้ดีในการนำตัวละครไปใช้จริง เราสามารถเห็นออร์คและเอลฟ์ที่มีหูเอลฟ์ มีคนใส่ชุดวอร์ม Nike เหมือนกัน แต่ตามีรอยเปื้อน หูแหลมของพวกเอลฟ์ส่วนใหญ่จะถูกละเลย Midjourneyและไนกี้ก็ถูกละเลยเช่นกัน
เมื่อคำลงท้าย "ภาพประกอบ" ถูกละเว้นจากพรอมต์ Dall-E 3 ได้สร้างขึ้นมา เราจึงตัดสินใจเปรียบเทียบมันกับ Midjourneyภาพประกอบ. ในขณะที่ Midjourney มีลักษณะคล้ายกับภาพประกอบในยุคโซเวียตอย่างใกล้ชิดมากขึ้นและไม่รวมปีกนางฟ้า Dall-E 3 ทำงานได้ยอดเยี่ยมในการวาดค้อนและเคียว ตัวอย่างทางด้านขวาแสดงให้เห็นว่า Dall-E 3 อาจปรากฏในข้อความอย่างไร
อย่างไรก็ตาม Midjourney เข้าสู่ความสมจริงด้วยแสง ในภาพไม่มีตัวละครหลัก มีแต่บริเวณโดยรอบ แต่ยังคงความเท่ Dall-E 3 ไม่อยากอยู่ในภาพนั้นอีก
ดัล-อี 3 ต่อ Midjourney: ข้อดีและข้อเสีย
ในขณะที่ผู้ใช้สำรวจเทคโนโลยีนี้ จุดแข็งและข้อจำกัดที่โดดเด่นหลายประการได้เปิดเผยออกมา ส่งผลให้มีความเข้าใจเพิ่มเติมเกี่ยวกับฟังก์ชันการทำงานของเทคโนโลยีนี้
จุดเด่น:
- การเชื่อฟังคำสั่งทันที: หนึ่งในคุณสมบัติที่โดดเด่นของ Dall-E 3 คือความสามารถที่โดดเด่นในการปฏิบัติตามคำแนะนำอย่างแม่นยำ ผู้ใช้รายงานว่าโมเดล AI ตอบสนองอย่างมีประสิทธิภาพต่ออินพุตที่หลากหลาย ทำให้เป็นเครื่องมืออเนกประสงค์สำหรับงานต่างๆ
- ความคิดสร้างสรรค์ที่หลากหลาย: Dall-E 3 จัดแสดงความสามารถในการพรรณนาตัวละครหลายตัวภายในภาพเดียว ขยายศักยภาพในการเล่าเรื่องและโครงการสร้างสรรค์ แนวทางที่หลากหลายนี้ช่วยเพิ่มอรรถประโยชน์ในโดเมนต่างๆ
- บูรณาการข้อความ: ผู้ใช้สังเกตเห็นความสามารถของ Dall-E 3 ในการบูรณาการข้อความเข้ากับรูปภาพได้อย่างลงตัว คุณลักษณะนี้อำนวยความสะดวกในการสร้างเนื้อหาที่ดึงดูดสายตาด้วยองค์ประกอบข้อความที่ฝังไว้
จุดด้อย:
- ภาพชัดเจน: ข้อจำกัดที่น่าสังเกตคือแนวโน้มของ AI ในการสร้างภาพที่มีใบหน้าและดวงตาเบลอ แม้ว่าจะมีความคิดสร้างสรรค์เป็นเลิศ แต่บางครั้งก็ขาดความชัดเจนและความแม่นยำที่เห็นในเนื้อหาที่มนุษย์สร้างขึ้น
- ความสม่ำเสมอของสไตล์: Dall-E 3 ไม่ได้จำลองสไตล์ของศิลปินที่เฉพาะเจาะจงอย่างสม่ำเสมอซึ่งอาจเป็นข้อเสียเปรียบสำหรับผู้ที่แสวงหาการเลียนแบบทางศิลปะที่แม่นยำ
- ข้อกำหนด VPN: ปัจจุบันการเข้าถึง Dall-E 3 จำเป็นต้องใช้ VPN ซึ่งอาจก่อให้เกิดความท้าทายในการเข้าถึงสำหรับผู้ใช้บางราย
- การจัดการรูปภาพ: ผู้ใช้พบข้อจำกัดเมื่อจัดการรูปภาพที่สร้างขึ้นบนเว็บไซต์ Microsoft Bing โดยเฉพาะอย่างยิ่ง ไม่มีฟังก์ชันการวางแนวรูปแบบ และประวัติภาพถูกจำกัดไว้เฉพาะการอัปโหลดล่าสุด ซึ่งจำเป็นต้องคัดลอกทันทีเพื่อใช้ในภายหลัง
- ความเร็วในการสร้าง: ในบางกรณี กระบวนการสร้างใน Dall-E 3 ได้รับการรายงานว่าช้ากว่าเมื่อเปรียบเทียบกับโมเดล AI อื่นๆ
แม้จะมีข้อจำกัดเหล่านี้ Dall-E 3 ก็มีคำมั่นสัญญาที่สำคัญ ผู้ใช้และผู้เชี่ยวชาญต่างตระหนักถึงศักยภาพในการปฏิวัติการสร้างเนื้อหาและการเล่าเรื่อง เช่น OpenAI ยังคงปรับปรุงและขยายการนำเสนออย่างต่อเนื่อง โดยคาดว่าจุดแข็งของ Dall-E 3 จะส่องสว่างยิ่งขึ้นไปอีก ทำให้เป็นเครื่องมืออันทรงคุณค่าในด้านต่างๆ
คำถามที่พบบ่อย
ทั้ง Dall-E3 และ Midjourney มีจุดแข็งและจุดอ่อน Dall-E 3 เชื่อฟังคำสั่งและสามารถรวมข้อความเข้ากับรูปภาพได้อย่างลงตัว อย่างไรก็ตาม บางครั้งอาจสร้างภาพที่มีใบหน้าและดวงตาเบลอ และอาจไม่ได้เลียนแบบสไตล์ของศิลปินคนใดคนหนึ่งอย่างสม่ำเสมอ ในทางกลับกัน, Midjourney เป็นเลิศในด้านความสมจริงของแสง แต่อาจไม่สามารถจับภาพสาระสำคัญของการแจ้งเตือนบางอย่างได้แม่นยำเท่ากับ Dall-E 3
บทความนี้ให้ข้อความเป็นรูปภาพ โดยแสดงผลลัพธ์จากทั้ง Dall-E 3 และ Midjourneyและอธิบายความแตกต่างระหว่างเครื่องกำเนิดศิลปะทั้งสองเครื่อง
AI ทั้งสองรุ่นมีจุดแข็งและจุดอ่อน ตัวอย่างเช่น ในข้อความแจ้งเกี่ยวกับนักบินอวกาศบนดาวพฤหัสบดี Midjourney มีประสิทธิภาพเหนือกว่า Dall-E 3 เล็กน้อย อย่างไรก็ตาม ในพรอมต์อื่นเกี่ยวกับ Wonder Woman Dall-E 3 มีความแม่นยำมากกว่าในการจับแก่นแท้ของพรอมต์
- การเชื่อฟังทันที: Dall-E 3 ปฏิบัติตามคำแนะนำอย่างถูกต้อง
- ความคิดสร้างสรรค์ที่หลากหลาย: สามารถแสดงตัวละครได้หลายตัวในภาพเดียว
- บูรณาการข้อความ: Dall-E 3 สามารถรวมข้อความเข้ากับรูปภาพได้อย่างราบรื่น
- ความคมชัดของภาพ: บางครั้งอาจสร้างภาพที่มีใบหน้าและดวงตาเบลอ
- ความสม่ำเสมอของสไตล์: Dall-E 3 ไม่ได้จำลองสไตล์ของศิลปินที่เฉพาะเจาะจงอย่างสม่ำเสมอ
- การจัดการรูปภาพ: มีข้อจำกัดในการจัดการรูปภาพที่สร้างขึ้นบนเว็บไซต์ Microsoft Bing
- ความเร็วในการสร้าง: กระบวนการสร้างของ Dall-E 3 อาจช้าลงเมื่อเทียบกับรุ่น AI อื่นๆ
ข้อจำกัดความรับผิดชอบ
สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า
เกี่ยวกับผู้เขียน
Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต
บทความอื่น ๆDamir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต