Stability AI เปิดตัวโมเดลใหม่ที่เรียกว่า SDXL Beta
ในบทสรุป
Stability AI ได้เปิดตัวรุ่นใหม่ที่เรียกว่า SDXL Beta (Stable Diffusion XL เบต้า) เป็นโมเดลขนาดใหญ่ที่มีพารามิเตอร์มากขึ้นและการปรับปรุงบางอย่างที่ไม่รู้จัก มีให้บริการที่ DreamStudio Stability AIเครื่องมือสร้างภาพอย่างเป็นทางการของโปรแกรมนี้ และใช้อัลกอริธึมขั้นสูงและเทคนิคการเรียนรู้เชิงลึกเพื่อสร้างภาพที่สวยงามน่าทึ่ง
Stability AI ได้เปิดตัวพรีวิวรุ่นใหม่ในชื่อ SDXL Beta ย่อมาจาก Stable Diffusion XL เบต้า จนถึงตอนนี้ บริษัทยังไม่ได้เปิดเผยข้อมูลมากมายเกี่ยวกับโมเดล แต่พร้อมสำหรับการทดสอบสำหรับทุกคนที่ต้องการทำเช่นนั้น ความแปลกใหม่เกี่ยวกับโมเดล SDXL นี้มีไว้เพื่ออะไร stable diffusion? ข้อดีและข้อเสียของมันคืออะไร? มาตรวจสอบกัน
อ่านเพิ่มเติม: Midjourney และ Dall-E Artist Styles Dump พร้อมตัวอย่าง: 130 เทคนิคการวาดภาพ AI ที่มีชื่อเสียง |
รุ่น SDXL คืออะไรกันแน่?
รุ่น SDXL เป็นรุ่นใหม่ที่กำลัง กำลังฝึกอบรม. มันยังห่างไกลจากการสร้างเสร็จ และเมื่อถึงเวลาเปิดตัว รายละเอียดหลายอย่างเกี่ยวกับมันอาจเปลี่ยนแปลง เท่าที่เราทราบอาจไม่ได้เรียกว่ารุ่น SDXL สิ่งที่เรารู้ก็คือมันเป็นโมเดลที่ใหญ่กว่าพร้อมพารามิเตอร์ที่มากกว่าและการปรับปรุงบางอย่างที่ไม่รู้จัก มันเป็นรุ่น v2 ไม่ใช่รุ่น v3 (ไม่ว่าจะหมายความว่าอย่างไร) เป็นไปได้ว่าการปรับปรุงในโมเดล v2 สามารถปรับปรุงประสิทธิภาพของระบบได้ แต่ถ้าไม่มีข้อมูลเพิ่มเติม ก็ยากที่จะระบุได้ว่าการปรับปรุงเหล่านี้มีนัยสำคัญเพียงใด นอกจากนี้ จะเป็นการดีหากทราบว่ามีการเพิ่มหรือปรับพารามิเตอร์ใดในเวอร์ชันนี้
รุ่น SDXL มีวางจำหน่ายแล้วที่ DreamStudio Stability AIเครื่องกำเนิดภาพอย่างเป็นทางการของ เลือก SDXL Beta จากเมนูรุ่นเพื่อตรวจสอบ ดูเหมือนว่าจะใช้อัลกอริธึมขั้นสูงและ เทคนิคการเรียนรู้เชิงลึก เพื่อสร้างภาพที่น่าทึ่งซึ่งเหมาะสำหรับการใช้งานที่หลากหลาย
การปรับปรุง
ข้อความที่อ่านได้ SDXL สามารถสร้างข้อความที่อ่านได้ชัดเจนและน่าจะเป็นคุณลักษณะที่โดดเด่นที่สุดเนื่องจากไม่สามารถทำได้ในรุ่น v1 และ v2.1 ที่มีอยู่ ข้อความที่สร้างขึ้นของ SDXL นั้นไม่ถูกต้องเสมอไปอย่างที่คุณเห็นใน Stable Diffusion ข้อความด้านล่าง. อย่างไรก็ตาม มันเหนือกว่ารุ่น v2.1 มาก นับประสาอะไรกับรุ่น v1 นี่เป็นเพราะ SDXL ใช้อัลกอริธึมการเรียนรู้เชิงลึกขั้นสูงที่ช่วยให้เข้าใจและสร้างโครงสร้างภาษาที่ซับซ้อนมากขึ้น ด้วยการพัฒนาเพิ่มเติม จึงมีศักยภาพที่จะแม่นยำและเชื่อถือได้มากยิ่งขึ้น
กายวิภาคของมนุษย์ การสร้างรูปร่างมนุษย์ที่ถูกต้องตามหลักกายวิภาคเป็นสิ่งที่ท้าทายมาช้านาน stable diffusion. การมีแขนขาเพิ่มเติมหรือขาดหายไปเป็นเรื่องปกติ โดยทั่วไปแล้วการใช้ Inpainting เพื่อแก้ไข หรือล่าสุด คุณสามารถใช้คุณสมบัติ Open Pose ของ ControlNet เพื่อทำซ้ำท่าทางจากภาพอ้างอิงได้ เรามีความยินดีที่ได้ทราบว่านี่คือจุดที่ SDXL รุ่นเบต้าได้รับการปรับปรุง โมเดล SDXL Beta ได้แสดงให้เห็นการปรับปรุงที่สำคัญในการจำลองท่าทางที่ถูกต้องจากภาพอ้างอิง นี่อาจเป็นเครื่องมือที่มีประโยชน์สำหรับแอปพลิเคชันต่างๆ เช่น ภาพเคลื่อนไหวและความเป็นจริงเสมือน
สไตล์แนวตั้ง SDXL Beta สร้างภาพบุคคลที่ยอดเยี่ยมที่ดูเหมือนภาพถ่าย ซึ่งเป็นการอัปเกรดเมื่อเทียบกับเวอร์ชัน 1.5 อัลกอริทึมที่ได้รับการปรับปรุงใน SDXL Beta ช่วยเพิ่มรายละเอียดและความแม่นยำของสีให้กับภาพบุคคล ส่งผลให้ภาพดูเป็นธรรมชาติและสมจริงยิ่งขึ้น ผู้ใช้ยังสามารถปรับระดับความคมชัดและความอิ่มตัวเพื่อให้ได้เอฟเฟ็กต์ที่ต้องการ
ดูโอโทน คำหลัก duotone จะสร้างภาพถ่ายขาวดำในโมเดล v1.5 เสมอ อย่างไรก็ตาม ในตอนนี้ ภาพ duotone ที่ผลิตโดย SDXL Beta มีหลากหลายสี เป็นที่ชัดเจนว่าเมื่อเทียบกับรุ่น v1 ความสามารถในการ ตีความพรอมต์ ได้รับการปรับปรุง ส่งผลให้มีการตอบสนองที่ถูกต้องและตรงประเด็นมากขึ้นจากโมเดล v2 ทำให้เป็นเครื่องมือที่เชื่อถือได้มากขึ้นสำหรับงานประมวลผลภาษาธรรมชาติ
สไตล์ศิลปะ มีการปรับเปลี่ยนเล็กน้อย แต่เป็นการยากที่จะตัดสินว่าโมเดลใหม่นี้ให้ผลลัพธ์ที่ดีขึ้นหรือไม่ เนื่องจากไม่ซ้ำใคร เป็นไปได้ว่าการปรับเปลี่ยนเหล่านี้อาจเป็นเรื่องของความชอบส่วนตัวหรือความคิดเห็นส่วนตัว ทำให้ยากต่อการปรับ defiการตัดสินโดยกำเนิดเกี่ยวกับคุณภาพของพวกเขา อย่างไรก็ตาม ความเป็นเอกลักษณ์ของการปรับแต่งอาจเป็นสิ่งที่น่าสังเกตและควรค่าแก่การสำรวจเพิ่มเติม
สรุป
- Stable Diffusion สามารถสร้างข้อความที่เหมาะสมได้ในที่สุด
- SDXL ให้ภาพที่สวยงามน่าพึงพอใจมากกว่ารุ่น v2.1 และ (ในระดับที่น้อยกว่า) รุ่น v1.5
- โมเดลใหม่ให้ภาพที่แม่นยำยิ่งขึ้น
- กายวิภาคของมนุษย์ดีขึ้น
- การแจ้งเตือนเชิงลบไม่จำเป็นเท่าใน v2.1
- สามารถสร้างภาพเหมือนจริงได้
- สิ่งผิดปกติบางอย่างในโมเดลจะได้รับการแก้ไขก่อนเปิดตัว
อ่านบทความที่เกี่ยวข้องเพิ่มเติม:
ข้อจำกัดความรับผิดชอบ
สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า
เกี่ยวกับผู้เขียน
Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต
บทความอื่น ๆDamir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต