รายงานข่าว เทคโนโลยี
April 10, 2023

Stability AI เปิดตัวโมเดลใหม่ที่เรียกว่า SDXL Beta

ในบทสรุป

Stability AI ได้เปิดตัวรุ่นใหม่ที่เรียกว่า SDXL Beta (Stable Diffusion XL เบต้า) เป็นโมเดลขนาดใหญ่ที่มีพารามิเตอร์มากขึ้นและการปรับปรุงบางอย่างที่ไม่รู้จัก มีให้บริการที่ DreamStudio Stability AIเครื่องมือสร้างภาพอย่างเป็นทางการของโปรแกรมนี้ และใช้อัลกอริธึมขั้นสูงและเทคนิคการเรียนรู้เชิงลึกเพื่อสร้างภาพที่สวยงามน่าทึ่ง

Stability AI ได้เปิดตัวพรีวิวรุ่นใหม่ในชื่อ SDXL Beta ย่อมาจาก Stable Diffusion XL เบต้า จนถึงตอนนี้ บริษัทยังไม่ได้เปิดเผยข้อมูลมากมายเกี่ยวกับโมเดล แต่พร้อมสำหรับการทดสอบสำหรับทุกคนที่ต้องการทำเช่นนั้น ความแปลกใหม่เกี่ยวกับโมเดล SDXL นี้มีไว้เพื่ออะไร stable diffusion? ข้อดีและข้อเสียของมันคืออะไร? มาตรวจสอบกัน

อ่านเพิ่มเติม: Midjourney และ Dall-E Artist Styles Dump พร้อมตัวอย่าง: 130 เทคนิคการวาดภาพ AI ที่มีชื่อเสียง

รุ่น SDXL คืออะไรกันแน่?

รุ่น SDXL เป็นรุ่นใหม่ที่กำลัง กำลังฝึกอบรม. มันยังห่างไกลจากการสร้างเสร็จ และเมื่อถึงเวลาเปิดตัว รายละเอียดหลายอย่างเกี่ยวกับมันอาจเปลี่ยนแปลง เท่าที่เราทราบอาจไม่ได้เรียกว่ารุ่น SDXL สิ่งที่เรารู้ก็คือมันเป็นโมเดลที่ใหญ่กว่าพร้อมพารามิเตอร์ที่มากกว่าและการปรับปรุงบางอย่างที่ไม่รู้จัก มันเป็นรุ่น v2 ไม่ใช่รุ่น v3 (ไม่ว่าจะหมายความว่าอย่างไร) เป็นไปได้ว่าการปรับปรุงในโมเดล v2 สามารถปรับปรุงประสิทธิภาพของระบบได้ แต่ถ้าไม่มีข้อมูลเพิ่มเติม ก็ยากที่จะระบุได้ว่าการปรับปรุงเหล่านี้มีนัยสำคัญเพียงใด นอกจากนี้ จะเป็นการดีหากทราบว่ามีการเพิ่มหรือปรับพารามิเตอร์ใดในเวอร์ชันนี้

รุ่น SDXL มีวางจำหน่ายแล้วที่ DreamStudio Stability AIเครื่องกำเนิดภาพอย่างเป็นทางการของ เลือก SDXL Beta จากเมนูรุ่นเพื่อตรวจสอบ ดูเหมือนว่าจะใช้อัลกอริธึมขั้นสูงและ เทคนิคการเรียนรู้เชิงลึก เพื่อสร้างภาพที่น่าทึ่งซึ่งเหมาะสำหรับการใช้งานที่หลากหลาย

รุ่น SDXL คืออะไรกันแน่?

การปรับปรุง

ข้อความที่อ่านได้ SDXL สามารถสร้างข้อความที่อ่านได้ชัดเจนและน่าจะเป็นคุณลักษณะที่โดดเด่นที่สุดเนื่องจากไม่สามารถทำได้ในรุ่น v1 และ v2.1 ที่มีอยู่ ข้อความที่สร้างขึ้นของ SDXL นั้นไม่ถูกต้องเสมอไปอย่างที่คุณเห็นใน Stable Diffusion ข้อความด้านล่าง. อย่างไรก็ตาม มันเหนือกว่ารุ่น v2.1 มาก นับประสาอะไรกับรุ่น v1 นี่เป็นเพราะ SDXL ใช้อัลกอริธึมการเรียนรู้เชิงลึกขั้นสูงที่ช่วยให้เข้าใจและสร้างโครงสร้างภาษาที่ซับซ้อนมากขึ้น ด้วยการพัฒนาเพิ่มเติม จึงมีศักยภาพที่จะแม่นยำและเชื่อถือได้มากยิ่งขึ้น

Prompt: รูปภาพของสุภาพบุรุษถือกระดาษสีขาวที่มีข้อความว่า “No Fakes”
Prompt: รูปภาพของสุภาพบุรุษถือกระดาษสีขาวที่มีข้อความว่า “No Fakes”
ภาพผู้หญิงผมแดงถือป้ายสีดำที่มีตัวอักษรสีขาวเขียนว่า "No Jokes"
Prompt: รูปภาพของหญิงสาวผมแดงถือป้ายสีดำพร้อมฟอนต์สีขาวที่เขียนว่า “No Jokes”
Prompt: รูปภาพของหญิงชาวจีนที่นั่งอยู่ในโรงหนังถือจานที่มีคำว่า "Pain and Plane" เขียนอยู่
Prompt: รูปภาพของหญิงชาวจีนนั่งอยู่ในโรงหนังโดยถือจานที่มีคำว่า “Pain and Plane” เขียนอยู่

กายวิภาคของมนุษย์ การสร้างรูปร่างมนุษย์ที่ถูกต้องตามหลักกายวิภาคเป็นสิ่งที่ท้าทายมาช้านาน stable diffusion. การมีแขนขาเพิ่มเติมหรือขาดหายไปเป็นเรื่องปกติ โดยทั่วไปแล้วการใช้ Inpainting เพื่อแก้ไข หรือล่าสุด คุณสามารถใช้คุณสมบัติ Open Pose ของ ControlNet เพื่อทำซ้ำท่าทางจากภาพอ้างอิงได้ เรามีความยินดีที่ได้ทราบว่านี่คือจุดที่ SDXL รุ่นเบต้าได้รับการปรับปรุง โมเดล SDXL Beta ได้แสดงให้เห็นการปรับปรุงที่สำคัญในการจำลองท่าทางที่ถูกต้องจากภาพอ้างอิง นี่อาจเป็นเครื่องมือที่มีประโยชน์สำหรับแอปพลิเคชันต่างๆ เช่น ภาพเคลื่อนไหวและความเป็นจริงเสมือน

ภาพผู้หญิงในชุดกีฬากำลังหมุนลูกบอลในมือขวา
Prompt: รูปภาพของผู้หญิงในชุดกีฬากำลังหมุนลูกบอลในมือขวา
ภาพถ่ายของเด็กชายนั่งอยู่ใต้พระจันทร์สีแดง
Prompt: รูปถ่ายของเด็กชายนั่งอยู่ใต้พระจันทร์สีแดง
Prompt: ภาพถ่ายแสดงให้เห็นชายชราคนหนึ่งกำลังวิ่งอยู่ในป่า

สไตล์แนวตั้ง SDXL Beta สร้างภาพบุคคลที่ยอดเยี่ยมที่ดูเหมือนภาพถ่าย ซึ่งเป็นการอัปเกรดเมื่อเทียบกับเวอร์ชัน 1.5 อัลกอริทึมที่ได้รับการปรับปรุงใน SDXL Beta ช่วยเพิ่มรายละเอียดและความแม่นยำของสีให้กับภาพบุคคล ส่งผลให้ภาพดูเป็นธรรมชาติและสมจริงยิ่งขึ้น ผู้ใช้ยังสามารถปรับระดับความคมชัดและความอิ่มตัวเพื่อให้ได้เอฟเฟ็กต์ที่ต้องการ

Prompt: รูปภาพของเด็กชายและเด็กหญิง
Prompt: รูปภาพของเด็กชายและเด็กหญิง
Prompt: ภาพถ่ายแนวผู้ชายอ้วน
Prompt: ภาพถ่ายแนวผู้ชายอ้วน
Prompt: ภาพถ่ายของผู้หญิงจากยุค 80
Prompt: ภาพถ่ายของผู้หญิงจากยุค 80

ดูโอโทน คำหลัก duotone จะสร้างภาพถ่ายขาวดำในโมเดล v1.5 เสมอ อย่างไรก็ตาม ในตอนนี้ ภาพ duotone ที่ผลิตโดย SDXL Beta มีหลากหลายสี เป็นที่ชัดเจนว่าเมื่อเทียบกับรุ่น v1 ความสามารถในการ ตีความพรอมต์ ได้รับการปรับปรุง ส่งผลให้มีการตอบสนองที่ถูกต้องและตรงประเด็นมากขึ้นจากโมเดล v2 ทำให้เป็นเครื่องมือที่เชื่อถือได้มากขึ้นสำหรับงานประมวลผลภาษาธรรมชาติ

ภาพสไตล์ดูโอโทนของสุนัข
Prompt: ภาพสไตล์ดูโอโทนของสุนัข
ภูมิทัศน์ duotone ของเกาะ
Prompt: ภูมิทัศน์ duotone ของเกาะ
ภาพดูโอโทนของหญิงสาวชาวแอฟริกัน
Prompt: ภาพดูโอโทนของหญิงสาวชาวแอฟริกัน

สไตล์ศิลปะ มีการปรับเปลี่ยนเล็กน้อย แต่เป็นการยากที่จะตัดสินว่าโมเดลใหม่นี้ให้ผลลัพธ์ที่ดีขึ้นหรือไม่ เนื่องจากไม่ซ้ำใคร เป็นไปได้ว่าการปรับเปลี่ยนเหล่านี้อาจเป็นเรื่องของความชอบส่วนตัวหรือความคิดเห็นส่วนตัว ทำให้ยากต่อการปรับ defiการตัดสินโดยกำเนิดเกี่ยวกับคุณภาพของพวกเขา อย่างไรก็ตาม ความเป็นเอกลักษณ์ของการปรับแต่งอาจเป็นสิ่งที่น่าสังเกตและควรค่าแก่การสำรวจเพิ่มเติม

นิวยอร์ก โดย Ivan Aivazovsky
v 1.5: นิวยอร์ก โดย Ivan Aivazovsky
นิวยอร์ก โดย Ivan Aivazovsky
SDXL: นิวยอร์ก โดย Ivan Aivazovsky
ป่าเก่าโดย Christopher Balaskas
v 1.5: Old Forest โดย Christopher Balaskas
ป่าเก่าโดย Christopher Balaskas
SDXL: Old Forest โดย คริสโตเฟอร์ บาลาสกัส

สรุป

  • Stable Diffusion สามารถสร้างข้อความที่เหมาะสมได้ในที่สุด
  • SDXL ให้ภาพที่สวยงามน่าพึงพอใจมากกว่ารุ่น v2.1 และ (ในระดับที่น้อยกว่า) รุ่น v1.5
  • โมเดลใหม่ให้ภาพที่แม่นยำยิ่งขึ้น
  • กายวิภาคของมนุษย์ดีขึ้น
  • การแจ้งเตือนเชิงลบไม่จำเป็นเท่าใน v2.1
  • สามารถสร้างภาพเหมือนจริงได้
  • สิ่งผิดปกติบางอย่างในโมเดลจะได้รับการแก้ไขก่อนเปิดตัว

อ่านบทความที่เกี่ยวข้องเพิ่มเติม:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

บทความอื่น ๆ
ดาเมียร์ ยาลอฟ
ดาเมียร์ ยาลอฟ

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

Hot Stories

BRICS Nations Eye โซลูชันการค้า Stablecoin

by วิคทอเรีย ปาลชิค
May 01, 2024
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

วันพิพากษามาถึง: ชะตากรรมของ CZ แขวนอยู่ในสมดุลขณะที่ศาลสหรัฐฯ พิจารณาคำร้องของ DOJ

ฉางเผิง จ้าว เตรียมเผชิญโทษจำคุกในศาลสหรัฐฯ ในเมืองซีแอตเทิลวันนี้

รู้เพิ่มเติม

ผู้ก่อตั้ง Samourai Wallet ถูกกล่าวหาว่าอำนวยความสะดวกมูลค่า 2 พันล้านดอลลาร์ในข้อเสนอ Darknet

การจับกุมผู้ก่อตั้ง Samourai Wallet แสดงให้เห็นถึงความพ่ายแพ้ที่โดดเด่นของอุตสาหกรรม โดยเน้นย้ำถึงความต่อเนื่อง ...

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
Ankr ร่วมมือกับแพลตฟอร์ม Talus Network ของ AI Blockchain เพื่อปลดล็อกสภาพคล่องของ Bitcoin สำหรับ AI
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
Ankr ร่วมมือกับแพลตฟอร์ม Talus Network ของ AI Blockchain เพื่อปลดล็อกสภาพคล่องของ Bitcoin สำหรับ AI
May 1, 2024
Binance Labs สนับสนุน Movement Labs เพื่ออำนวยความสะดวกในการบูรณาการการเคลื่อนไหวของ Facebook ข้ามบล็อกเชน
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
Binance Labs สนับสนุน Movement Labs เพื่ออำนวยความสะดวกในการบูรณาการการเคลื่อนไหวของ Facebook ข้ามบล็อกเชน
May 1, 2024
BRICS Nations Eye โซลูชันการค้า Stablecoin
บัญชีธุรกิจ ตลาด เรื่องราวและบทวิจารณ์ เทคโนโลยี
BRICS Nations Eye โซลูชันการค้า Stablecoin
May 1, 2024
BOB เครือข่าย Bitcoin L2 ผสานรวมกับ LayerZero เพื่อการทำงานที่ได้รับการปรับปรุง
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
BOB เครือข่าย Bitcoin L2 ผสานรวมกับ LayerZero เพื่อการทำงานที่ได้รับการปรับปรุง
May 1, 2024
CRYPTOMERIA LABS PTE. บจก.