รายงานข่าว เทคโนโลยี
November 24, 2022

Stability AI's Stable Diffusion ในที่สุดอัลกอริทึม 2 ก็เผยแพร่สู่สาธารณะแล้ว: โมเดล deep2img ใหม่, ตัวอัปสเกลเลอร์ความละเอียดสูงพิเศษ, ไม่มีเนื้อหาสำหรับผู้ใหญ่

ในบทสรุป

Stable Diffusion โมเดล 2.0 เร็วกว่า เป็นโอเพ่นซอร์ส ปรับขนาดได้ แข็งแกร่งกว่ารุ่นก่อนหน้า

Stable Diffusion รับ GPU พร้อมคุณสมบัติใหม่สำหรับการเรนเดอร์แบบเรียลไทม์

แนะนำเชิงลึก stable diffusion แบบ – Image-to-Image พร้อมแนวคิดใหม่ๆ สำหรับการใช้งานที่สร้างสรรค์

Stability AI มี การเผยแพร่ กระดาษใหม่ในบล็อกเกี่ยวกับ Stable Diffusion 2. ในนั้น Stability AI เสนออัลกอริทึมใหม่ที่มีประสิทธิภาพและแข็งแกร่งกว่าอันก่อนหน้า ในขณะที่เปรียบเทียบกับวิธีการล้ำสมัยอื่นๆ

เปิด AI ของ Stable Diffusion ในที่สุดอัลกอริทึม 2 ก็เผยแพร่สู่สาธารณะแล้ว: โมเดล deep2img ใหม่, ตัวอัปสเกลเลอร์ความละเอียดสูงพิเศษ, ไม่มีเนื้อหาสำหรับผู้ใหญ่

ต้นฉบับของ CompVis Stable Diffusion รุ่น V1 ปฏิวัติ ธรรมชาติของโอเพ่นซอร์ส โมเดล AI และผลิตโมเดลและความก้าวหน้าที่แตกต่างกันหลายร้อยรายการทั่วโลก มันเห็นหนึ่งในการไต่ขึ้นเร็วที่สุดถึง 10,000 ดาว Github โดยเพิ่มขึ้น 33,000 ในเวลาน้อยกว่าสองเดือน ซึ่งเร็วกว่าโปรแกรมอื่น ๆ บน Github

ต้นฉบับ Stable Diffusion การเปิดตัว V1 นำโดยทีมงานแบบไดนามิกของ Robin Rombach (Stability AI) และ Patrick Esser (Runway ML) จาก CompVis Group ที่ LMU Munich นำโดย Prof. Dr. Björn Ommer พวกเขาสร้างขึ้นจากงานก่อนหน้าของแล็บด้วย Latent แบบจำลองการแพร่กระจาย และได้รับการสนับสนุนที่สำคัญจาก LAION และ Eleuther AI

เปิด AI ของ Stable Diffusion ในที่สุดอัลกอริทึม 2 ก็เผยแพร่สู่สาธารณะแล้ว: โมเดล deep2img ใหม่, ตัวอัปสเกลเลอร์ความละเอียดสูงพิเศษ, ไม่มีเนื้อหาสำหรับผู้ใหญ่
เปิด AI ของ Stable Diffusion ในที่สุดอัลกอริทึม 2 ก็เผยแพร่สู่สาธารณะแล้ว: โมเดล deep2img ใหม่, ตัวอัปสเกลเลอร์ความละเอียดสูงพิเศษ, ไม่มีเนื้อหาสำหรับผู้ใหญ่

สิ่งที่ทำให้ Stable Diffusion v1 แตกต่างจาก Stable Diffusion v2? 

Stable Diffusion 2.0 มีการปรับปรุงและคุณสมบัติที่สำคัญหลายอย่างจากเวอร์ชันก่อนหน้า ดังนั้นเรามาดูกันดีกว่า

พื้นที่ Stable Diffusion รุ่น 2.0 นำเสนอโมเดลแปลงข้อความเป็นรูปภาพที่มีประสิทธิภาพซึ่งได้รับการฝึกฝนด้วยตัวเข้ารหัสข้อความใหม่ล่าสุด (OpenCLIP) ที่พัฒนาโดย LAION พร้อมความช่วยเหลือจาก Stability AIซึ่งช่วยเพิ่มคุณภาพของ ภาพที่สร้างขึ้น มากกว่ารุ่น V1 ก่อนหน้า โมเดลแปลงข้อความเป็นรูปภาพของรุ่นนี้สามารถส่งออกรูปภาพที่มีความละเอียดเริ่มต้นที่ 512×512 พิกเซลและ 768×768 พิกเซล

โมเดลเหล่านี้ได้รับการฝึกฝนโดยใช้ชุดย่อยที่สวยงามของชุดข้อมูล LAION-5B ที่สร้างโดย Stability AIทีม DeepFloyd ของ DeepFloyd ซึ่งกรองเพื่อแยกเนื้อหาสำหรับผู้ใหญ่โดยใช้ตัวกรอง NSFW ของ LAION

การประเมินโดยใช้ขั้นตอนตัวอย่าง 50 DDIM, 50 มาตราส่วนชี้นำแบบไม่ใช้ตัวแยกประเภท และ 1.5, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0 และ 8.0 บ่งชี้ถึงการปรับปรุงสัมพัทธ์ของจุดตรวจสอบ:

สิ่งที่ทำให้ Stable Diffusion v1 แตกต่างจาก Stable Diffusion v2?

Stable Diffusion ขณะนี้ 2.0 ได้รวมเอาโมเดล Upscaler Diffusion ซึ่งเพิ่มความละเอียดของภาพขึ้นสี่เท่า ตัวอย่างโมเดลของเรา ลดอัตราการสุ่ม รูปภาพที่สร้างคุณภาพต่ำ (128×128) ลงในรูปภาพที่มีความละเอียดสูงกว่าแสดงอยู่ด้านล่าง (512×512) Stable Diffusion 2.0 เมื่อรวมกับโมเดลแปลงข้อความเป็นรูปภาพของเรา ตอนนี้สามารถสร้างรูปภาพที่มีความละเอียด 2048×2048 หรือสูงกว่าได้

คำแนะนำเชิงลึกใหม่ stable diffusion แบบ, deep2img ขยายคุณสมบัติภาพต่อภาพก่อนหน้าจาก V1 ด้วยความเป็นไปได้ในการสร้างสรรค์ใหม่ทั้งหมด Depth2img กำหนดความลึกของภาพอินพุต (โดยใช้โมเดลที่มีอยู่) แล้วสร้างใหม่ ภาพ ตามทั้งข้อความและข้อมูลเชิงลึก Depth-to-Image สามารถมอบแอปพลิเคชันสร้างสรรค์ใหม่ ๆ มากมาย เสนอการเปลี่ยนแปลงที่ดูแตกต่างจากต้นฉบับอย่างมากในขณะที่ยังคงความสอดคล้องกันและความลึกของภาพ

มีอะไรใหม่ใน Stable Diffusion 2?

  • ใหม่ stable diffusion แบบ ให้ความละเอียด 768×768
  • U-Net มีพารามิเตอร์จำนวนเท่ากันกับเวอร์ชัน 1.5 แต่ได้รับการฝึกฝนตั้งแต่เริ่มต้นและใช้ OpenCLIP-ViT/H เป็นตัวเข้ารหัสข้อความ ที่เรียกว่า v-prediction model คือ SD 2.0-v
  • โมเดลดังกล่าวได้รับการปรับจาก SD 2.0-base ซึ่งมีให้ใช้งานเช่นกัน และได้รับการฝึกฝนให้เป็นโมเดลทำนายสัญญาณรบกวนทั่วไปบนภาพขนาด 512×512
  • มีการเพิ่มโมเดลการแพร่กระจายแบบข้อความนำทางแฝงด้วยมาตราส่วน x4
  • คำแนะนำเชิงลึกฐาน SD 2.0 ที่ปรับปรุงแล้ว stable diffusion แบบ. แบบจำลองนี้สามารถใช้สำหรับการรักษาโครงสร้าง img2img และการสังเคราะห์ตามเงื่อนไขรูปร่าง และถูกกำหนดเงื่อนไขด้วยการประมาณความลึกตาข้างเดียวที่อนุมานโดย MiDaS
  • รูปแบบการลงสีแบบข้อความที่ได้รับการปรับปรุงซึ่งสร้างขึ้นบนพื้นฐาน SD 2.0

นักพัฒนาทำงานหนัก เช่นเดียวกับการเริ่มต้นซ้ำของ Stable Diffusionเพื่อเพิ่มประสิทธิภาพโมเดลให้ทำงานบน GPU ตัวเดียว—พวกเขาต้องการทำให้ผู้คนเข้าถึงได้มากที่สุดเท่าที่จะเป็นไปได้ตั้งแต่เริ่มแรก พวกเขาได้เห็นแล้วว่าเกิดอะไรขึ้นเมื่อผู้คนหลายล้านคนได้ครอบครองโมเดลเหล่านี้และร่วมมือกันสร้างสิ่งที่น่าทึ่งอย่างยิ่ง นี่คือพลังของโอเพ่นซอร์ส: การควบคุมศักยภาพอันมหาศาลของผู้มีความสามารถหลายล้านคนที่อาจไม่มีทรัพยากรในการฝึกอบรมโมเดลที่ล้ำสมัย แต่มีความสามารถในการทำสิ่งที่เหลือเชื่อด้วยโมเดลเดียว

มีอะไรใหม่ใน Stable Diffusion 2?

การอัปเดตใหม่นี้ เมื่อรวมกับคุณสมบัติใหม่ที่ทรงพลัง เช่น ความลึก 2img และความสามารถในการขยายความละเอียดที่ดีขึ้น จะทำหน้าที่เป็นรากฐานสำหรับแอปพลิเคชันใหม่มากมาย และเปิดใช้งานการระเบิดของศักยภาพความคิดสร้างสรรค์ใหม่ ๆ

อ่านเพิ่มเติมเกี่ยวกับ Stable Diffusion:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

บทความอื่น ๆ
ดาเมียร์ ยาลอฟ
ดาเมียร์ ยาลอฟ

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

Hot Stories
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

ความอยากอาหารของสถาบันเติบโตขึ้นสู่ Bitcoin ETFs ท่ามกลางความผันผวน

การเปิดเผยผ่านการยื่นเอกสาร 13F เผยให้เห็นนักลงทุนสถาบันที่มีชื่อเสียงกำลังเล่น Bitcoin ETFs ซึ่งตอกย้ำถึงการยอมรับที่เพิ่มขึ้นของ ...

รู้เพิ่มเติม

วันพิพากษามาถึง: ชะตากรรมของ CZ แขวนอยู่ในสมดุลขณะที่ศาลสหรัฐฯ พิจารณาคำร้องของ DOJ

ฉางเผิง จ้าว เตรียมเผชิญโทษจำคุกในศาลสหรัฐฯ ในเมืองซีแอตเทิลวันนี้

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
Injective ผนึกกำลัง AltLayer เพื่อนำการรักษาความปลอดภัยกลับมาสู่ inEVM
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
Injective ผนึกกำลัง AltLayer เพื่อนำการรักษาความปลอดภัยกลับมาสู่ inEVM
May 3, 2024
Masa ร่วมมือกับ Teller เพื่อแนะนำกลุ่มการให้ยืมของ MASA ซึ่งช่วยให้สามารถกู้ยืม USDC บนฐานได้
ตลาด รายงานข่าว เทคโนโลยี
Masa ร่วมมือกับ Teller เพื่อแนะนำกลุ่มการให้ยืมของ MASA ซึ่งช่วยให้สามารถกู้ยืม USDC บนฐานได้
May 3, 2024
Velodrome เปิดตัวเวอร์ชัน Superchain Beta ในอีกไม่กี่สัปดาห์ข้างหน้าและขยายข้ามบล็อคเชน OP Stack Layer 2
ตลาด รายงานข่าว เทคโนโลยี
Velodrome เปิดตัวเวอร์ชัน Superchain Beta ในอีกไม่กี่สัปดาห์ข้างหน้าและขยายข้ามบล็อคเชน OP Stack Layer 2
May 3, 2024
CARV ประกาศความร่วมมือกับ Aethir เพื่อกระจายอำนาจชั้นข้อมูลและแจกจ่ายรางวัล
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
CARV ประกาศความร่วมมือกับ Aethir เพื่อกระจายอำนาจชั้นข้อมูลและแจกจ่ายรางวัล
May 3, 2024
CRYPTOMERIA LABS PTE. บจก.