รายงานข่าว เทคโนโลยี
January 24, 2023

StyleGAN-T: การสร้างข้อความเป็นรูปภาพที่เร็วที่สุดซึ่งให้ผลลัพธ์ในเวลาน้อยกว่า 0.1 วินาที

ในบทสรุป

StyleGAN-T เป็น GAN ใหม่สำหรับการสร้าง tex2image

GAN นี้ให้ผลลัพธ์ที่ดีและค่อนข้างรวดเร็ว (0.1 วินาทีสำหรับภาพขนาด 512×512)

สถาปัตยกรรมใหม่อิงตาม StyleGAN-XL แต่จะประเมินการออกแบบตัวกำเนิดและตัวจำแนกอีกครั้ง

คุณสังเกตเห็นอย่างแน่นอนว่า GAN ไม่ถูกพูดถึงอีกต่อไปเมื่อหัวข้อการสร้างภาพปรากฏขึ้น หลังแพร่แบบอย่าง Stable Diffusion โผล่ออกมา GANs ถอยกลับเข้าไปในพื้นหลังอย่างใด นี่เป็นเพราะพวกมันมีความท้าทายในการฝึกและมักสะดุด ข้อดีข้อเดียวของ GAN คือสร้างภาพในการรันครั้งเดียว ("ส่งต่อ") แทนที่จะสร้างหลายๆ รัน ซึ่งแตกต่างจากโมเดลการแพร่กระจาย

StyleGAN-T: การสร้างข้อความเป็นภาพที่เร็วที่สุดในเวลาน้อยกว่า 0.1 วินาที

แต่ตอนนี้ผู้เล่นใหม่จาก GAN ได้เข้าสู่สนามแล้ว: สไตล์GAN-T. GAN สำหรับการสร้าง tex-to-image นี้ให้ผลลัพธ์ที่ดีอย่างรวดเร็ว เนื่องจากใช้เวลาเพียง 0.1 วินาทีสำหรับภาพขนาด 512×512 สถาปัตยกรรมใหม่อิงตาม StyleGAN-XL แต่จะประเมินการออกแบบตัวสร้างและตัวจำแนกอีกครั้ง และใช้ CLIP สำหรับการจัดข้อความพร้อมท์และกราฟิกที่สร้างขึ้น

บทความที่เกี่ยวข้อง: VToonify: โมเดล AI แบบเรียลไทม์สำหรับสร้างวิดีโอแนวศิลปะ

โดยทั่วไปแล้ว StyleGAN-T จะสร้างข้อความเป็นรูปภาพได้รวดเร็วและแม่นยำกว่า GAN อื่นๆ อย่างไรก็ตาม GAN ยังคงแย่มากและคุณภาพของรุ่น SD ขนาดเต็มก็ไม่เป็นปัญหาอย่างเห็นได้ชัด แต่ทั้งหมดนั้นจะขึ้นอยู่กับความสามารถในการสร้างภาพคุณภาพสูงมากจากข้อความภายในเวลาไม่ถึงหนึ่งวินาทีในหนึ่งปี นอกจากนี้ มันจะตกอยู่ที่ไหนสักแห่งระหว่าง GAN และ แบบจำลองการแพร่กระจาย.

สถาปัตยกรรม StyleGAN-T
สถาปัตยกรรม StyleGAN-T

อ่านเพิ่มเติมเกี่ยวกับ AI:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

บทความอื่น ๆ
ดาเมียร์ ยาลอฟ
ดาเมียร์ ยาลอฟ

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

Hot Stories
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

วันพิพากษามาถึง: ชะตากรรมของ CZ แขวนอยู่ในสมดุลขณะที่ศาลสหรัฐฯ พิจารณาคำร้องของ DOJ

ฉางเผิง จ้าว เตรียมเผชิญโทษจำคุกในศาลสหรัฐฯ ในเมืองซีแอตเทิลวันนี้

รู้เพิ่มเติม

ผู้ก่อตั้ง Samourai Wallet ถูกกล่าวหาว่าอำนวยความสะดวกมูลค่า 2 พันล้านดอลลาร์ในข้อเสนอ Darknet

การจับกุมผู้ก่อตั้ง Samourai Wallet แสดงให้เห็นถึงความพ่ายแพ้ที่โดดเด่นของอุตสาหกรรม โดยเน้นย้ำถึงความต่อเนื่อง ...

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
Pantera Capital ลงทุนใน TON Blockchain แสดงความมั่นใจในศักยภาพของ Telegram ในการขยายการเข้าถึง Crypto
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
Pantera Capital ลงทุนใน TON Blockchain แสดงความมั่นใจในศักยภาพของ Telegram ในการขยายการเข้าถึง Crypto
May 2, 2024
Mitosis ระดมทุน 7 ล้านดอลลาร์จาก Amber Group และ Foresight Ventures เพื่อพัฒนาโปรโตคอลสภาพคล่องแบบโมดูลาร์
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
Mitosis ระดมทุน 7 ล้านดอลลาร์จาก Amber Group และ Foresight Ventures เพื่อพัฒนาโปรโตคอลสภาพคล่องแบบโมดูลาร์
May 2, 2024
Galxe ร่วมมือกับ Jambo เพื่อขยายการเข้าถึงทั่วโลกไปยัง Web3
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
Galxe ร่วมมือกับ Jambo เพื่อขยายการเข้าถึงทั่วโลกไปยัง Web3
May 2, 2024
Med-Gemini ของ Google พร้อมที่จะเป็นผู้นำ GPT-4 ด้วยประสิทธิภาพที่เหนือกว่าในด้านการดูแลสุขภาพ
AI Wiki ข่าว ซอฟต์แวร์ เทคโนโลยี
Med-Gemini ของ Google พร้อมที่จะเป็นผู้นำ GPT-4 ด้วยประสิทธิภาพที่เหนือกว่าในด้านการดูแลสุขภาพ
May 2, 2024
CRYPTOMERIA LABS PTE. บจก.