รายงานข่าว เทคโนโลยี
November 23, 2022

Text-to-SVG: Berkeley ได้ประกาศโมเดลการแพร่กระจายตามพิกเซลที่เป็นนามธรรม

ในบทสรุป

การสังเคราะห์ข้อความเป็นรูปภาพ – นักวิจัยของ UC Berkeley สาธิตกราฟิกแบบเวกเตอร์ด้วยเงื่อนไขข้อความ แบบจำลองการแพร่กระจาย

ในการสังเคราะห์ข้อความเป็นรูปภาพ แบบจำลองการแพร่กระจายมี แสดงให้เห็นถึง ผลลัพธ์ที่โดดเด่น แบบจำลองการแพร่กระจายเรียนรู้ที่จะสร้างภาพแรสเตอร์ของวัตถุและสถานการณ์ที่หลากหลายอย่างมากโดยใช้ฐานข้อมูลขนาดมหึมาของภาพที่มีคำอธิบายประกอบ อย่างไรก็ตาม สำหรับไอคอนดิจิทัล กราฟิก และสติกเกอร์ นักออกแบบมักจะใช้การแสดงภาพแบบเวกเตอร์ เช่น Scalable Vector Graphics (SVG) กราฟิกแบบเวกเตอร์มีขนาดเล็กและสามารถปรับขนาดได้ทุกขนาด

Text-to-SVG: Berkeley ได้ประกาศโมเดลการแพร่กระจายตามพิกเซลที่เป็นนามธรรม

UC Berkeley สาธิตวิธีสร้างกราฟิกแบบเวกเตอร์ที่สามารถส่งออกเป็น SVG โดยใช้แบบจำลองการแพร่กระจายแบบมีเงื่อนไขข้อความซึ่งได้รับการฝึกฝนเกี่ยวกับการแสดงพิกเซลรูปภาพ ทำสิ่งนี้ให้สำเร็จโดยไม่ต้องใช้คอลเล็กชัน SVG จำนวนมากพร้อมคำอธิบายภาพ นักวิจัยของ Berkeley กลับใช้เวกเตอร์ a การแพร่กระจายข้อความเป็นรูปภาพ สุ่มตัวอย่างและปรับแต่งด้วยการสูญเสียการสุ่มตัวอย่าง Score Distillation ซึ่งได้รับแรงบันดาลใจจากงานล่าสุดเกี่ยวกับการสังเคราะห์ข้อความเป็น 3 มิติ

ตัวอย่างเวกเตอร์ที่สร้าง

ตรวจสอบแกลเลอรี SVG ที่สร้างขึ้นใหม่ โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.

กราฟิกแบบเวกเตอร์มีขนาดเล็กแต่ยังคงความคมชัดไว้เมื่อปรับขนาดเป็นขนาดใดก็ได้ นักวิจัยที่ Berkeley ปรับปรุงการสูญเสียข้อความของรูปภาพโดยอิงจาก Score Distillation Sampling เพื่อปรับกราฟิกเวกเตอร์ให้เหมาะสม ตัวเรนเดอร์ SVG ที่สร้างความแตกต่างของ DiffVG ซึ่งใช้โดย VectorFusion ทำให้สามารถแสดงภาพที่ผกผันได้

นอกจากนี้ VectorFusion ยังอนุญาตการกำหนดค่าแบบหลายขั้นตอนที่มีประสิทธิภาพและคุณภาพสูงกว่า วิธีนี้เริ่มต้นด้วยการเก็บตัวอย่างแรสเตอร์จาก แบบจำลองการแพร่กระจายข้อความเป็นรูปภาพ ที่เรียกว่า Stable Diffusion. จากนั้น VectorFusion จะติดตามตัวอย่างโดยอัตโนมัติโดยใช้ LIVE ตัวอย่างเหล่านี้มักขาดรายละเอียด น่าเบื่อ หรือปรับให้เข้ากับกราฟิกแบบเวกเตอร์ได้ยาก เพิ่มความมีชีวิตชีวาและความสอดคล้องของข้อความผ่านการสุ่มตัวอย่างการกลั่นคะแนน

VectorFusion สามารถสร้างภาพพิกเซลในรูปแบบของวิดีโอเกมเก่าโดยจำกัดเส้นทาง SVG ให้เป็นช่องสี่เหลี่ยมบนกริด

วิธีนี้สามารถขยายได้อย่างง่ายดายเพื่อรองรับการสร้างข้อความเป็นร่าง เพื่อเรียนรู้การวาดเส้นนามธรรมที่แสดงถึงข้อความที่ผู้ใช้ระบุอย่างถูกต้อง ก่อนอื่นเราจะวาดลายเส้นแบบสุ่ม 16 เส้น จากนั้น เราเพิ่มประสิทธิภาพการสูญเสียการสุ่มตัวอย่างคะแนนแฝงของเรา

อ่านบทความที่เกี่ยวข้อง:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

บทความอื่น ๆ
ดาเมียร์ ยาลอฟ
ดาเมียร์ ยาลอฟ

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

Hot Stories
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

วันพิพากษามาถึง: ชะตากรรมของ CZ แขวนอยู่ในสมดุลขณะที่ศาลสหรัฐฯ พิจารณาคำร้องของ DOJ

ฉางเผิง จ้าว เตรียมเผชิญโทษจำคุกในศาลสหรัฐฯ ในเมืองซีแอตเทิลวันนี้

รู้เพิ่มเติม

ผู้ก่อตั้ง Samourai Wallet ถูกกล่าวหาว่าอำนวยความสะดวกมูลค่า 2 พันล้านดอลลาร์ในข้อเสนอ Darknet

การจับกุมผู้ก่อตั้ง Samourai Wallet แสดงให้เห็นถึงความพ่ายแพ้ที่โดดเด่นของอุตสาหกรรม โดยเน้นย้ำถึงความต่อเนื่อง ...

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
Pantera Capital ลงทุนใน TON Blockchain แสดงความมั่นใจในศักยภาพของ Telegram ในการขยายการเข้าถึง Crypto
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
Pantera Capital ลงทุนใน TON Blockchain แสดงความมั่นใจในศักยภาพของ Telegram ในการขยายการเข้าถึง Crypto
May 2, 2024
Mitosis ระดมทุน 7 ล้านดอลลาร์จาก Amber Group และ Foresight Ventures เพื่อพัฒนาโปรโตคอลสภาพคล่องแบบโมดูลาร์
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
Mitosis ระดมทุน 7 ล้านดอลลาร์จาก Amber Group และ Foresight Ventures เพื่อพัฒนาโปรโตคอลสภาพคล่องแบบโมดูลาร์
May 2, 2024
Galxe ร่วมมือกับ Jambo เพื่อขยายการเข้าถึงทั่วโลกไปยัง Web3
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
Galxe ร่วมมือกับ Jambo เพื่อขยายการเข้าถึงทั่วโลกไปยัง Web3
May 2, 2024
Med-Gemini ของ Google พร้อมที่จะเป็นผู้นำ GPT-4 ด้วยประสิทธิภาพที่เหนือกว่าในด้านการดูแลสุขภาพ
AI Wiki ข่าว ซอฟต์แวร์ เทคโนโลยี
Med-Gemini ของ Google พร้อมที่จะเป็นผู้นำ GPT-4 ด้วยประสิทธิภาพที่เหนือกว่าในด้านการดูแลสุขภาพ
May 2, 2024
CRYPTOMERIA LABS PTE. บจก.