Text-to-SVG: Berkeley ได้ประกาศโมเดลการแพร่กระจายตามพิกเซลที่เป็นนามธรรม
ในบทสรุป
การสังเคราะห์ข้อความเป็นรูปภาพ – นักวิจัยของ UC Berkeley สาธิตกราฟิกแบบเวกเตอร์ด้วยเงื่อนไขข้อความ แบบจำลองการแพร่กระจาย
ในการสังเคราะห์ข้อความเป็นรูปภาพ แบบจำลองการแพร่กระจายมี แสดงให้เห็นถึง ผลลัพธ์ที่โดดเด่น แบบจำลองการแพร่กระจายเรียนรู้ที่จะสร้างภาพแรสเตอร์ของวัตถุและสถานการณ์ที่หลากหลายอย่างมากโดยใช้ฐานข้อมูลขนาดมหึมาของภาพที่มีคำอธิบายประกอบ อย่างไรก็ตาม สำหรับไอคอนดิจิทัล กราฟิก และสติกเกอร์ นักออกแบบมักจะใช้การแสดงภาพแบบเวกเตอร์ เช่น Scalable Vector Graphics (SVG) กราฟิกแบบเวกเตอร์มีขนาดเล็กและสามารถปรับขนาดได้ทุกขนาด
UC Berkeley สาธิตวิธีสร้างกราฟิกแบบเวกเตอร์ที่สามารถส่งออกเป็น SVG โดยใช้แบบจำลองการแพร่กระจายแบบมีเงื่อนไขข้อความซึ่งได้รับการฝึกฝนเกี่ยวกับการแสดงพิกเซลรูปภาพ ทำสิ่งนี้ให้สำเร็จโดยไม่ต้องใช้คอลเล็กชัน SVG จำนวนมากพร้อมคำอธิบายภาพ นักวิจัยของ Berkeley กลับใช้เวกเตอร์ a การแพร่กระจายข้อความเป็นรูปภาพ สุ่มตัวอย่างและปรับแต่งด้วยการสูญเสียการสุ่มตัวอย่าง Score Distillation ซึ่งได้รับแรงบันดาลใจจากงานล่าสุดเกี่ยวกับการสังเคราะห์ข้อความเป็น 3 มิติ
ตัวอย่างเวกเตอร์ที่สร้าง
ตรวจสอบแกลเลอรี SVG ที่สร้างขึ้นใหม่ โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.
กราฟิกแบบเวกเตอร์มีขนาดเล็กแต่ยังคงความคมชัดไว้เมื่อปรับขนาดเป็นขนาดใดก็ได้ นักวิจัยที่ Berkeley ปรับปรุงการสูญเสียข้อความของรูปภาพโดยอิงจาก Score Distillation Sampling เพื่อปรับกราฟิกเวกเตอร์ให้เหมาะสม ตัวเรนเดอร์ SVG ที่สร้างความแตกต่างของ DiffVG ซึ่งใช้โดย VectorFusion ทำให้สามารถแสดงภาพที่ผกผันได้
นอกจากนี้ VectorFusion ยังอนุญาตการกำหนดค่าแบบหลายขั้นตอนที่มีประสิทธิภาพและคุณภาพสูงกว่า วิธีนี้เริ่มต้นด้วยการเก็บตัวอย่างแรสเตอร์จาก แบบจำลองการแพร่กระจายข้อความเป็นรูปภาพ ที่เรียกว่า Stable Diffusion. จากนั้น VectorFusion จะติดตามตัวอย่างโดยอัตโนมัติโดยใช้ LIVE ตัวอย่างเหล่านี้มักขาดรายละเอียด น่าเบื่อ หรือปรับให้เข้ากับกราฟิกแบบเวกเตอร์ได้ยาก เพิ่มความมีชีวิตชีวาและความสอดคล้องของข้อความผ่านการสุ่มตัวอย่างการกลั่นคะแนน
VectorFusion สามารถสร้างภาพพิกเซลในรูปแบบของวิดีโอเกมเก่าโดยจำกัดเส้นทาง SVG ให้เป็นช่องสี่เหลี่ยมบนกริด
วิธีนี้สามารถขยายได้อย่างง่ายดายเพื่อรองรับการสร้างข้อความเป็นร่าง เพื่อเรียนรู้การวาดเส้นนามธรรมที่แสดงถึงข้อความที่ผู้ใช้ระบุอย่างถูกต้อง ก่อนอื่นเราจะวาดลายเส้นแบบสุ่ม 16 เส้น จากนั้น เราเพิ่มประสิทธิภาพการสูญเสียการสุ่มตัวอย่างคะแนนแฝงของเรา
อ่านบทความที่เกี่ยวข้อง:
ข้อจำกัดความรับผิดชอบ
สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า
เกี่ยวกับผู้เขียน
Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต
บทความอื่น ๆDamir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต