รายงานข่าว
September 30, 2022

Text-to-3D: Google ได้พัฒนาโครงข่ายประสาทเทียมที่สร้างแบบจำลอง 3 มิติจากคำอธิบายข้อความ

ในบทสรุป

ข้อความเป็น 3 มิติ โครงข่ายประสาทเทียมสามารถสร้างโมเดล 3 มิติจากข้อความได้

DreamFusion ปรับฉาก 3 มิติให้เหมาะสมตาม Imagen text-to-image

สามารถใช้แบบจำลองการแพร่กระจาย 2 มิติสำหรับการสังเคราะห์ข้อความเป็นภาพ

Google สร้าง เครือข่ายประสาท สามารถสร้างโมเดล 3 มิติจากคำอธิบายข้อความ ส่วนที่ดีที่สุดคือส่วนที่ยากที่สุดไม่จำเป็นต้องสอนด้วยซ้ำ Imagen ใช้เป็นรากฐานสำหรับ Text-to-3D

Text-to-3D: Google ได้พัฒนาโครงข่ายประสาทเทียมที่สร้างแบบจำลอง 3 มิติจากคำอธิบายข้อความ

สิ่งที่คุณควรรู้เกี่ยวกับ ดรีมฟิวชั่น?

แบบจำลองการแพร่กระจายที่ได้รับการฝึกฝนในคู่ข้อความภาพหลายพันล้านคู่ได้นำไปสู่ความก้าวหน้าล่าสุดในการสังเคราะห์ข้อความเป็นรูปภาพ การปรับแนวทางนี้ให้เข้ากับการสังเคราะห์ 3 มิติจะทำให้จำเป็นต้องมีชุดข้อมูลขนาดใหญ่ของสินทรัพย์ 3 มิติที่ติดฉลาก รวมถึงสถาปัตยกรรมข้อมูล 3 มิติแบบ denoising ที่มีประสิทธิภาพ ซึ่งทั้งสองอย่างนี้ยังไม่มีให้ใช้งาน ในบทความนี้ เราก้าวข้ามข้อจำกัดเหล่านี้โดยทำการสังเคราะห์ข้อความเป็น 3 มิติด้วย 2 มิติที่ได้รับการฝึกฝนไว้ล่วงหน้า การแพร่กระจายข้อความเป็นรูปภาพ แบบอย่าง. เรานำเสนอการสูญเสียตามการกลั่นความหนาแน่นของความน่าจะเป็นที่อนุญาตให้ใช้แบบจำลองการแพร่กระจายแบบ 2 มิติเป็นแบบจำลองก่อนหน้าสำหรับการปรับพาราเมตริกให้เหมาะสม เครื่องกำเนิดภาพ. เมื่อใช้การสูญเสียนี้ เราใช้การไล่ระดับสีเพื่อปรับโมเดล 3 มิติที่เริ่มต้นแบบสุ่มให้เหมาะสม (สนาม Neural Radiance หรือ NeRF) เพื่อให้การเรนเดอร์ 2 มิติจากมุมสุ่มมีการสูญเสียน้อยที่สุด

โมเดล 3 มิติที่สร้างขึ้นของข้อความที่ระบุสามารถดูได้จากทุกมุม ส่องสว่างด้วยแสงที่ปรับเปลี่ยนได้ และประกอบเข้ากับสภาพแวดล้อม 3 มิติใดก็ได้ วิธีการของมันไม่ต้องการข้อมูลการฝึกอบรม 3D และไม่มีการเปลี่ยนแปลงใดๆ แบบจำลองการแพร่กระจายภาพแสดงให้เห็นถึงประสิทธิภาพของการใช้แบบจำลองการแพร่กระจายภาพที่ฝึกไว้ล่วงหน้าเหมือนก่อนหน้านี้

DreamFusion สร้างโมเดล 3 มิติที่น่าเชื่อถือพร้อมรูปลักษณ์ ความลึก และบรรทัดฐานที่มีความเที่ยงตรงสูงตามคำอธิบายภาพ วัตถุจะถูกแสดงเป็น Neural Radiance Field โดยมีการฝึกฝนล่วงหน้า การแพร่กระจายข้อความเป็นรูปภาพ ก่อนหน้าเช่น Imagen ที่ใช้

ตัวอย่างของ 3D ที่สร้างจากข้อความ

Prompt: รูปภาพของกระรอกสวมชุดเกราะยุคกลางที่เล่นแซกโซโฟน
Prompt: รูปภาพของกระรอกสวมชุด ballgown หรูหรานั่งอยู่บนวงล้อเครื่องปั้นดินเผาที่กำลังปั้นชามดินเผา
Prompt: ประติมากรรมโลหะที่มีรายละเอียดสูงเป็นรูปกระรอกสวมเสื้อฮู้ดสีม่วงขี่มอเตอร์ไซค์
Prompt: การแกะสลักไม้อันประณีตของกระรอกที่สวมชุดเกราะยุคกลางที่ถือดาบคาตานะ

การนำสิ่งของมาประกอบกันเพื่อสร้างฉาก

มันทำงานอย่างไร?

DreamFusion ปรับฉาก 3 มิติให้เหมาะสมตามคำบรรยายโดยใช้โมเดลการสร้างข้อความเป็นรูปภาพของ Imagen แนะนำการสุ่มตัวอย่างการกลั่นด้วยคะแนน (SDS) ซึ่งเกี่ยวข้องกับการปรับฟังก์ชันการสูญเสียให้เหมาะสมเพื่อผลิตตัวอย่างจากแบบจำลองการแพร่กระจาย ตราบเท่าที่เราสามารถแมปกลับไปที่ภาพต่างๆ ได้ SDS ช่วยให้เราสามารถปรับแต่งตัวอย่างในพื้นที่พารามิเตอร์ใดก็ได้ เช่น พื้นที่ 3 มิติ ถึง defiในการแมปที่สร้างความแตกต่างได้นี้ จะใช้การกำหนดพารามิเตอร์ฉาก 3 มิติที่คล้ายกับ Neural Radiance Fields หรือ NeRF SDS เพียงอย่างเดียวสร้างรูปลักษณ์ของฉากที่พอใช้ได้ แต่ DreamFusion ปรับปรุงรูปทรงเรขาคณิตด้วย Regularizers และเทคนิคการเพิ่มประสิทธิภาพพิเศษ NeRF ที่ผ่านการฝึกอบรมซึ่งผลิตขึ้นมีความสอดคล้องกัน มีบรรทัดฐาน รูปทรงเรขาคณิตของพื้นผิว และความลึกที่ยอดเยี่ยม และสามารถปรับแต่งใหม่ได้โดยใช้แบบจำลองการแรเงาของ Lambertian

อ่านบทความที่เกี่ยวข้อง:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

บทความอื่น ๆ
ดาเมียร์ ยาลอฟ
ดาเมียร์ ยาลอฟ

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

Hot Stories
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

ความอยากอาหารของสถาบันเติบโตขึ้นสู่ Bitcoin ETFs ท่ามกลางความผันผวน

การเปิดเผยผ่านการยื่นเอกสาร 13F เผยให้เห็นนักลงทุนสถาบันที่มีชื่อเสียงกำลังเล่น Bitcoin ETFs ซึ่งตอกย้ำถึงการยอมรับที่เพิ่มขึ้นของ ...

รู้เพิ่มเติม

วันพิพากษามาถึง: ชะตากรรมของ CZ แขวนอยู่ในสมดุลขณะที่ศาลสหรัฐฯ พิจารณาคำร้องของ DOJ

ฉางเผิง จ้าว เตรียมเผชิญโทษจำคุกในศาลสหรัฐฯ ในเมืองซีแอตเทิลวันนี้

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
Injective ผนึกกำลัง AltLayer เพื่อนำการรักษาความปลอดภัยกลับมาสู่ inEVM
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
Injective ผนึกกำลัง AltLayer เพื่อนำการรักษาความปลอดภัยกลับมาสู่ inEVM
May 3, 2024
Masa ร่วมมือกับ Teller เพื่อแนะนำกลุ่มการให้ยืมของ MASA ซึ่งช่วยให้สามารถกู้ยืม USDC บนฐานได้
ตลาด รายงานข่าว เทคโนโลยี
Masa ร่วมมือกับ Teller เพื่อแนะนำกลุ่มการให้ยืมของ MASA ซึ่งช่วยให้สามารถกู้ยืม USDC บนฐานได้
May 3, 2024
Velodrome เปิดตัวเวอร์ชัน Superchain Beta ในอีกไม่กี่สัปดาห์ข้างหน้าและขยายข้ามบล็อคเชน OP Stack Layer 2
ตลาด รายงานข่าว เทคโนโลยี
Velodrome เปิดตัวเวอร์ชัน Superchain Beta ในอีกไม่กี่สัปดาห์ข้างหน้าและขยายข้ามบล็อคเชน OP Stack Layer 2
May 3, 2024
CARV ประกาศความร่วมมือกับ Aethir เพื่อกระจายอำนาจชั้นข้อมูลและแจกจ่ายรางวัล
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
CARV ประกาศความร่วมมือกับ Aethir เพื่อกระจายอำนาจชั้นข้อมูลและแจกจ่ายรางวัล
May 3, 2024
CRYPTOMERIA LABS PTE. บจก.