รายงานข่าว เทคโนโลยี
มิถุนายน 19, 2023

SnapFusion: โมเดลแปลงข้อความเป็นรูปภาพที่รวดเร็วสำหรับอุปกรณ์พกพาภายใน 1.9 วินาที

ในบทสรุป

SnapFusion เปลี่ยนการสร้างเนื้อหาด้วยการเรียกใช้ โมเดลการแพร่กระจายข้อความเป็นรูปภาพ โดยตรงบนอุปกรณ์พกพา ลดต้นทุนและจัดการกับข้อกังวลด้านความเป็นส่วนตัว

สแนปฟิวชั่น เป็นโมเดล AI แปลงข้อความเป็นรูปภาพที่ช่วยให้ผู้ใช้สร้างภาพที่น่าทึ่งจากคำอธิบายภาษาธรรมชาติได้ภายในเวลาเพียงสองวินาทีบนอุปกรณ์พกพา หมดยุคของการพึ่งพา GPU ระดับไฮเอนด์หรือบริการบนคลาวด์เพื่อเรียกใช้โมเดลที่ซับซ้อนเหล่านี้ SnapFusion ทำให้การสร้างเนื้อหาเป็นประชาธิปไตยโดยให้พลังของการแพร่กระจายข้อความเป็นรูปภาพอยู่ในมือของผู้ใช้

SnapFusion: โมเดลแปลงข้อความเป็นรูปภาพที่รวดเร็วและมีประสิทธิภาพสำหรับอุปกรณ์พกพาภายใน 1.9 วินาที
เครดิต: Midjourney /lili10292#2100

การสร้างภาพที่เหมือนจริงจากคำอธิบายข้อความเป็นงานที่ท้าทายมาโดยตลอด รุ่นก่อนหน้านี้ ต้องการสถาปัตยกรรมเครือข่ายขนาดใหญ่ และการทำซ้ำ denoising หลายครั้ง ทำให้พวกเขา การคำนวณมีราคาแพงและช้า. นอกจากนี้ การเรียกใช้โมเดลเหล่านี้มักเกี่ยวข้องกับการส่งข้อมูลผู้ใช้ไปยังบริการของบุคคลที่สาม การเพิ่มจำนวน ความกังวลเรื่องความเป็นส่วนตัว.

เพื่อรับมือกับความท้าทายเหล่านี้ ผู้สร้าง SnapFusion ได้พัฒนาสถาปัตยกรรมเครือข่ายที่มีประสิทธิภาพและปรับปรุงกระบวนการกลั่นทีละขั้นตอน ด้วยการระบุความซ้ำซ้อนในโมเดลเดิม พวกเขาแนะนำ UNet ที่มีประสิทธิภาพและลดการคำนวณของตัวถอดรหัสภาพผ่าน การกลั่นข้อมูล. นอกจากนี้ พวกเขายังปรับปรุงการกลั่นทีละขั้นตอนด้วยการสำรวจกลยุทธ์การฝึกอบรมและแนะนำเทคนิคการทำให้เป็นมาตรฐาน

arxiv.org/pdf/2306.00980.pdf

การทดลองอย่างกว้างขวางเกี่ยวกับ ชุดข้อมูล MS-COCO แสดงให้เห็นถึงความเหนือชั้นของ SnapFusion ด้วยขั้นตอนการแยกสัญญาณเพียง XNUMX ขั้นตอน SnapFusion ได้คะแนน FID และ CLIP ที่ดีขึ้นเมื่อเทียบกับรุ่นก่อนหน้า โมเดลล้ำสมัย, Stable Diffusion v1.5 ซึ่งต้องใช้ 50 ขั้นตอน การปรับปรุงประสิทธิภาพและประสิทธิภาพที่โดดเด่นนี้เปิดโอกาสใหม่สำหรับการสร้างเนื้อหา

ผลกระทบของ SnapFusion มีมากกว่าความสำเร็จทางเทคนิค ด้วยการวิ่ง โมเดลการแพร่กระจายข้อความเป็นรูปภาพ โดยตรงบนอุปกรณ์พกพา ทำให้ไม่ต้องใช้ GPU ราคาแพงและบริการบนคลาวด์ สิ่งนี้ไม่เพียงลดค่าใช้จ่าย แต่ยังแก้ปัญหาความเป็นส่วนตัวที่เกี่ยวข้องกับการส่งข้อมูลผู้ใช้ไปยังบุคคลที่สาม ผู้ใช้สามารถปลดปล่อยความคิดสร้างสรรค์และสร้างภาพคุณภาพสูงได้ทุกที่

ขนาดพารามิเตอร์ของโมเดลสามารถลดลงได้อีกเพื่อให้เข้ากันได้กับอุปกรณ์ Edge ต่างๆ นอกจากนี้ การปรับโมเดลให้เหมาะสมสำหรับอุปกรณ์พกพาต่างๆ บรรลุข้อสรุปอย่างรวดเร็ว ความเร็วเป็นหัวข้อการวิจัยที่กำลังดำเนินอยู่

จำเป็นอย่างยิ่งที่จะต้องใช้ SnapFusion และเทคโนโลยีที่คล้ายกันอย่างมีความรับผิดชอบเพื่อป้องกันแอปพลิเคชันที่เป็นอันตราย สามารถใช้มาตรการต่างๆ เช่น ระบบตรวจจับอัตโนมัติที่ระบุและตั้งค่าสถานะเนื้อหารูปภาพที่ละเมิดข้อบังคับ SnapFusion สามารถเปลี่ยนแปลงการสร้างเนื้อหาได้โดยสร้างความสมดุลระหว่างนวัตกรรมและการพิจารณาด้านจริยธรรม ในขณะเดียวกันก็รับประกันประสบการณ์ของผู้ใช้ที่ปลอดภัยและมีความรับผิดชอบ

อ่านเพิ่มเติมเกี่ยวกับ AI:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

บทความอื่น ๆ
ดาเมียร์ ยาลอฟ
ดาเมียร์ ยาลอฟ

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

Hot Stories
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

ความอยากอาหารของสถาบันเติบโตขึ้นสู่ Bitcoin ETFs ท่ามกลางความผันผวน

การเปิดเผยผ่านการยื่นเอกสาร 13F เผยให้เห็นนักลงทุนสถาบันที่มีชื่อเสียงกำลังเล่น Bitcoin ETFs ซึ่งตอกย้ำถึงการยอมรับที่เพิ่มขึ้นของ ...

รู้เพิ่มเติม

วันพิพากษามาถึง: ชะตากรรมของ CZ แขวนอยู่ในสมดุลขณะที่ศาลสหรัฐฯ พิจารณาคำร้องของ DOJ

ฉางเผิง จ้าว เตรียมเผชิญโทษจำคุกในศาลสหรัฐฯ ในเมืองซีแอตเทิลวันนี้

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
Stacks, Moonriver Network, Hedera และ Iron Fish จะเข้าร่วมในโครงการ Interchain Amplifier ของ Axelar
รายงานข่าว เทคโนโลยี
Stacks, Moonriver Network, Hedera และ Iron Fish จะเข้าร่วมในโครงการ Interchain Amplifier ของ Axelar
May 7, 2024
Tesla โอบกอด Dogecoin: การเพิ่มขึ้นครั้งสำคัญสำหรับ Meme Coin เนื่องจากกลายเป็นตัวเลือกการชำระเงินในร้านค้าออนไลน์ของ Tesla
ตลาด เรื่องราวและบทวิจารณ์ เทคโนโลยี
Tesla โอบกอด Dogecoin: การเพิ่มขึ้นครั้งสำคัญสำหรับ Meme Coin เนื่องจากกลายเป็นตัวเลือกการชำระเงินในร้านค้าออนไลน์ของ Tesla
May 7, 2024
Morph เปิดตัว Holesky Testnet พร้อมการบูรณาการ zkEVM ในแง่ดี กลไกบริดจ์ และคุณสมบัติเครือข่ายซีเควนเซอร์แบบกระจายอำนาจ
รายงานข่าว เทคโนโลยี
Morph เปิดตัว Holesky Testnet พร้อมการบูรณาการ zkEVM ในแง่ดี กลไกบริดจ์ และคุณสมบัติเครือข่ายซีเควนเซอร์แบบกระจายอำนาจ
May 6, 2024
Robinhood Crypto ได้รับการแจ้งเตือนจาก Wells จากสำนักงานคณะกรรมการกำกับหลักทรัพย์และตลาดหลักทรัพย์เกี่ยวกับการละเมิดหลักทรัพย์ที่ถูกกล่าวหา
ตลาด รายงานข่าว เทคโนโลยี
Robinhood Crypto ได้รับการแจ้งเตือนจาก Wells จากสำนักงานคณะกรรมการกำกับหลักทรัพย์และตลาดหลักทรัพย์เกี่ยวกับการละเมิดหลักทรัพย์ที่ถูกกล่าวหา
May 6, 2024
CRYPTOMERIA LABS PTE. บจก.