รายงานข่าว
November 06, 2022

ERNIE-ViLG 2.0: โมเดลข้อความเป็นรูปภาพใหม่จาก Baidu มีประสิทธิภาพเหนือกว่า Dalle-2 และ Stable Diffusion

ในบทสรุป

ทั้งดัลล์-2และ Stable Diffusion มีประสิทธิภาพดีกว่า ERNIE-ViLG 2.0 อย่างมีนัยสำคัญ

เออร์นี่-ViLG 2.0 เป็นโมเดลแปลงข้อความเป็นรูปภาพที่มีประสิทธิภาพดีกว่า Dalle-2 และ Stable Diffusionซึ่งเป็นรูปแบบข้อความเป็นรูปภาพที่ได้รับความนิยมมากที่สุดสองรูปแบบในปัจจุบัน โมเดลใหม่ได้รับการออกแบบและฝึกฝนโดยทีมนักวิจัยจาก Baidu และผลลัพธ์ที่ได้ก็น่าทึ่ง

โมเดลการแปลงข้อความเป็นรูปภาพใหม่ ERNIE-ViLG 2.0 มีประสิทธิภาพเหนือกว่า Dalle-2 และ Stable Diffusion
รูปภาพที่สร้างโดย ERNIE-ViLG 2.0

ผลลัพธ์แสดงให้เห็นว่า ERNIE-ViLG 2.0 มีประสิทธิภาพเหนือกว่า Dalle-2 และ Stable Diffusion. นี่เป็นความสำเร็จครั้งสำคัญและแสดงให้เห็นถึงพลังของกรอบการทำงานของ ENNIE ที่ Metaverse Post ทีมงานเปรียบเทียบ ERNIE-ViLG 2.0 กับ Stable Diffusion ด้านล่าง:

เออร์นี่-ViLG 2.0
Stable Diffusion
เออร์นี่-ViLG 2.0
Stable Diffusion
เออร์นี่-ViLG 2.0
Stable Diffusion
เออร์นี่-ViLG 2.0
Stable Diffusion
เออร์นี่-ViLG 2.0

ผลลัพธ์เหล่านี้ให้การสนับสนุนอย่างมากสำหรับสมมติฐานที่ว่า ERNIE-ViLG 2.0 มีประสิทธิภาพมากกว่า ระบบแปลงข้อความเป็นรูปภาพมากกว่าทั้ง Dalle-2 และ Stable Diffusion.

สถาปัตยกรรม Unet จาก Stable Diffusion ถือเป็นพื้นฐาน แต่มีการเปลี่ยนแปลง:

  • ส่วนผสมของผู้เชี่ยวชาญด้านการขจัดนอยส์: มีโครงข่ายประสาทเทียม 10 แห่งแทนที่จะเป็นเพียงแห่งเดียว โดยแต่ละแห่งมีหน้าที่รับผิดชอบเฉพาะขั้นตอนการแพร่ที่แน่นอนเท่านั้น
  • ความรู้ทางข้อความ: ปรับน้ำหนักคำในข้อความค้นหาใหม่โดยอัตโนมัติเพื่อให้คำหลักมีน้ำหนักมากขึ้น
  • ความรู้ด้านภาพ: ระหว่างการฝึก วัตถุถูกตรวจพบในผลลัพธ์การสร้างระดับกลาง และน้ำหนักของฟังก์ชันการสูญเสียในบริเวณที่มีวัตถุเพิ่มขึ้น

เป็นผลให้ใหญ่ที่สุดในโลก โมเดลข้อความเป็นรูปภาพ ออกมาพร้อมกับพารามิเตอร์ 24 พันล้านตัว (มากกว่า SD ถึง 10 เท่า) เพื่อฝึกโมเดล

เมื่อเปรียบเทียบกับรุ่นก่อนหน้านี้ ERNIE-ViLG 2.0 เหนือกว่าอย่างมากในแง่ของคุณภาพของภาพและการจับคู่ภาพเป็นข้อความ เมื่อทดสอบพร้อมกันกับ ViLG-300 สองภาษา รวดเร็ว กำหนดโดยบุคคล

ข้อความแจ้งจะถูกแปลจากภาษาจีนเป็นภาษาอังกฤษโดยอัตโนมัติใน กอดใบหน้า การสาธิตสาธารณะก่อนที่จะส่งไปยัง AI คุณสมบัติมากมายมาจากสิ่งนี้

  • ERNIE ไม่รู้จักบุคคลสาธารณะระหว่างประเทศ ตัวอย่างเช่น ERNIE ไม่รู้จัก Arnold Schwarzenegger แน่นอนว่ามีรายการโปรดของท้องถิ่นในประเทศจีน
  • ด้วยเหตุนี้วิธีการใช้ชื่อคนดังจึงช่วยเพิ่มคุณภาพได้อย่างมาก ใบหน้า ล้มเหลว
  • คุณสามารถคาดหวังได้ว่าผิดเพี้ยนไปบ้างเนื่องจากการแปลจากภาษาจีน ดังนั้นอาจมีเซอร์ไพรส์รอคุณอยู่หากคุณไม่พูดภาษาจีน
  • มันไม่รู้อะไรเลยเกี่ยวกับ Greg Rutkowski

อ่านบทความที่เกี่ยวข้อง:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

บทความอื่น ๆ
ดาเมียร์ ยาลอฟ
ดาเมียร์ ยาลอฟ

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

Hot Stories

BRICS Nations Eye โซลูชันการค้า Stablecoin

by วิคทอเรีย ปาลชิค
May 01, 2024
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

วันพิพากษามาถึง: ชะตากรรมของ CZ แขวนอยู่ในสมดุลขณะที่ศาลสหรัฐฯ พิจารณาคำร้องของ DOJ

ฉางเผิง จ้าว เตรียมเผชิญโทษจำคุกในศาลสหรัฐฯ ในเมืองซีแอตเทิลวันนี้

รู้เพิ่มเติม

ผู้ก่อตั้ง Samourai Wallet ถูกกล่าวหาว่าอำนวยความสะดวกมูลค่า 2 พันล้านดอลลาร์ในข้อเสนอ Darknet

การจับกุมผู้ก่อตั้ง Samourai Wallet แสดงให้เห็นถึงความพ่ายแพ้ที่โดดเด่นของอุตสาหกรรม โดยเน้นย้ำถึงความต่อเนื่อง ...

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
Ankr ร่วมมือกับแพลตฟอร์ม Talus Network ของ AI Blockchain เพื่อปลดล็อกสภาพคล่องของ Bitcoin สำหรับ AI
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
Ankr ร่วมมือกับแพลตฟอร์ม Talus Network ของ AI Blockchain เพื่อปลดล็อกสภาพคล่องของ Bitcoin สำหรับ AI
May 1, 2024
Binance Labs สนับสนุน Movement Labs เพื่ออำนวยความสะดวกในการบูรณาการการเคลื่อนไหวของ Facebook ข้ามบล็อกเชน
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
Binance Labs สนับสนุน Movement Labs เพื่ออำนวยความสะดวกในการบูรณาการการเคลื่อนไหวของ Facebook ข้ามบล็อกเชน
May 1, 2024
BRICS Nations Eye โซลูชันการค้า Stablecoin
บัญชีธุรกิจ ตลาด เรื่องราวและบทวิจารณ์ เทคโนโลยี
BRICS Nations Eye โซลูชันการค้า Stablecoin
May 1, 2024
BOB เครือข่าย Bitcoin L2 ผสานรวมกับ LayerZero เพื่อการทำงานที่ได้รับการปรับปรุง
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
BOB เครือข่าย Bitcoin L2 ผสานรวมกับ LayerZero เพื่อการทำงานที่ได้รับการปรับปรุง
May 1, 2024
CRYPTOMERIA LABS PTE. บจก.