โมเดล AI จากข้อความเป็นรูปภาพ
โมเดล AI ของข้อความเป็นรูปภาพคืออะไร
โมเดลข้อความเป็นรูปภาพคือประเภทของ เรียนรู้เครื่อง โมเดลที่สร้างภาพที่สอดคล้องกับคำอธิบายภาษาธรรมชาติที่ให้ไว้เป็นอินพุต โดยทั่วไป โมเดลข้อความเป็นรูปภาพประกอบด้วยสององค์ประกอบ: โมเดลรูปภาพที่สร้างซึ่งสร้างรูปภาพที่มีเงื่อนไขจากข้อความที่ป้อน และโมเดลภาษาที่แปลงข้อความให้เป็นการนำเสนอที่แฝงอยู่ ข้อมูลข้อความและรูปภาพจำนวนมากที่คัดลอกมาจากอินเทอร์เน็ตมักจะใช้เพื่อฝึกอัลกอริธึมที่มีประสิทธิภาพสูงสุด
ความเข้าใจเกี่ยวกับโมเดล AI ของข้อความเป็นรูปภาพ
นักวิจัยจากมหาวิทยาลัยโตรอนโตได้เปิดตัว alignDRAW ซึ่งเป็นโมเดลการแปลงข้อความเป็นรูปภาพร่วมสมัยรุ่นแรกในปี 2015 สถาปัตยกรรม DRAW ที่เปิดตัวครั้งแรกได้รับการขยายโดย alignDRAW เพื่อให้มีการปรับสภาพลำดับข้อความ ในขณะที่รูปภาพที่สร้างจาก alignDRAW ขาดความสมจริงเหมือนภาพถ่ายและมัวหมอง แบบจำลองดังกล่าวแสดงให้เห็นว่ามีศักยภาพมากกว่าแค่ "จดจำ" เนื้อหาของชุดการฝึก โดยสามารถสรุปรายการที่ไม่รวมอยู่ในชุดการฝึกและตอบสนองอย่างเหมาะสม คิวใหม่
พื้นที่ OpenAI ระบบหม้อแปลงไฟฟ้า DALL-E เป็นหนึ่งในโมเดลการแปลงข้อความเป็นรูปภาพรุ่นแรกๆ ที่ดึงดูดความสนใจของสาธารณชนเป็นอย่างมาก โดยเปิดตัวในเดือนมกราคม พ.ศ. 2021 ในเดือนเมษายน พ.ศ. 2022 DALL-E 2 ซึ่งเป็นอุปกรณ์ทดแทนที่สามารถสร้างภาพที่ซับซ้อนและสมจริงมากขึ้นได้ นำเสนอ ในเดือนสิงหาคมของปีเดียวกัน Stable Diffusion ได้รับการเผยแพร่สู่สาธารณะ การสาธิตเพิ่มเติมเกี่ยวกับ "การปรับเปลี่ยนในแบบของคุณ" ของโมเดลพื้นฐานข้อความเป็นรูปภาพขนาดใหญ่เกิดขึ้นในเดือนสิงหาคม 2022 ด้วยการปรับแต่งข้อความเป็นรูปภาพ แนวความคิดใหม่อาจได้รับการสอนให้กับโมเดลด้วยรูปถ่ายจำนวนเล็กน้อยของรายการที่ไม่ได้ ไม่ได้เป็นส่วนหนึ่งของชุดการฝึกของโมเดลพื้นฐานข้อความเป็นรูปภาพ ซึ่งทำได้โดยการผกผันข้อความ
ที่เกี่ยวข้อง: ดีที่สุด 100+ Stable Diffusion พรอมต์: พรอมต์ข้อความเป็นรูปภาพ AI ที่สวยที่สุด |
อนาคตของโมเดล AI จากข้อความเป็นรูปภาพ
ชุมชนสร้างสรรค์กำลังระเบิดด้วยงานศิลปะ AI ซึ่งผลักดันเราไปสู่ภูมิประเทศที่ยังไม่มีใครสำรวจทางสติปัญญาและทางศิลปะ แม้ว่ายังคงมีการสำรวจแง่มุมที่สร้างสรรค์อยู่ แต่ก็ได้เริ่มเปลี่ยนแปลงสภาพแวดล้อมของภาพทางศิลปะแล้ว ภาพของมนุษย์ที่ชาญฉลาดเหนือสิ่งอื่นใดที่เราเคยเห็นบนหน้าจอเป็นที่ต้อนรับในใจของเราแล้ว ความก้าวหน้าที่น่าสนใจที่สุดประการหนึ่งคือการสร้างข้อความเป็นรูปภาพ ซึ่งช่วยให้คอมพิวเตอร์สามารถสร้างรูปภาพเพื่อตอบสนองต่อคำสั่งข้อความได้ ศิลปินใช้ AI เพื่อขยายจินตนาการในแต่ละวัน ความสนใจของพวกเขาอยู่ที่การค้นหาเทคโนโลยีเพื่อสร้างเมืองในจินตนาการ ดูสุนัขเต้นรำที่ดิสโก้ หรือพยายามคิดว่าอนาคตจะเป็นอย่างไร
ข่าวสารล่าสุดเกี่ยวกับโมเดล AI ของข้อความเป็นรูปภาพ
- Midjourney 5.2 และ Stable Diffusion SDXL 0.9 ได้เปิดตัวการอัปเดตที่สำคัญสำหรับการสร้างภาพที่สร้างสรรค์ Midjourney 5.2 นำเสนอการซูมออก รูปแบบที่ปรับแต่งได้ และการแปลงภาพ 1:1 นอกจากนี้ยังแนะนำ Outpainting รูปแบบที่ปรับแต่งได้ และตัวแยกวิเคราะห์พร้อมท์สำหรับการเพิ่มประสิทธิภาพพร้อมท์และจัดให้สอดคล้องกับความตั้งใจของผู้ใช้ การอัปเดตเหล่านี้ปรับปรุงประสบการณ์ผู้ใช้และปรับปรุงความแม่นยำในการสร้างภาพที่สมจริง
- SnapFusion เป็นโมเดล AI ที่ช่วยให้ผู้ใช้สามารถสร้างภาพที่น่าทึ่งจากคำอธิบายภาษาธรรมชาติได้ภายในเวลาเพียงสองวินาทีบนอุปกรณ์เคลื่อนที่ ขจัดความจำเป็นในการใช้ GPU ราคาแพงและบริการบนคลาวด์ ลดต้นทุน และแก้ไขข้อกังวลด้านความเป็นส่วนตัว ประสิทธิภาพและประสิทธิภาพของแบบจำลองได้แสดงให้เห็นในการทดลองกับชุดข้อมูล MS-COCO
- นักวิจัยได้พัฒนา GigaGAN ซึ่งเป็นโมเดลการแปลงข้อความเป็นภาพที่สามารถสร้างภาพ 4K ได้ใน 3.66 วินาที ซึ่งเป็นการปรับปรุงที่สำคัญกว่ารุ่นที่มีอยู่ GigaGAN ใช้กรอบงาน GAN และฝึกฝนชุดข้อมูล 1 พันล้านภาพ สร้างภาพ 512px ที่ 0.13 วินาที มีพื้นที่แฝงที่แยกออก ต่อเนื่อง และควบคุมได้ ช่วยให้มีสไตล์และควบคุมภาพได้หลากหลาย โมเดลยังสามารถฝึกอัปแซมเปลอร์ที่มีประสิทธิภาพสำหรับรูปภาพหรือเอาต์พุตจริงได้
โพสต์โซเชียลล่าสุดเกี่ยวกับ
«กลับไปที่ดัชนีอภิธานศัพท์ข้อจำกัดความรับผิดชอบ
สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า
เกี่ยวกับผู้เขียน
Viktoriia เป็นนักเขียนในหัวข้อด้านเทคโนโลยีที่หลากหลาย รวมถึง Web3.0, AI และสกุลเงินดิจิตอล ประสบการณ์ที่กว้างขวางของเธอทำให้เธอสามารถเขียนบทความเชิงลึกสำหรับผู้ชมในวงกว้าง
บทความอื่น ๆViktoriia เป็นนักเขียนในหัวข้อด้านเทคโนโลยีที่หลากหลาย รวมถึง Web3.0, AI และสกุลเงินดิจิตอล ประสบการณ์ที่กว้างขวางของเธอทำให้เธอสามารถเขียนบทความเชิงลึกสำหรับผู้ชมในวงกว้าง