Luma เปิดตัว Uni-1 โมเดลรุ่นแรกที่ผสานรวมการประมวลผลเหตุผลและการสร้างภาพ
ในบทสรุป
Luma เปิดตัว Uni-1 ซึ่งเป็นรุ่นแรกที่ผสานการประมวลผลและการสร้างภาพเข้าไว้ในสถาปัตยกรรมเดียว นับเป็นการเปลี่ยนแปลงครั้งสำคัญจากจุดเริ่มต้นของสตาร์ทอัพที่เน้นด้านวิดีโอเป็นหลัก
สตาร์ทอัพด้านการสร้างวิดีโอด้วย AI Luma บริษัทได้เปิดตัว Uni-1 ซึ่งเป็นรุ่นแรกที่ผสานรวมการประมวลผลและการสร้างภาพเข้าไว้ในสถาปัตยกรรมเดียว ถือเป็นการเปลี่ยนแปลงเชิงกลยุทธ์จากเดิมที่บริษัทมุ่งเน้นไปที่เนื้อหาวิดีโอเป็นหลัก
จากข้อมูลของบริษัท ในช่วงสามปีที่ผ่านมา งานของ Luma ได้พัฒนาจากการสร้างฉากขึ้นใหม่ไปสู่การสร้างแบบจำลอง 3 มิติ และการขยายขอบเขตการเผยแพร่วิดีโอ แต่สื่อภาพเพียงอย่างเดียวมีข้อจำกัดหากปราศจากความเข้าใจแบบบูรณาการ Uni-1 จึงถูกวางตำแหน่งให้เป็นแบบจำลองแบบครบวงจรรุ่นแรกของบริษัท ซึ่งออกแบบมาเพื่อผสานรวมความสามารถในการให้เหตุผลและการสร้างสรรค์ โดยมีเป้าหมายเพื่อพัฒนาปัญญาประดิษฐ์ทั่วไปแบบหลายรูปแบบ
Luma นิยามสติปัญญาทั่วไปว่าเป็นความสามารถในการใช้เหตุผล จินตนาการ จัดการสัญลักษณ์ และจำลองสภาพแวดล้อม ในขณะที่ระบบ AI ที่มีอยู่สามารถทำงานเหล่านี้แยกกันได้ แต่ Uni-1 พยายามที่จะรวมฟังก์ชันเหล่านี้เข้าไว้ในกรอบการทำงานเดียว โดยจำลองเวลา พื้นที่ และตรรกะเข้าด้วยกัน เพื่อให้สามารถแก้ปัญหาที่ระบบ AI แบบเดิมซึ่งแยกส่วนกันไม่สามารถทำได้
โมเดลนี้สร้างขึ้นเป็นทรานส์ฟอร์เมอร์แบบอัตถารีเกรสซีฟที่มีเฉพาะตัวถอดรหัส โดยแสดงข้อความและรูปภาพในลำดับสลับกันเดียวซึ่งทำหน้าที่ทั้งเป็นอินพุตและเอาต์พุต Uni-1 สามารถทำการวิเคราะห์เชิงโครงสร้างภายใน แยกคำสั่ง แก้ไขข้อจำกัด วางแผนการจัดองค์ประกอบ และแสดงผลภาพตามนั้นได้
Uni-1 แสดงให้เห็นถึงความสามารถในการ “คิดด้วยภาษา จินตนาการ และแสดงผลออกมาเป็นพิกเซล” ซึ่งเป็นความสามารถที่ Luma อธิบายว่าเป็น “ปัญญาในรูปแบบพิกเซล” คาดว่าจะมีการเพิ่มฟังก์ชันการทำงานเพิ่มเติม เช่น การสร้างเสียงและวิดีโอ ในเวอร์ชันต่อๆ ไป โมเดลนี้ไม่ได้มีจุดประสงค์เพียงแค่เป็นเครื่องมือ แต่เป็นแพลตฟอร์มที่จะเปลี่ยนแปลงวิธีการดำเนินธุรกิจโดยการบูรณาการการใช้เหตุผลเข้ากับกระบวนการทำงานสร้างสรรค์โดยตรง
เอเจนต์ Luma ขยายขีดความสามารถของระบบข่าวกรองแบบบูรณาการ
ต่อยอดจาก Uni-1 บริษัท Luma เพิ่งเปิดตัว Luma Agents ซึ่งเป็นชุดเครื่องมือที่ขับเคลื่อนด้วย AI ออกแบบมาเพื่อจัดการการผลิตงานสร้างสรรค์แบบครบวงจร ทั้งข้อความ รูปภาพ วิดีโอ และเสียง ตัวแทนเหล่านี้ทำงานโดยใช้โมเดลตระกูล Unified Intelligence ของ Luma ซึ่งได้รับการฝึกฝนบนระบบการให้เหตุผลแบบหลายโมดอลเพียงระบบเดียว Luma วางตำแหน่งตัวแทนเหล่านี้เป็นโซลูชันสำหรับเอเจนซี่โฆษณา ทีมการตลาด สตูดิโอออกแบบ และลูกค้าระดับองค์กร โดยนำเสนอการสร้างสรรค์ที่ประสานงานกันในหลากหลายรูปแบบ
Luma Agents สามารถใช้งานร่วมกับโมเดล AI อื่นๆ ได้ รวมถึง Ray 3.14 ของ Luma, Veo 3 และ Nano Banana Pro ของ Google, Seedream ของ ByteDance และเครื่องมือสร้างเสียงของ ElevenLabs Amit Jain ซีอีโอและผู้ร่วมก่อตั้ง Luma กล่าวว่า เอเจนต์เหล่านี้ใช้ประโยชน์จากสถาปัตยกรรมแบบบูรณาการของ Uni-1 ซึ่งได้รับการฝึกฝนด้านเสียง วิดีโอ ภาพ ภาษา และการให้เหตุผลเชิงพื้นที่ ทำให้พวกมันสามารถวางแผน ดำเนินการ และสร้างเนื้อหาในขั้นตอนการทำงานที่ประสานงานและชาญฉลาด
ข้อจำกัดความรับผิดชอบ
สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า
เกี่ยวกับผู้เขียน
อลิสา นักข่าวผู้ทุ่มเทของ MPostเชี่ยวชาญด้านคริปโตเคอร์เรนซี ปัญญาประดิษฐ์ การลงทุน และขอบเขตอันกว้างขวางของ... Web3- ด้วยสายตาที่กระตือรือร้นต่อแนวโน้มและเทคโนโลยีที่เกิดขึ้นใหม่ เธอจึงนำเสนอความครอบคลุมที่ครอบคลุมเพื่อแจ้งและดึงดูดผู้อ่านเกี่ยวกับภูมิทัศน์ทางการเงินดิจิทัลที่พัฒนาอยู่ตลอดเวลา
บทความอื่น ๆ
อลิสา นักข่าวผู้ทุ่มเทของ MPostเชี่ยวชาญด้านคริปโตเคอร์เรนซี ปัญญาประดิษฐ์ การลงทุน และขอบเขตอันกว้างขวางของ... Web3- ด้วยสายตาที่กระตือรือร้นต่อแนวโน้มและเทคโนโลยีที่เกิดขึ้นใหม่ เธอจึงนำเสนอความครอบคลุมที่ครอบคลุมเพื่อแจ้งและดึงดูดผู้อ่านเกี่ยวกับภูมิทัศน์ทางการเงินดิจิทัลที่พัฒนาอยู่ตลอดเวลา



