Google เปิดตัว AudioPaLM ซึ่งเป็นโมเดลภาษา AI อันทรงพลังสำหรับการสร้างเสียงพูด
ในบทสรุป
AudioPaLM คือโมเดลภาษาอันทรงพลังที่พัฒนาโดย Google ที่รวมโมเดลตามข้อความและคำพูดเพื่อการประมวลผลคำพูดและข้อความที่ราบรื่น
โดยจะเก็บรักษาข้อมูลเชิงปริยัติภาษาและทำงานได้ดีกว่าระบบที่มีอยู่ในงานแปลคำพูด
AudioPaLM สามารถแปลภาษาที่เน้นเสียงและทำการถ่ายโอนเสียงสำหรับการแปลคำพูดเป็นคำพูด
Google ได้เปิดตัวรูปแบบภาษาที่เรียกว่า ออดิโอปาล์มซึ่งรวมโมเดลภาษาที่ใช้ข้อความและเสียงพูดเข้าด้วยกันเพื่อประมวลผลและสร้างคำพูดและข้อความได้อย่างราบรื่น ด้วยการผสานความสามารถของ ปาล์ม-2 และ ออดิโอLM, AudioPaLM นำเสนอสถาปัตยกรรมมัลติโมดอลแบบครบวงจรที่เปิดการใช้งานที่หลากหลาย รวมถึงการรู้จำเสียงและการแปลจากคำพูดเป็นคำพูด
คุณสมบัติที่โดดเด่นประการหนึ่งของ AudioPaLM คือความสามารถในการรักษาข้อมูลเชิงเปรียบเทียบของภาษา เช่น เอกลักษณ์ของผู้พูดและน้ำเสียง ต้องขอบคุณอิทธิพลของ AudioLM ในขณะเดียวกัน ก็ใช้ประโยชน์จากความรู้ทางภาษาที่พบในโมเดลภาษาแบบข้อความ เช่น PaLM-2 ด้วยการเริ่มต้น AudioPaLM ด้วยน้ำหนักของโมเดลภาษาขนาดใหญ่ที่เป็นข้อความเท่านั้น โมเดลจึงมีความยอดเยี่ยมในการประมวลผลเสียงพูด โดยใช้ประโยชน์จากข้อมูลการฝึกอบรมข้อความจำนวนมากที่ใช้ในการฝึกล่วงหน้า
ความสามารถที่โดดเด่นของ AudioPaLM ได้รับการพิสูจน์ผ่านการทดลองต่างๆ มีประสิทธิภาพดีกว่าระบบที่มีอยู่ในงานแปลคำพูดและแสดงความสามารถในการดำเนินการแบบ Zero-shot การแปลคำพูดเป็นข้อความ สำหรับภาษาที่ไม่พบระหว่างการฝึกอบรม
นอกจากนี้ AudioPaLM ยังแสดงคุณสมบัติของ โมเดลภาษาเสียง โดยการโอนเสียงข้ามภาษาตามเสียงพูดสั้นๆ
Google ได้ทำ ตัวอย่างความสามารถของ AudioPaLM พร้อมสำหรับการสำรวจ ความสามารถของแบบจำลองในการแปลภาษาด้วยสำเนียงที่แตกต่างกัน เช่น ภาษาอิตาลีและภาษาเยอรมัน ทำให้นักวิจัยและผู้ใช้รู้สึกทึ่ง นอกจากนี้ ความสามารถในการถ่ายโอนเสียงสำหรับการแปลคำพูดเป็นคำพูดทำให้แตกต่างจากบรรทัดฐานที่มีอยู่ โดยได้รับการยืนยันจากทั้งตัวชี้วัดอัตโนมัติและผู้ประเมินโดยมนุษย์
โมเดลนี้ดีมากในการแปลภาษาจากเสียงเป็นเสียงในภาษาอื่น รักษาเสียงและอารมณ์ของบุคคล ที่น่าสนใจคือ เมื่อแปลบางภาษา เช่น อิตาลีและเยอรมัน ตัวแบบจะมีสำเนียงที่สังเกตได้ชัดเจน และเมื่อแปลภาษาอื่นๆ เช่น ฝรั่งเศส ตัวแบบจะพูดด้วยสำเนียงอเมริกันที่สมบูรณ์แบบ
อ่านเพิ่มเติมเกี่ยวกับ AI:
ข้อจำกัดความรับผิดชอบ
สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า
เกี่ยวกับผู้เขียน
Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต
บทความอื่น ๆDamir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต