รายงานข่าว เทคโนโลยี
มิถุนายน 26, 2023

Google เปิดตัว AudioPaLM ซึ่งเป็นโมเดลภาษา AI อันทรงพลังสำหรับการสร้างเสียงพูด

ในบทสรุป

AudioPaLM คือโมเดลภาษาอันทรงพลังที่พัฒนาโดย Google ที่รวมโมเดลตามข้อความและคำพูดเพื่อการประมวลผลคำพูดและข้อความที่ราบรื่น

โดยจะเก็บรักษาข้อมูลเชิงปริยัติภาษาและทำงานได้ดีกว่าระบบที่มีอยู่ในงานแปลคำพูด

AudioPaLM สามารถแปลภาษาที่เน้นเสียงและทำการถ่ายโอนเสียงสำหรับการแปลคำพูดเป็นคำพูด

Google ได้เปิดตัวรูปแบบภาษาที่เรียกว่า ออดิโอปาล์มซึ่งรวมโมเดลภาษาที่ใช้ข้อความและเสียงพูดเข้าด้วยกันเพื่อประมวลผลและสร้างคำพูดและข้อความได้อย่างราบรื่น ด้วยการผสานความสามารถของ ปาล์ม-2 และ ออดิโอLM, AudioPaLM นำเสนอสถาปัตยกรรมมัลติโมดอลแบบครบวงจรที่เปิดการใช้งานที่หลากหลาย รวมถึงการรู้จำเสียงและการแปลจากคำพูดเป็นคำพูด

Google เปิดตัว AudioPaLM โมเดลภาษาที่มีประสิทธิภาพสำหรับการสร้างเสียงพูด
เครดิต: Metaverse Post (mpost.io)

คุณสมบัติที่โดดเด่นประการหนึ่งของ AudioPaLM คือความสามารถในการรักษาข้อมูลเชิงเปรียบเทียบของภาษา เช่น เอกลักษณ์ของผู้พูดและน้ำเสียง ต้องขอบคุณอิทธิพลของ AudioLM ในขณะเดียวกัน ก็ใช้ประโยชน์จากความรู้ทางภาษาที่พบในโมเดลภาษาแบบข้อความ เช่น PaLM-2 ด้วยการเริ่มต้น AudioPaLM ด้วยน้ำหนักของโมเดลภาษาขนาดใหญ่ที่เป็นข้อความเท่านั้น โมเดลจึงมีความยอดเยี่ยมในการประมวลผลเสียงพูด โดยใช้ประโยชน์จากข้อมูลการฝึกอบรมข้อความจำนวนมากที่ใช้ในการฝึกล่วงหน้า

ความสามารถที่โดดเด่นของ AudioPaLM ได้รับการพิสูจน์ผ่านการทดลองต่างๆ มีประสิทธิภาพดีกว่าระบบที่มีอยู่ในงานแปลคำพูดและแสดงความสามารถในการดำเนินการแบบ Zero-shot การแปลคำพูดเป็นข้อความ สำหรับภาษาที่ไม่พบระหว่างการฝึกอบรม

นอกจากนี้ AudioPaLM ยังแสดงคุณสมบัติของ โมเดลภาษาเสียง โดยการโอนเสียงข้ามภาษาตามเสียงพูดสั้นๆ

Google ได้ทำ ตัวอย่างความสามารถของ AudioPaLM พร้อมสำหรับการสำรวจ ความสามารถของแบบจำลองในการแปลภาษาด้วยสำเนียงที่แตกต่างกัน เช่น ภาษาอิตาลีและภาษาเยอรมัน ทำให้นักวิจัยและผู้ใช้รู้สึกทึ่ง นอกจากนี้ ความสามารถในการถ่ายโอนเสียงสำหรับการแปลคำพูดเป็นคำพูดทำให้แตกต่างจากบรรทัดฐานที่มีอยู่ โดยได้รับการยืนยันจากทั้งตัวชี้วัดอัตโนมัติและผู้ประเมินโดยมนุษย์

โมเดลนี้ดีมากในการแปลภาษาจากเสียงเป็นเสียงในภาษาอื่น รักษาเสียงและอารมณ์ของบุคคล ที่น่าสนใจคือ เมื่อแปลบางภาษา เช่น อิตาลีและเยอรมัน ตัวแบบจะมีสำเนียงที่สังเกตได้ชัดเจน และเมื่อแปลภาษาอื่นๆ เช่น ฝรั่งเศส ตัวแบบจะพูดด้วยสำเนียงอเมริกันที่สมบูรณ์แบบ

โมเดล AudioPaLM พร้อมตัวอย่างการแปลคำพูดเป็นคำพูดและการรู้จำเสียงอัตโนมัติ

อ่านเพิ่มเติมเกี่ยวกับ AI:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

บทความอื่น ๆ
ดาเมียร์ ยาลอฟ
ดาเมียร์ ยาลอฟ

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

Hot Stories
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

ความอยากอาหารของสถาบันเติบโตขึ้นสู่ Bitcoin ETFs ท่ามกลางความผันผวน

การเปิดเผยผ่านการยื่นเอกสาร 13F เผยให้เห็นนักลงทุนสถาบันที่มีชื่อเสียงกำลังเล่น Bitcoin ETFs ซึ่งตอกย้ำถึงการยอมรับที่เพิ่มขึ้นของ ...

รู้เพิ่มเติม

วันพิพากษามาถึง: ชะตากรรมของ CZ แขวนอยู่ในสมดุลขณะที่ศาลสหรัฐฯ พิจารณาคำร้องของ DOJ

ฉางเผิง จ้าว เตรียมเผชิญโทษจำคุกในศาลสหรัฐฯ ในเมืองซีแอตเทิลวันนี้

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
MPost เข้าร่วมผู้นำอุตสาหกรรมในแคมเปญ 'Bitcoin Deserves An Emoji' ซึ่งสนับสนุนการรวมสัญลักษณ์ของ Bitcoin บนคีย์บอร์ดเสมือนจริงทุกตัว
ไลฟ์สไตล์ รายงานข่าว เทคโนโลยี
MPost เข้าร่วมผู้นำอุตสาหกรรมในแคมเปญ 'Bitcoin Deserves An Emoji' ซึ่งสนับสนุนการรวมสัญลักษณ์ของ Bitcoin บนคีย์บอร์ดเสมือนจริงทุกตัว
May 10, 2024
Crypto Exchange OKX แสดงรายการ Notcoin พร้อมเปิดตัวการซื้อขายแบบ Spot ด้วยคู่ NOT-USDT ในวันที่ 16 พฤษภาคม
ตลาด รายงานข่าว เทคโนโลยี
Crypto Exchange OKX แสดงรายการ Notcoin พร้อมเปิดตัวการซื้อขายแบบ Spot ด้วยคู่ NOT-USDT ในวันที่ 16 พฤษภาคม  
May 10, 2024
Blast เปิดตัวกิจกรรมการกระจาย Gold Blast ครั้งที่สาม จัดสรร 15M คะแนนให้กับ DApps
ตลาด รายงานข่าว เทคโนโลยี
Blast เปิดตัวกิจกรรมการกระจาย Gold Blast ครั้งที่สาม จัดสรร 15M คะแนนให้กับ DApps
May 10, 2024
Espresso Systems ร่วมมือกับ Polygon Labs เพื่อพัฒนา AggLayer เพื่อเพิ่มประสิทธิภาพการทำงานร่วมกันแบบ Rollup
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
Espresso Systems ร่วมมือกับ Polygon Labs เพื่อพัฒนา AggLayer เพื่อเพิ่มประสิทธิภาพการทำงานร่วมกันแบบ Rollup
May 9, 2024
CRYPTOMERIA LABS PTE. บจก.