โมเดล AI ใหม่สังเคราะห์คำพูดที่สมจริงโดยใช้ YouTube และ Podcasts
ในบทสรุป
นักวิจัยจากมหาวิทยาลัย Carnegie Mellon ได้สร้างโมเดลปัญญาประดิษฐ์ใหม่ที่สามารถสร้างคำพูดที่สมจริงโดยการเรียนรู้จากวิดีโอ YouTube และ พอดคาสต์.
โมเดลสามารถเรียนรู้ความแตกต่างของรูปแบบการพูดตามธรรมชาติได้จากการฟัง YouTube และเนื้อหาพอดแคสต์เกือบ 900 ชั่วโมง ทำให้ได้เสียงสังเคราะห์ที่สมจริงและเหมือนจริงมากขึ้น
นักวิจัยจาก Carnegie Mellon University ในสหรัฐอเมริกา ได้สร้าง โมเดลปัญญาประดิษฐ์ใหม่ที่สามารถสร้างเสียงพูดที่สมจริงด้วยการเรียนรู้จากวิดีโอ YouTube และพอดแคสต์ โมเดลนี้สามารถสร้างคำพูดด้วยเสียงและสำเนียงที่หลากหลาย ทำให้เป็นเครื่องมือที่เป็นประโยชน์สำหรับอุตสาหกรรมต่างๆ เช่น ความบันเทิงและการโฆษณา นอกจากนี้ยังอาจมีความหมายสำหรับผู้ที่พึ่งพาเทคโนโลยีอำนวยความสะดวกในการสื่อสาร
นี่เป็นการพัฒนาที่สำคัญ เนื่องจากพบว่าคำพูดส่วนใหญ่ที่สร้างโดย AI นั้นไร้อารมณ์และจำเจ เนื่องจากข้อเท็จจริงที่ว่ามักจะได้รับการฝึกฝนในชุดข้อมูลที่บันทึกคำพูดของนักแสดงมืออาชีพ เทคโนโลยีใหม่นี้สามารถใช้เพื่อปรับปรุงประสิทธิภาพของผู้ช่วยเสมือนและแชทบอท ทำให้มีส่วนร่วมมากขึ้นและเหมือนมนุษย์ นอกจากนี้ยังมีแอปพลิเคชันที่มีศักยภาพในด้านต่างๆ เช่น เกม การศึกษา และความบันเทิง
อ่านเพิ่มเติม: 15 สุดยอด Crypto Podcast ที่คุณต้องฟังในปี 2023 |
อย่างไรก็ตาม โมเดลใหม่สามารถเรียนรู้ความแตกต่างของรูปแบบการพูดตามธรรมชาติ เช่น การหยุดชั่วคราว คำอุทาน และคำที่เป็นกาฝาก โดยฟัง YouTube และเนื้อหาพอดแคสต์เกือบ 900 ชั่วโมง สิ่งนี้ส่งผลให้ได้เสียงสังเคราะห์ที่สมจริงและเหมือนจริงมากขึ้น ซึ่งได้รับคะแนน 3.89 ในระดับห้าคะแนนโดยผู้ที่ถูกขอให้ประเมิน ซึ่งสูงกว่าคะแนนเฉลี่ยที่ได้รับจากโมเดล AI ที่คล้ายกัน (เสียงมนุษย์จริงได้คะแนน 4.01)
การใช้งานที่เป็นไปได้ของเทคโนโลยีนี้มีมากมายและรวมถึงการช่วยผู้ที่มีความบกพร่องทางการพูด ปรับปรุงระบบนำทาง และสร้างผู้ช่วยเสมือนที่ให้เสียงเป็นธรรมชาติมากขึ้น
- พอดคาสต์AI เป็นพอดคาสต์แรกที่ผลิตโดย AI โดยมีการสวมรอยเป็นโจ โรแกน สัมภาษณ์สตีฟ จ็อบส์ พอดคาสต์นี้สร้างขึ้นโดยอัลกอริทึมคอมพิวเตอร์ AI ทั้งหมด AI ได้รับการฝึกฝนสำหรับตอนของ Steve Jobs โดยใช้ทั้งชีวประวัติของเขาและบันทึกทางอินเทอร์เน็ตที่สามารถค้นพบได้ สิ่งนี้ทำให้ AI สามารถสร้างบุคลิกของเขาขึ้นมาใหม่ได้อย่างซื่อสัตย์
อ่านบทความที่เกี่ยวข้องเพิ่มเติม:
ข้อจำกัดความรับผิดชอบ
สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า
เกี่ยวกับผู้เขียน
Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต
บทความอื่น ๆDamir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต