Báo cáo tin tức Công nghệ
15 Tháng ba, 2023

Mô hình AI mới tổng hợp lời nói thực tế bằng YouTube và Podcast

Tóm lại

Các nhà nghiên cứu từ Đại học Carnegie Mellon đã tạo ra một mô hình trí tuệ nhân tạo mới có khả năng tạo ra lời nói thực tế bằng cách học từ các video trên YouTube và podcast.

Mô hình này có thể học các sắc thái của các kiểu giọng nói tự nhiên bằng cách nghe gần 900 giờ nội dung YouTube và podcast, dẫn đến giọng nói tổng hợp chân thực và giống như thật hơn.

Các nhà nghiên cứu từ Đại học Carnegie Mellon ở Hoa Kỳ đã tạo ra một mô hình trí tuệ nhân tạo mới có thể tạo ra lời nói chân thực bằng cách học hỏi từ các video và podcast trên YouTube. Mô hình này có khả năng tạo ra bài phát biểu bằng nhiều giọng nói và trọng âm khác nhau, làm cho nó trở thành một công cụ hữu ích tiềm năng cho các ngành như giải trí và quảng cáo. Nó cũng có thể có ý nghĩa đối với những người dựa vào công nghệ hỗ trợ để giao tiếp.

Một mô hình AI mới đang tổng hợp lời nói thực tế bằng YouTube và podcast
Mô hình AI có khả năng bắt chước kiểu nói và ngữ điệu của con người với độ chính xác cao.

Đây là một sự phát triển đáng kể, vì phần lớn lời nói do AI tạo ra được cho là vô cảm và đơn điệu do nó thường được đào tạo trên các tập dữ liệu ghi lại lời nói của các diễn viên chuyên nghiệp. Công nghệ mới có thể được sử dụng để cải thiện hiệu suất của trợ lý ảo và chatbot, khiến chúng trở nên hấp dẫn và giống con người hơn. Nó cũng có những ứng dụng tiềm năng trong các lĩnh vực như chơi game, giáo dục và giải trí.

Tìm hiểu thêm: 15 Podcast về tiền điện tử hay nhất bạn cần nghe trong năm 2023

Tuy nhiên, mô hình mới có thể học được các sắc thái của các mẫu giọng nói tự nhiên, chẳng hạn như ngắt quãng, ngắt quãng và các từ ký sinh bằng cách nghe gần 900 giờ nội dung YouTube và podcast. Điều này dẫn đến một giọng nói tổng hợp chân thực và giống như thật hơn, được đánh giá là 3.89 trên thang điểm năm bởi những người được yêu cầu đánh giá nó. Con số này cao hơn điểm trung bình mà các mô hình AI tương tự nhận được (giọng nói thật của con người đạt 4.01).

Các ứng dụng tiềm năng của công nghệ này là rất lớn và bao gồm trợ giúp những người bị suy giảm khả năng nói, cải thiện hệ thống điều hướng và tạo ra các trợ lý ảo có âm thanh tự nhiên hơn.

  • PodcastAI là podcast đầu tiên từng được sản xuất bởi AI, có cảnh giả mạo Joe Rogan đang phỏng vấn Steve Jobs. Podcast này được thực hiện hoàn toàn bằng thuật toán máy tính AI. AI đã được đào tạo cho tập phim Steve Jobs bằng cách sử dụng cả tiểu sử của anh ấy và bất kỳ đoạn ghi âm nào trên internet về anh ấy có thể khám phá được. Điều này cho phép AI tái tạo một cách trung thực tính cách của anh ta.

Đọc thêm bài viết liên quan:

Từ chối trách nhiệm

Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.

Giới thiệu về Tác giả

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Xem thêm bài viết
Damir Yalalov
Damir Yalalov

Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet. 

Cơn sốt DOGE: Phân tích sự gia tăng giá trị gần đây của Dogecoin (DOGE)

Ngành công nghiệp tiền điện tử đang mở rộng nhanh chóng và các đồng tiền meme đang chuẩn bị cho một bước phát triển đáng kể. Dogecoin (DOGE), ...

Biết thêm

Sự phát triển của nội dung do AI tạo ra trong Metaverse

Sự xuất hiện của nội dung AI tổng quát là một trong những sự phát triển hấp dẫn nhất trong môi trường ảo ...

Biết thêm
Tham gia cộng đồng công nghệ đổi mới của chúng tôi
Tìm hiểu thêm
Tìm hiểu thêm
Scroll hoàn thành nâng cấp Mainnet Bernoulli, dự đoán chi phí giao dịch sẽ giảm 10 lần
Báo cáo tin tức Công nghệ
Scroll hoàn thành nâng cấp Mainnet Bernoulli, dự đoán chi phí giao dịch sẽ giảm 10 lần
29 Tháng Tư, 2024
OKX Jumpstart liệt kê Runecoin, cho phép đặt cược BTC để kiếm token RUNE
thị trường Báo cáo tin tức Công nghệ
OKX Jumpstart liệt kê Runecoin, cho phép đặt cược BTC để kiếm token RUNE
29 Tháng Tư, 2024
Ưu đãi hàng đầu trong tuần này, Các khoản đầu tư lớn vào AI, CNTT, Web3và Tiền điện tử (22-26.04)
Tiêu Kinh doanh thị trường Công nghệ
Ưu đãi hàng đầu trong tuần này, Các khoản đầu tư lớn vào AI, CNTT, Web3và Tiền điện tử (22-26.04)
26 Tháng Tư, 2024
Vitalik Buterin nhận xét về việc tập trung hóa PoW, lưu ý rằng đây chỉ là giai đoạn tạm thời cho đến khi PoS
Báo cáo tin tức Công nghệ
Vitalik Buterin nhận xét về việc tập trung hóa PoW, lưu ý rằng đây chỉ là giai đoạn tạm thời cho đến khi PoS
26 Tháng Tư, 2024
CRYPTOMERIA LABS PTE. CÔNG TY TNHH