ElevenLabs 在 AI 模仿聲音方面變得非常擅長
簡單來說
神經網絡 是技術的未來,ElevenLabs Neuron 的最新更新使其能夠做一些更令人印象深刻的事情:模仿任何人的聲音。
該合成器於 XNUMX 月底發布了測試版,一周後,互聯網上充斥著以名人聲音為特色的假冒音頻。
ElevenLabs 已承諾處理假貨並重建算法。
有人說神經網絡是未來。 他們可以比人類更快地做事,甚至可以做到人類做不到的事情。 但是,如果他們可以做一些更令人印象深刻的事情,比如模仿任何人的聲音呢? 這就是 ElevenLabs Neuron 的最新更新允許它做的事情,而且它幾乎是有史以來最酷的事情。
如果您曾經想听起來像托尼·斯塔克或史蒂夫·喬布斯,現在就可以。 或者,如果您感覺特別雄心勃勃,您甚至可以模仿金·卡戴珊 (Kim Kardashian)。 你所需要的只是某人一分鐘的聲音樣本,人工智能將完成剩下的工作。 因此,如果您想給自己留下深刻印象 與你的明星成為朋友 印像或只是想嘗試不同的聲音以獲得一些樂趣,這肯定會很有趣。
當然,一些測試版用戶開始在令人毛骨悚然的實驗中使用它。 社群中有一些報告提到了一些非常令人毛骨悚然的事情,例如當機器人被要求閱讀其中一篇文章時 哈利·波特 書中以艾瑪華森的聲音提供了一段由《哈利波特》系列明星朗讀的《我的奮鬥》。 但總的來說,這是一項令人印象深刻的技術壯舉,而且只會變得更好。
初創公司 ElevenLabs 在 XNUMX 月底發布了合成器測試版。 一周後,互聯網上充斥著以名人聲音為特色的假冒音頻:喬·拜登、瑪格特·羅比、喬·羅根、喬治·盧卡斯、艾瑪·沃特森和湯姆·克魯斯。 事實上,非常短的音頻或視頻樣本就足以用於服務的培訓。 而且聲音是真實的! ElevenLabs 承諾會處理假貨並重建算法。 |
推薦帖子: 有效數字廣告的 10 種最佳人工智能營銷工具 |
因此,如果您想通過對名人的真實印像給您的朋友留下深刻印象,或者只是想嘗試不同的聲音來獲得一些樂趣, 查看 ElevenLabs 神經元. 這肯定會很精彩。
- 一月份,微軟宣布 Val-E,一種新的零鏡頭文本到語音模型,可以復制每個人的聲音。 微軟的 VALL-E 是一種基於 transformer 的 TTS 模型,只需聽到三秒鐘的樣本,就可以生成任何語音的語音。 這是對以前模型的重大改進,並有可能改變我們與數字媒體互動的方式。 代碼仍然缺乏,但微軟已經發布了該模型的實際示例。
- Vall-E 似乎是 最危險的詐騙軟件 曾經被釋放過。 它是一種可用於模仿真人的合成語音,是使用真人語音錄音和 Microsoft 代碼製作的。 最好的部分是,它只需要三秒鐘的演講就可以進行學習,或者更準確地說,進行微學習。 Val-E很危險 因為它可以用來欺騙弱勢群體將資金轉移到卡上,而騙子可以用它來冒充受害者熟悉的人。
閱讀有關人工智能的更多信息:
免責聲明
在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。
關於作者
Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。
更多文章Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。