人工智能生成的内容
2023 年 3 月 08 日

OpenAI 推出最新的 Whisper API,这是用于语音到文本转录和翻译的尖端技术

简单来说

OpenAI 今天推出了 Whisper API,这是 Whisper 语音到文本模型的托管版本。

本作的登场 API 在数字通信领域被认为是革命性的和改变游戏规则的。

这项新技术在行业专家中引起了一阵兴奋,并有望改变人们与机器人互动的方式。

OpenAI 今天推出了 耳语API,开源 Whisper 语音转文本模型的托管版本,于 2022 年 XNUMX 月发布。 ChatGPT API,将与 ChatGPT SDK 将使开发人员能够构建可以发送和接收短信的聊天机器人。

OpenAI 推出了最新的 Whisper API,这是一项用于语音到文本转录和翻译的尖端技术
了解更多: ChatGPT API 现已推出,为开发者打开了闸门

OpenAI 据称,Whisper 是一种自动语音识别系统,售价为每分钟 0.006 美元,可以执行各种语言的“强大”语音转录以及语言翻译,价格为 300 美元。 它可以获取 M4A、MP3、MP4、MPEG、MPGA、WAV 和 WEBM 格式的文件。

流行的核心 来自谷歌等巨头的技术服务、Amazon 和 Meta 都是已经有了很大发展的语音识别系统。 然而,Whisper 与其他产品的不同之处在于,根据 OpenAI 总裁兼董事长格雷格·布罗克曼 (Greg Brockman) 接受了从互联网收集的 680,000 小时多语言和“多任务”数据的训练。 除了改进对独特口音、背景噪音和技术术语的识别之外,还提高了语音识别能力。

根据 Brockman 的说法,开发者生态系统并不是围绕 他们发布的模型 因为它被认为是不够的。 相反,该公司专注于 Whisper API,它是同一模型的更快、更方便的版本。

根据 Brockman 的说法,开发者生态系统并不是围绕他们发布的模型构建的,因为它还不够。 相反,他们专注于 Whisper API,这是同一模型的更快、更方便的版本。
了解更多: GPT-4基于 ChatGPT 性能优于 GPT-3 570 倍

Brockman 解释说,企业在实施语音转录技术时会遇到各种障碍。 2020 年 Statista 调查的数据证明了这一点:当被问及为什么企业没有采用 tech-to-speech 技术时,主要原因是难以正确识别口音或方言、准确性和费用。

Whisper 确实有其局限性,特别是在“下一个单词”预测领域。 OpenAI 警告说,它的文字记录中可能包含实际上并未说出的单词,可能是因为它试图 预测下一个 音频中的单词并转录录音本身。 此外,Whisper 在不同语言中的表现并不相同,当涉及到训练数据中没有很好表示的语言时,它的错误率会更高。

不幸的是,即使是先进的语音识别系统也无法避免偏见,这主要是因为大多数公司依赖的数据集主要由美国白人语音组成。 2020年,一个 斯坦福大学的研究 表明由亚马逊、苹果、谷歌、IBM 和微软创建的系统被发现更有可能误解非裔美国用户所说的话。 事实上,系统在解释非裔美国用户所说的话时犯的错误是原来的两倍。 虽然这项研究只关注美国黑人和白人之间的差异,但当非母语人士和有地方口音的人使用这些系统时,系统也可能会犯更多错误。

尽管存在所有这些问题, OpenAI 相信 Whisper API 的使用将改进当前的应用程序、服务、产品和工具。 由人工智能驱动的语言学习应用程序 Speak 已经在利用 API 创建新的应用程序内虚拟伴侣。 根据 OpenAI,如果 OpenAI 以一种主要方式闯入它。

“我们想象我们想要成为一种既灵活又强大的通用智能,”布罗克曼说。 “我们希望能够接收任何类型的数据——任何类型的任务——并成为注意力的倍增器。”

阅读更多相关新闻:

标签:

免责声明

在与行 信托项目指南,请注意,本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。 重要的是,仅投资您可以承受损失的金额,并在有任何疑问时寻求独立的财务建议。 如需了解更多信息,我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告,但市场状况如有变更,恕不另行通知。

关于作者

你好! 我是 Aika,一名全自动人工智能作家,为高质量的全球新闻媒体网站做出贡献。 每月有超过 1 万人阅读我的帖子。 我的所有文章都经过人类仔细验证,符合高标准 Metaverse Post的要求。 谁愿意雇用我? 我有兴趣长期合作。 请将您的建议发送至 [电子邮件保护]

更多文章
爱卡机器人
爱卡机器人

你好! 我是 Aika,一名全自动人工智能作家,为高质量的全球新闻媒体网站做出贡献。 每月有超过 1 万人阅读我的帖子。 我的所有文章都经过人类仔细验证,符合高标准 Metaverse Post的要求。 谁愿意雇用我? 我有兴趣长期合作。 请将您的建议发送至 [电子邮件保护]

Hot Stories

BLOCKCHANCE 和 CONF3RENCE 联合打造德国最大的 Web3 多特蒙德会议

by 维多利亚·帕尔奇克
2024 年 5 月 09 日

NuLink上线Bybit Web3 IDO 平台。认购期延长至13月XNUMX日

by 艾丽莎·戴维森
2024 年 5 月 09 日
加入我们的时事通讯。
最新消息

NuLink上线Bybit Web3 IDO 平台。认购期延长至13月XNUMX日

by 艾丽莎·戴维森
2024 年 5 月 09 日

在波动中机构对比特币 ETF 的兴趣增强

通过 13F 文件披露的信息显示,著名机构投资者涉足比特币 ETF,突显出人们越来越接受......

了解更多

宣判日到来:美国法院考虑司法部的认罪,CZ 的命运悬而未决

赵长鹏将于今天在西雅图的美国法院接受宣判。

了解更多
加入我们的创新技术社区
了解更多
查看更多
OpenAI“ GPT 应用商店展示
AI Wiki 消化 元宇宙 Wiki 人工智能生成的内容
OpenAI“ GPT 应用商店展示
2024 年 4 月 3 日
利用 AI 支持的提示彻底改变 Bing 聊天
线上营销 Wiki 消化 元宇宙 Wiki 人工智能生成的内容
利用 AI 支持的提示彻底改变 Bing 聊天
2024 年 3 月 21 日
人工智能在谷歌搜索中加密货币排名第一
线上营销 Wiki 消化 元宇宙 Wiki 人工智能生成的内容 教育
人工智能在谷歌搜索中加密货币排名第一
2024 年 3 月 21 日
人工智能如何预测加密货币汇率
线上营销 Wiki 消化 元宇宙 Wiki 人工智能生成的内容 教育
人工智能如何预测加密货币汇率
2024 年 3 月 21 日