新闻报道 专业技术
2023 年 5 月 23 日

Meta 开发了一种开源语音 AI,可识别 4,000 多种口头语言

简单来说

该公司的 MMS 项目可以识别 4,000 多种语言。

与大多数其他公开宣布的 AI 项目一样,Meta 正在共享其模型和代码,以帮助保护语言多样性。

通过这项工作,他们希望为保护世界上令人难以置信的语言多样性做出一点贡献。

创造了 一个令人耳目一新的人工智能语言模型 ChatGPT. 开源的 彩信项目 旨在保护语言多样性和鼓励研究,可以识别 4,000 多种口头语言并生成 1,100 多种语言的文本(语音)。 公司拥有 公开发布 它的模型和代码今天以进一步实现其目标。

“我们正在公开分享我们的创作和代码,以鼓励研究界的其他人以我们的工作为基础,”Meta 写道。 “通过这项努力,我们希望保护世界上巨大的语言多样性。”

Meta 开发了一种开源语音 AI,可识别 4,000 多种口头语言

在没有转录标签的大量音频上训练语音识别器和文本到语音模型的难度是典型的。 标签对于 机器学习,可以正确识别和分类数据。 然而,对于将在未来几十年消失的语言,“这些数据根本不存在,”正如 Meta 解释的那样。

Meta 使用宗教文本的录音以非常规的方式收集数据。 “我们使用了圣经等宗教文本的翻译,这些文本已被广泛研究用于多种语言的基于文本的语言翻译研究,因为它们被翻译成多种不同的语言,”该公司表示。 我们从公开的翻译中提取了人们用不同语言阅读这些文本的录音。” Meta 的研究人员将 4,000 多种语言添加到 模型.

这种方法听起来像是一个偏向于基督教世界观的严重偏见人工智能模型的秘诀。 然而,在你嘲笑这个想法之前,请从 Meta 的角度考虑它:研究人员认为情况确实如此,因为他们采用了连接主义的 CTC 时间分类(或序列到序列或序列类型模型),该模型在术语方面更加有限计算能力与 大型语言模型 (也称为序列类型)或用于语音识别的序列模型。 Meta 说,这并没有导致大多数男性演讲者录制的宗教录音中存在男性偏见。

Meta 使用 wav2vec 2.0,一种“自监督语音表示学习”模型,来训练 wav2vec 2.0 对齐模型 这使数据更有用。 Meta 从未标记数据中自我监督的自我监督语音模型取得了很好的效果。 Meta 发现,与现有模型相比,大规模多语言语音模型表现良好,覆盖的语言数量是现有模型的 10 倍,特别是与 耳语. Meta 实现了一半的单词错误率,而 Massively Multilingual Speech 覆盖的语言数量是原来的 11 倍。

Meta 表示其新的语音转文本模型并不完美。 该公司写道,例如,他们可能会错误翻译单词或短语,这可能会导致冒犯性和/或不正确的言论。 人工智能技术的负责任发展必须通过人工智能社区之间的合作来实现。

由于 Meta 发布了用于开源研究的 MMS,它希望能够扭转语言使用消失的趋势。 在这个愿景中,辅助技术、TTS,甚至虚拟现实和增强现实技术可能会让每个人都用他们的母语说话和学习。 它说:“我们设想一个技术具有相反效果的世界,促使人们保持他们的语言的活力,因为他们可以通过说他们喜欢的语言来获取信息和使用技术。”

  • 最近,元 已公布 2023 年第一季度的财务业绩。尽管最近进行了重组,但该公司第一季度的销售额意外增长,令投资者感到意外。 股价周三飙升 12%。

阅读更多相关文章:

免责声明

在与行 信托项目指南,请注意,本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。 重要的是,仅投资您可以承受损失的金额,并在有任何疑问时寻求独立的财务建议。 如需了解更多信息,我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告,但市场状况如有变更,恕不另行通知。

关于作者

Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。 

更多文章
达米尔亚拉洛夫
达米尔亚拉洛夫

Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。 

Hot Stories

Injective 与 AltLayer 联手为 inEVM 带来重新抵押安全性

by 艾丽莎·戴维森
2024 年 5 月 03 日

Masa 与 Teller 合作推出 MASA 借贷池,支持 USDC 借贷

by 艾丽莎·戴维森
2024 年 5 月 03 日

CARV 宣布与 Aethir 合作,以分散其数据层并分配奖励

by 艾丽莎·戴维森
2024 年 5 月 03 日
加入我们的时事通讯。
最新消息

Injective 与 AltLayer 联手为 inEVM 带来重新抵押安全性

by 艾丽莎·戴维森
2024 年 5 月 03 日

Masa 与 Teller 合作推出 MASA 借贷池,支持 USDC 借贷

by 艾丽莎·戴维森
2024 年 5 月 03 日

CARV 宣布与 Aethir 合作,以分散其数据层并分配奖励

by 艾丽莎·戴维森
2024 年 5 月 03 日

在波动中机构对比特币 ETF 的兴趣增强

通过 13F 文件披露的信息显示,著名机构投资者涉足比特币 ETF,突显出人们越来越接受......

了解更多

宣判日到来:美国法院考虑司法部的认罪,CZ 的命运悬而未决

赵长鹏将于今天在西雅图的美国法院接受宣判。

了解更多
加入我们的创新技术社区
了解更多
查看更多
Injective 与 AltLayer 联手为 inEVM 带来重新抵押安全性
企业 新闻报道 专业技术
Injective 与 AltLayer 联手为 inEVM 带来重新抵押安全性
2024 年 5 月 3 日
Masa 与 Teller 合作推出 MASA 借贷池,支持 USDC 借贷
市场 新闻报道 专业技术
Masa 与 Teller 合作推出 MASA 借贷池,支持 USDC 借贷
2024 年 5 月 3 日
Velodrome 将在未来几周内推出 Superchain Beta 版本,并在 OP 堆栈第 2 层区块链上进行扩展
市场 新闻报道 专业技术
Velodrome 将在未来几周内推出 Superchain Beta 版本,并在 OP 堆栈第 2 层区块链上进行扩展
2024 年 5 月 3 日
CARV 宣布与 Aethir 合作,以分散其数据层并分配奖励
企业 新闻报道 专业技术
CARV 宣布与 Aethir 合作,以分散其数据层并分配奖励
2024 年 5 月 3 日