新闻报道 专业技术
2023 年 6 月 21 日

研究人员发现了一种检测人工智能生成文本的新方法

简单来说

研究人员开发了一种使用 RoBERTa 模型检测 AI 生成文本的方法,该模型提取文本标记的嵌入并将它们可视化为多维空间中的点。

他们发现生成的文本 GPT-3.5型号,例如 ChatGPT 和达芬奇的文本的平均尺寸明显低于人类书写的文本。

研究人员创建了一种强大的基于维度的探测器,可以抵抗常见的规避技术。

当域和模型发生变化时,检测器的准确度始终保持较高水平,但在使用 DIPPER 技术时,阈值固定,准确度下降 40%。

研究人员研究了人工智能生成文本领域 开发了一种检测人工智能生成内容的方法 模型如 GPT 和 Llama. 他们利用分数维的概念发现了关于生成文本性质的有趣见解。 他们的发现揭示了人类编写的文本与人工智能模型生成的文本之间的内在差异。

研究人员发现了一种检测人工智能生成文本的新方法
信用: Metaverse Post (mpost.io)
阅读: AI 检测器可检测到的前 100 多个单词

从自然语言文本导出的点云的维度能否提供有关其起源的有用信息? 研究人员使用 RoBERTa 模型提取文本标记的嵌入并将它们可视化为多维空间中的点以对此进行研究。 他们使用受先前作品启发的复杂技术估计了这些点云的分数维。

研究人员惊讶地发现,由 GPT-3.5型号,例如 ChatGPT 和达芬奇的文本的平均尺寸明显低于人类书写的文本。 这种有趣的模式在各个领域都持续存在,甚至在替代模型(例如 GPT-2 或使用OPT。 值得注意的是,即使使用专门为避免检测而设计的 DIPPER 释义,尺寸也仅改变了约 3%。 这些发现使研究人员能够创建一个强大的基于维度的探测器,可以抵抗常见的规避技术。

值得注意的是,当领域和模型发生变化时,检测器的准确度始终保持较高水平。 在固定阈值的情况下,检测准确率(真阳性率)保持在75%以上,而假阳性率(FPR)保持在1%以下。 即使检测系统受到 DIPPER 技术的挑战,准确度也下降到 40%,优于现有检测器,包括由 OpenAI.

此外,研究人员还探索了多语言 RoBERTa 等多语言模型的应用。 这使得他们能够为英语以外的语言开发类似的检测器。 虽然嵌入的平均内部维度因不同语言而异,但对于每种特定语言,生成文本的维度始终低于人类编写的文本。

然而,探测器表现出一些弱点,特别是在面临高生成温度和原始 发电机型号。 在较高温度下,生成文本的内部尺寸可能超过人类书写文本的内部尺寸,导致探测器失效。 幸运的是,这种发电机模型已经可以使用替代方法进行检测。 此外,研究人员承认,除了 RoBERTa 之外,还有探索提取文本嵌入的替代模型的空间。

区分人类和人工智能编写的文本

今年一月, OpenAI 公布 推出新的分类器,旨在区分人类编写的文本和人工智能系统生成的文本。 该分类器旨在解决由 AI 生成的内容越来越普遍所带来的挑战,例如错误信息宣传活动和学术不诚实行为。

虽然检测所有人工智能编写的文本是一项复杂的任务,但该分类器可以作为减少虚假声明的宝贵工具。 人工智能生成文本中的人类作者身份。 通过对一组英文文本的严格评估,开发人员发现分类器准确地将 26% 的 AI 编写的文本识别为“可能是 AI 编写的”(正确),同时偶尔会将人类编写的文本错误地标记为 AI 生成的(错误)积极)9%。 值得注意的是,分类器的可靠性随着输入文本长度的增加而提高。 与以前的分类器相比,这个新版本对最新人工智能系统生成的文本表现出明显更高的可靠性。

为了收集关于像这个分类器这样不完善的工具的有用性的宝贵反馈,开发人员制作了它 公开的。 您可以免费尝试我们正在进行的分类器。 然而,了解其局限性非常重要。 分类器应用作确定文本来源的补充工具,而不是主要决策资源。 它在短文本上表现出高度不可靠性,并且在某些情况下,人类编写的文本可能会被错误地标记为人工智能生成的。

值得注意的是,高度可预测的文本无法一致地识别,例如前 1,000 个素数的列表。 编辑人工智能生成的文本也可以帮助逃避分类器,虽然我们可以根据成功的攻击更新和重新训练分类器,但检测的长期优势仍然不确定。 此外,分类器基于 神经网络 通常在训练数据之外校准得很差,导致对与训练集显着不同的输入进行错误预测的极大信心。

免责声明

在与行 信托项目指南,请注意,本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。 重要的是,仅投资您可以承受损失的金额,并在有任何疑问时寻求独立的财务建议。 如需了解更多信息,我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告,但市场状况如有变更,恕不另行通知。

关于作者

Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。 

更多文章
达米尔亚拉洛夫
达米尔亚拉洛夫

Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。 

Hot Stories

Lisk 正式过渡到以太坊 Layer 2 并推出 Core v4.0.6

by 艾丽莎·戴维森
2024 年 5 月 08 日

2024 年 7 月新 Meme 币:加密货币爱好者的 XNUMX 个精选

by 维多利亚·帕尔奇克
2024 年 5 月 08 日
加入我们的时事通讯。
最新消息

Lisk 正式过渡到以太坊 Layer 2 并推出 Core v4.0.6

by 艾丽莎·戴维森
2024 年 5 月 08 日

2024 年 7 月新 Meme 币:加密货币爱好者的 XNUMX 个精选

by 维多利亚·帕尔奇克
2024 年 5 月 08 日

在波动中机构对比特币 ETF 的兴趣增强

通过 13F 文件披露的信息显示,著名机构投资者涉足比特币 ETF,突显出人们越来越接受......

了解更多

宣判日到来:美国法院考虑司法部的认罪,CZ 的命运悬而未决

赵长鹏将于今天在西雅图的美国法院接受宣判。

了解更多
加入我们的创新技术社区
了解更多
查看更多
Lisk 正式过渡到以太坊 Layer 2 并推出 Core v4.0.6
新闻报道 专业技术
Lisk 正式过渡到以太坊 Layer 2 并推出 Core v4.0.6
2024 年 5 月 8 日
2024 年 7 月新 Meme 币:加密货币爱好者的 XNUMX 个精选
消化 市场 专业技术
2024 年 7 月新 Meme 币:加密货币爱好者的 XNUMX 个精选
2024 年 5 月 8 日
Synternet 将 Peaq 集成到其数据层中,利用实时 DePIN 数据为事件驱动的 DApp 提供支持
企业 新闻报道 专业技术
Synternet 将 Peaq 集成到其数据层中,利用实时 DePIN 数据为事件驱动的 DApp 提供支持
2024 年 5 月 8 日
伊朗大规模加密货币挖矿活动对美国国家安全构成直接威胁,参议员敦促政府立即采取行动
市场 故事和评论 专业技术
伊朗大规模加密货币挖矿活动对美国国家安全构成直接威胁,参议员敦促政府立即采取行动
2024 年 5 月 8 日