新闻报道 专业技术
2023 年 5 月 10 日

专家警告不要“恶意插入”人工智能数据集 ChatGPT

简单来说

ChatGPT 是潜在的 脆弱 由于训练数据。

据研究人员称,在美国仅需 60 美元,我们就可以在 0.01 年破坏 400% 的 LAION-700 或 COYO-2022 数据集。

ChatGPT 技术正变得越来越流行,但最近 研究 表明该技术可能由于其使用的训练数据而容易受到攻击。 随着模型变得越来越复杂,数据集越来越大,恶意行为者可以利用此漏洞来操纵数据集并导致机器学习模型产生不准确的结果。

专家警告不要“恶意插入”人工智能数据集 ChatGPT
@Midjourney / 塔塔玛塔拉塔#9861
推荐: 预测的十大最有前途的股票 ChatGPT (AI) 2023 年表现将超越世界领先基金

主要问题是聊天机器人数据库通常是“有条件验证”的数据集,这意味着在没有广泛验证的情况下对数据有一定程度的信任。 换句话说,这些数据集通常可能存在未被考虑的潜在问题。 尽管数据集的验证通常由于其规模大而不会执行,但恶意行为者有可能操纵这些数据。

事实上,研究人员建议,到 2022 年,攻击者可能会花费大约 60 美元来毒害 0.01% 的 LAION-400 或 COYO-700 数据集。 虽然这听起来不多,但如果不加以控制,恶意行为者可能会利用这些中毒数据谋取私利。 恶意数据最终可以 泄漏 进入更大的数据集,破坏数据质量并导致不可靠的机器学习模型。

有必要采取措施保护数据库免受恶意数据的侵害。 聚合多个数据源应该成为聊天机器人的标准 训练数据集 以确保数据可靠和准确。 此外,公司应该对数据集进行试验,以确保它们不会受到恶意行为者的攻击。

带有恶意代码的 AI 聊天机器人容易受到黑客攻击

聊天机器人中恶意代码的威胁可能非常严重; 恶意代码可用于窃取用户数据,允许对服务器进行恶意访问,并允许恶意活动,例如 洗钱 或数据泄露。 如果 AI 聊天机器人接受了带有恶意插入的数据的训练,它可能会在不知不觉中将恶意代码注入其响应中,并在不知不觉中被用作恶意获利的工具。

恶意行为者有可能通过有意或无意地将恶意代码引入到系统中来利用此漏洞 训练数据. 此外,由于 AI 聊天机器人从提供给它的数据中学习,这也可能导致它们学习错误的响应甚至恶意行为。

@Midjourney / 塔塔玛塔拉塔#9861

人工智能聊天机器人可能面临的另一个危险是“过度拟合”。 这是当预测模型在给定的数据上训练得太紧密时,从而导致在呈现新数据时预测不佳。 这可能是一个特殊的问题,因为 人工智能聊天机器人 随着对数据的熟悉,受过恶意代码训练的人可能会更有效地将恶意代码注入到他们的响应中。

必须意识到风险并采取预防措施以保证用于教学的培训数据 ChatGPT 是安全可靠的,以防止这些潜在的弱点。 用于训练的初始数据也必须保持独立和唯一; 宣传“恶意插入”不得与其他来源冲突或重叠。 如果“捕获”多个已确认的域对于验证数据是可行的,则应对其进行检查并与其他域进行比较。

聊天机器人技术有望改变人们进行人际讨论的方式。 但在充分发挥其潜力之前,它需要得到改进和保护。 聊天机器人的数据集需要经过仔细检查并准备好抵御恶意行为者。 通过这样做,我们可以确保我们充分利用技术的潜力并不断推动 范围 的人工智能。

阅读有关人工智能的更多信息:

免责声明

在与行 信托项目指南,请注意,本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。 重要的是,仅投资您可以承受损失的金额,并在有任何疑问时寻求独立的财务建议。 如需了解更多信息,我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告,但市场状况如有变更,恕不另行通知。

关于作者

Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。 

更多文章
达米尔亚拉洛夫
达米尔亚拉洛夫

Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。 

Hot Stories
加入我们的时事通讯。
最新消息

DOGE 狂热:分析狗狗币 (DOGE) 最近的价值飙升

加密货币行业正在迅速扩张,模因币正在为大幅上涨做好准备。狗狗币(DOGE),...

了解更多

元宇宙中人工智能生成内容的演变

生成式人工智能内容的出现是虚拟环境中最令人着迷的发展之一......

了解更多
加入我们的创新技术社区
了解更多
查看更多
本周的热门交易以及人工智能、IT 领域的主要投资 Web3和加密货币 (22-26.04)
消化 企业 市场 专业技术
本周的热门交易以及人工智能、IT 领域的主要投资 Web3和加密货币 (22-26.04)
2024 年 4 月 26 日
Vitalik Buterin 对 PoW 中心化发表评论,指出这只是 PoS 之前的临时阶段
新闻报道 专业技术
Vitalik Buterin 对 PoW 中心化发表评论,指出这只是 PoS 之前的临时阶段
2024 年 4 月 26 日
Offchain 实验室在 Optimism 的 OP Stack 欺诈证明中发现了两个关键漏洞
新闻报道 软件 专业技术
Offchain 实验室在 Optimism 的 OP Stack 欺诈证明中发现了两个关键漏洞
2024 年 4 月 26 日
Dymension 用于桥接 RollApps eIBC 流动性的开放市场在主网上启动
新闻报道 专业技术
Dymension 用于桥接 RollApps eIBC 流动性的开放市场在主网上启动 
2024 年 4 月 26 日