新闻报道 专业技术
2023 年 3 月 16 日

GPT-4 继承了早期的“幻觉”事实和推理错误 GPT 型号

简单来说

OpenAI 说 GPT-4 与之前有类似的限制 GPT 模型.

GPT-4 仍然对事实产生幻觉并犯推理错误。

然而, GPT-4 分数比高出40% OpenAI最新 GPT-3.5 关于公司内部的对抗性事实评估。

GPT-4 继承了早期的“幻觉”事实和推理错误 GPT 型号

OpenAI 已警告用户其最新的语言模型, GPT-4,仍然不完全可靠,可能会“幻觉”事实并犯推理错误。 该公司敦促用户在使用语言模型输出时务必谨慎,尤其是在“高风险环境”中。

但是,好消息是 GPT-4 与之前的模型相比,显着减少了幻觉。 OpenAI 声称 GPT-4 比最新分数高出40% GPT-3.5 关于内部对抗性事实评估。 

通过 OpenAI

“我们在 TruthfulQA 等外部基准方面取得了进展,该基准测试模型将事实与对抗性选择的一组不正确陈述分开的能力。 这些问题与事实上不正确的答案相结合,但在统计上很有吸引力。” OpenAI 写道 博客文章.

尽管有这种改进,但该模型仍然缺乏对 2021 年 XNUMX 月之后发生的事件的了解,有时会像早期模型一样犯简单的推理错误。 此外,它在接受用户明显的虚假陈述时可能过于轻信,并在难题上失败,例如在其代码中引入安全漏洞。 它也不会对其提供的信息进行事实核查。

像它的前辈一样 GPT-4 可能会生成有害的建议、有缺陷的代码或不准确的信息。 然而,该模型的附加功能导致了需要理解的新风险面。 为了评估这些风险的程度, 50多名专家 来自人工智能一致性风险、网络安全、生物风险、信任与安全以及国际安全等各个领域的专家参与了该模型的对抗性测试。 然后他们的反馈和数据被用来改进模型,例如收集额外的数据来增强 GPT-4能够拒绝有关如何合成危险化学品的请求。

主要途径之一 OpenAI 减少有害输出的方法是在 RLHF(人类反馈强化学习)训练期间纳入额外的安全奖励信号。 该信号训练模型拒绝有害内容的请求,如 defi由模型的使用指南指定。 奖励由 GPT-4 零样本分类器,根据安全相关提示判断安全边界和完成方式。

OpenAI 还表示,与之前相比,该模型对禁止内容请求的响应倾向降低了 82% GPT-3.5和 GPT-4 根据公司政策响应医疗建议和自残等敏感请求的频率提高了 29%。

通过 OpenAI

而 OpenAI的干预增加了引发不良行为的难度 GPT-4,这仍然是可能的,并且仍然存在可以生成违反使用指南的内容的越狱。 

“随着人工智能系统变得越来越普遍,在这些干预措施中实现高度的可靠性将变得越来越重要。 目前,必须通过监控滥用等部署时安全技术来补充这些限制,”该公司补充道。

OpenAI 正在与外部研究人员合作,以更好地了解和评估潜在影响 GPT-4 及其后继型号。 该团队还在开发对未来人工智能系统中可能出现的危险能力的评估。 随着他们继续研究潜在的社会和 经济影响 of GPT-4 和其他人工智能系统, OpenAI 将适时与公众分享他们的发现和见解。

了解更多:

标签:

免责声明

在与行 信托项目指南,请注意,本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。 重要的是,仅投资您可以承受损失的金额,并在有任何疑问时寻求独立的财务建议。 如需了解更多信息,我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告,但市场状况如有变更,恕不另行通知。

关于作者

辛迪是一名记者 Metaverse Post,涵盖相关主题 web3, NFT、元宇宙和人工智能,重点是采访 Web3 行业参与者。她曾与 30 多位 C 级高管进行过交谈,并将他们的宝贵见解带给读者。辛迪来自新加坡,现居住在格鲁吉亚第比利斯。她拥有南澳大利亚大学传播与媒体研究学士学位,并拥有十年的新闻和写作经验。通过以下方式与她联系 [电子邮件保护] 有新闻发布会、公告和采访机会。

更多文章
辛迪谭
辛迪谭

辛迪是一名记者 Metaverse Post,涵盖相关主题 web3, NFT、元宇宙和人工智能,重点是采访 Web3 行业参与者。她曾与 30 多位 C 级高管进行过交谈,并将他们的宝贵见解带给读者。辛迪来自新加坡,现居住在格鲁吉亚第比利斯。她拥有南澳大利亚大学传播与媒体研究学士学位,并拥有十年的新闻和写作经验。通过以下方式与她联系 [电子邮件保护] 有新闻发布会、公告和采访机会。

Hot Stories

Scroll 完成伯努利主网升级,预计交易成本降低 10 倍

by 艾丽莎·戴维森
2024 年 4 月 29 日

OKX Jumpstart 上线 Runecoin,支持 BTC 质押赚取 RUNE 代币

by 艾丽莎·戴维森
2024 年 4 月 29 日
加入我们的时事通讯。
最新消息

Scroll 完成伯努利主网升级,预计交易成本降低 10 倍

by 艾丽莎·戴维森
2024 年 4 月 29 日

OKX Jumpstart 上线 Runecoin,支持 BTC 质押赚取 RUNE 代币

by 艾丽莎·戴维森
2024 年 4 月 29 日

DOGE 狂热:分析狗狗币 (DOGE) 最近的价值飙升

加密货币行业正在迅速扩张,模因币正在为大幅上涨做好准备。狗狗币(DOGE),...

了解更多

元宇宙中人工智能生成内容的演变

生成式人工智能内容的出现是虚拟环境中最令人着迷的发展之一......

了解更多
加入我们的创新技术社区
了解更多
查看更多
Scroll 完成伯努利主网升级,预计交易成本降低 10 倍
新闻报道 专业技术
Scroll 完成伯努利主网升级,预计交易成本降低 10 倍
2024 年 4 月 29 日
OKX Jumpstart 上线 Runecoin,支持 BTC 质押赚取 RUNE 代币
市场 新闻报道 专业技术
OKX Jumpstart 上线 Runecoin,支持 BTC 质押赚取 RUNE 代币
2024 年 4 月 29 日
本周的热门交易以及人工智能、IT 领域的主要投资 Web3和加密货币 (22-26.04)
消化 企业 市场 专业技术
本周的热门交易以及人工智能、IT 领域的主要投资 Web3和加密货币 (22-26.04)
2024 年 4 月 26 日
Vitalik Buterin 对 PoW 中心化发表评论,指出这只是 PoS 之前的临时阶段
新闻报道 专业技术
Vitalik Buterin 对 PoW 中心化发表评论,指出这只是 PoS 之前的临时阶段
2024 年 4 月 26 日