Stability AI的 StableVicuna 是第一个经过人类反馈训练的聊天机器人
简单来说
Stability AI 发布了 StableVicuna,这是第一个大规模开源聊天机器人,它使用带有人类反馈的强化学习 (RLHF)。
StableVicuna 基于 Vicuna 聊天机器人,使用 13 亿个参数 LLaMA 模型。
Stability AI 具有 介绍 其在 AI 领域的最新突破是 StableVicuna,这是第一个经过人类反馈训练的大型开源聊天机器人。 创新的聊天机器人是 Stability AI,创建流行的开源图像模型的公司, Stable Diffusion,以及最新的AI图像生成算法, 深弗洛伊德.
StableVicuna 基于 13 月份发布的 Vicuna 聊天机器人,使用了 XNUMX 亿个参数 LLaMA 模型。 是什么决定了骆马毛变种 Stability AI 与 Carper AI 的不同之处在于它使用了带有人类反馈的强化学习 (RLHF)。 该方法使得模型能够不断改进。
Stability AI 表明聊天机器人的成功归因于两种训练方法类型:指令微调和通过人类反馈进行强化学习。 然而,大多数现有的聊天机器人模型仅使用其中一种方法,而不是同时使用两种方法。 最近,RLHF 训练的数据集已公开。 因此,连同用户友好的培训工具,这使得 StableVicuna 的创建成为可能,这是第一个大规模的 聊天机器人模型 包含这两种类型的培训。
StableVicuna 结合了文本生成、简单的数学函数和编写代码的能力。 它与通用基准测试中的其他开源聊天机器人相当。
根据 解码器,使用其他聊天机器人的数据进行微调的开源聊天机器人有可能通过重复训练放大现有的错误和偏见,从而导致回声室效应。 微调数据还可以通过引入原始模型中不存在的信息来加剧幻觉。
用户可以访问聊天机器人的演示 拥抱脸. 该公司还披露了未来通过聊天界面提供 StableVicuna 的计划。
了解更多:
免责声明
在与行 信托项目指南,请注意,本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。 重要的是,仅投资您可以承受损失的金额,并在有任何疑问时寻求独立的财务建议。 如需了解更多信息,我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告,但市场状况如有变更,恕不另行通知。
关于作者
Agne 是一名记者,负责报道虚拟宇宙、人工智能和人工智能领域的最新趋势和发展。 Web3 行业为 Metaverse Post。 她对讲故事的热情促使她对这些领域的专家进行了大量采访,总是试图发现令人兴奋和引人入胜的故事。 Agne 拥有文学学士学位,在旅行、艺术和文化等广泛主题的写作方面拥有丰富的背景。 她还志愿担任动物权利组织的编辑,帮助提高人们对动物福利问题的认识。 联系她 [电子邮件保护].
更多文章Agne 是一名记者,负责报道虚拟宇宙、人工智能和人工智能领域的最新趋势和发展。 Web3 行业为 Metaverse Post。 她对讲故事的热情促使她对这些领域的专家进行了大量采访,总是试图发现令人兴奋和引人入胜的故事。 Agne 拥有文学学士学位,在旅行、艺术和文化等广泛主题的写作方面拥有丰富的背景。 她还志愿担任动物权利组织的编辑,帮助提高人们对动物福利问题的认识。 联系她 [电子邮件保护].