Adaption 的 AutoScientist 通过闭环训练自动进行模型微调,其性能优于人工设计的配置。
简单来说
Adaption 推出了 AutoScientist 系统,该系统通过优化训练数据和学习过程,自动定制 AI 模型以完成特定任务。

适应性由前Cohere公司研究副总裁Sara Hooker创立的人工智能初创公司推出了一款名为AutoScientist的新系统。该系统旨在通过联合优化训练数据和学习配置,实现人工智能模型针对特定任务的自动化定制过程。该系统被视为人工智能研发工作流程自动化的重要一步,旨在减少模型微调和实验中通常所需的人工工作量。
AutoScientist 被描述为一个端到端的框架,它能够同时优化数据集和训练方案,并通过一个闭环迭代运行,持续调整数据选择和模型训练参数。该过程旨在持续进行,直到性能稳定在某个特定值附近。 defined 目标,有效地让系统能够在无需不断人工干预的情况下改进模型学习的内容和学习方式。
据该公司称,该工具旨在缩短从初始概念到部署定制模型所需的时间,有望将开发周期从数周缩短至数小时。它还被宣传为一种机制,能够让机器学习专家以外的用户也能参与模型定制,使不具备深厚技术专长的用户不仅能够影响提示信息,还能影响已训练系统的底层行为。该方法尤其适用于那些希望针对特定领域语言、结构化输出或延迟和成本等效率限制来微调模型,同时更有效地利用人工智能系统中专有数据集的组织。
公司内部评估结果显示,AutoScientist 在 5,000 到 100,000 个样本的不同数据集规模下,以及在多种可用于微调的模型架构上,均展现出优于基准模型的性能。报告结果表明,无论应用领域如何,性能提升都十分显著,这些性能是通过针对特定垂直应用定制的内部评估方法测得的。
评估框架中提供的进一步比较表明,AutoScientist 的平均性能优于人类研究人员(包括经验丰富的 AI 工程师)设计的配置。在这些测试中,人类专家根据他们对模型架构、数据集特征和领域需求的了解来选择训练设置,而 AutoScientist 则拥有相同的输入,并能够利用历史运行数据迭代优化自身的配置。在这些条件下,使用该自动化系统后,总体结果从 48% 提高到 64%,所有实验的平均性能提升约为 35%。
AutoScientist展现跨领域稳定性,同时致力于普及前沿模型微调
针对多个应用领域的额外基准测试表明,该系统对特定领域并不十分敏感,在八个不同的垂直领域均取得了性能提升。该公司表示,考虑到许多传统的微调方法在特定或精心设计的场景之外往往表现不佳,而 AutoScientist 据称能够在各种任务和数据集上提供更稳定的性能提升,因此这种一致性尤为值得关注。
该系统是旨在实现模型开发流程自动化的更广泛计划的一部分,尤其是在涉及长时程推理的领域,而长时程推理一直是人工智能可靠性方面的一大挑战。开发人员表示,AutoScientist 代表着在减少模型训练流程中人工干预需求方面迈出的早期一步,未来的研究方向将侧重于实现更直接的适应方式,这些方式可能不需要传统的训练周期。
除了技术目标之外,此次发布也旨在扩大模型定制的访问权限,使更多用户能够针对特定应用定制人工智能系统。该工具将免费提供30天。根据官方的说法,其更广泛的目标是降低人工智能模型开发的门槛,并使创建定制系统的能力不再局限于少数集中在大型实验室的专业研究人员。
公告中强调的一个关键背景论点是,全球只有少数人掌握着训练和优化前沿人工智能模型所需的专业知识,而这些知识大多集中在少数几家大型研究实验室中。公告指出,如果像 AutoScientist 这样的系统能够成功地自动化部分专业知识,那么为特定组织和特定用例构建定制模型的过程将变得更加便捷和切实可行。
免责声明
在与行 信托项目指南,请注意,本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。 重要的是,仅投资您可以承受损失的金额,并在有任何疑问时寻求独立的财务建议。 如需了解更多信息,我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告,但市场状况如有变更,恕不另行通知。
关于作者
Alisa,一名热心记者 MPost专注于加密货币、人工智能、投资以及广阔的领域 Web3。她对新兴趋势和技术有着敏锐的洞察力,提供全面的报道,让读者了解和吸引读者了解不断发展的数字金融领域。
更多文章
Alisa,一名热心记者 MPost专注于加密货币、人工智能、投资以及广阔的领域 Web3。她对新兴趋势和技术有着敏锐的洞察力,提供全面的报道,让读者了解和吸引读者了解不断发展的数字金融领域。



