Databricks 发布 Dolly 2.0,第一个商用开源 12B Chat-LLM
简单来说
Databricks 宣布推出 Dolly 2.0 作为第一个商用开源 12B Chat-LLM,使公司能够创建强大的语言模型,而无需投资昂贵的 GPU 集群。
Databricks 有 公布 推出 Dolly 2.0 作为第一个商用开源 12B Chat-LLM。 Dolly 是机器学习行业的一项重大突破,它允许公司创建强大的语言模型——例如具有对话支持的自回归 LLM——而无需投资昂贵的 GPU 集群。
为了获得开源语言模型,Databricks 需要一个大型、高质量的数据集。 最初考虑过羊驼毛之后 GPT-3 由于数据集和其他不允许商业使用的开源数据集,他们决定构建自己的高质量数据集。 为此,他们雇用了 5,000 名员工,并要求他们编写几个示例,用于训练自回归法学硕士,使其能够简单地继续文本而不进行对话。 在巨大激励措施的帮助下,例如写出最佳示例的奖金,他们能够组建一个令人印象深刻的团队。 15,000 个样本数据集.
Databricks 迈出了下一步,并整合了 EleutherAI 的 Pythia-12B 具有 MIT 许可证的语言模型,并在他们自己的数据集上对其进行了重新训练,从而产生了 Dolly 2.0。 Dolly 2.0 已在 MIT 许可下发布,连同随附的代码。 随着 Dolly 2.0 的推出,机器学习行业现在有了一个强大的工具,可以以经济高效的方式创建强大的语言模型。 希望创建能够理解和处理复杂语言的强大应用程序的公司和个人都可以利用这一点。
总的来说,推出 多莉 2.0 作为第一个商用开源 12B Chat-LLM 是机器学习行业的一个重要里程碑。 通过利用 MIT 许可并创建自己的高质量数据集,Databricks 使公司和个人都可以使用强大的语言模型。 Dolly 2.0 将彻底改变行业,是机器学习向前迈出的重要一步。
用户现在正在等待开发人员将 Dolly 量化为 4 位并加速其在 CPU 上运行,以及 OpenAssistant 的回应,预计将在未来几天内提供他们的模型。
- NTIA 正在就可能的法规征求公众意见 监管人工智能系统 喜欢 ChatGPT 帮助拜登政府确保其按照承诺运作。 NTIA 发布了一份关于人工智能问责规则制定的声明,该声明可以防止未来发生事故并最大限度地减少假设威胁的风险。
阅读有关人工智能的更多信息:
免责声明
在与行 信托项目指南,请注意,本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。 重要的是,仅投资您可以承受损失的金额,并在有任何疑问时寻求独立的财务建议。 如需了解更多信息,我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告,但市场状况如有变更,恕不另行通知。
关于作者
Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。
更多文章Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。