谷歌推出了一种用于说明新闻文章的人工智能模型
简单来说
谷歌宣布推出新的 AI 模型,用于生成高质量的新闻文章视觉摘要
谷歌有 公布 一种新的人工智能 (AI) 模型,据称可以自动生成“连贯流畅”的新闻文章视觉摘要。 这家科技巨头表示,该模型可以帮助用户更轻松地访问信息 发电 长文本的“高质量”视觉摘要。
该模型基于一种称为 transformer 的深度学习算法,旨在“理解”句子的上下文,然后生成保留原始文本重要信息的插图。
谷歌完成了更具挑战性的任务,即理解整个文本的整体上下文,与目前流行的 文字转图片 系统,这些系统基于对“所见即所得”原则的“正面”描述。 此外,图像的选择是为了创建一个“整体图像”,而不是单独的陈述和短语(实际上每个人现在都在做)。 换句话说,在考虑上下文和含义的同时为整篇文章选择图片。
谷歌表示,该模型可以从一篇新闻文章中生成多个句子的摘要,并且已经 在大型数据集上训练 NewsStories,其中包含隐藏在灌木丛中的近 31 万篇文章、22 万张照片和 1 万个视频。
第一步是在使用语言和图像编码器将图像翻译成正确的表示后,将图像与完整的文章进行匹配。
第二步需要将文本文章分成单独的句子,并将每个句子编码为不同的表示形式。 目标是优化互信息, defi根据图像和文本序列之间的概率分布来定义。 结果获得了最大的精度。
总之,这项研究做出了各种贡献,从自动叙事插图等应用到匹配故事和插图集的挑战性任务。 该公司表示 模型 也可以应用于其他语言,并且它正在努力扩展数据集以包括来自其他站点的文章。
阅读更多相关文章:
免责声明
在与行 信托项目指南,请注意,本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。 重要的是,仅投资您可以承受损失的金额,并在有任何疑问时寻求独立的财务建议。 如需了解更多信息,我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告,但市场状况如有变更,恕不另行通知。
关于作者
Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。
更多文章Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。