谷歌推出了一種用於說明新聞文章的人工智能模型
簡單來說
谷歌宣布推出新的 AI 模型,用於生成高質量的新聞文章視覺摘要
谷歌有 宣布 一種新的人工智能 (AI) 模型,據稱可以自動生成“連貫流暢”的新聞文章視覺摘要。 這家科技巨頭表示,該模型可以幫助用戶更輕鬆地訪問信息 產生 長文本的“高質量”視覺摘要。
該模型基於一種稱為 transformer 的深度學習算法,旨在“理解”句子的上下文,然後生成保留原始文本重要信息的插圖。
谷歌完成了更具挑戰性的任務,即理解整個文本的整體上下文,與目前流行的 文字轉圖片 系統,這些系統基於對“所見即所得”原則的“正面”描述。 此外,圖像的選擇是為了創建一個“整體圖像”,而不是單獨的陳述和短語(實際上每個人現在都在做)。 換句話說,在考慮上下文和含義的同時為整篇文章選擇圖片。
谷歌表示,該模型可以從一篇新聞文章中生成多個句子的摘要,並且已經 在大型數據集上訓練 NewsStories,其中包含隱藏在灌木叢中的近 31 萬篇文章、22 萬張照片和 1 萬個視頻。
第一步是在使用語言和圖像編碼器將圖像翻譯成正確的表示後,將圖像與完整的文章進行匹配。
第二步需要將文本文章分成單獨的句子,並將每個句子編碼為不同的表示形式。 目標是優化互信息, defi根據圖像和文本序列之間的概率分佈來定義。 結果獲得了最大的精度。
總之,這項研究做出了各種貢獻,從自動敘事插圖等應用到匹配故事和插圖集的挑戰性任務。 該公司表示 模型 也可以應用於其他語言,並且它正在努力擴展數據集以包括來自其他站點的文章。
閱讀更多相關文章:
免責聲明
在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。
關於作者
Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。
更多文章Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。