Tudósítást Technológia
November 17, 2022

A Google bevezetett egy mesterséges intelligencia modellt a hírcikkek illusztrálására

Röviden

A Google új mesterséges intelligencia-modellt jelent be a hírcikkek kiváló minőségű vizuális összefoglalóinak elkészítéséhez

A Google-nak bejelentés egy új mesterséges intelligencia (AI) modell, amely szerinte automatikusan képes "koherens és gördülékeny" vizuális összefoglalókat generálni a hírcikkekről. A technológiai óriás azt állítja, hogy a modell segíthet abban, hogy az információkat jobban hozzáférhetővé tegye a felhasználók számára generáló hosszú szövegrészek „jó minőségű” vizuális összefoglalásai.

A Google bevezetett egy mesterséges intelligencia modellt a hírcikkek illusztrálására
által készített kép Stable Diffusion

A modell egy transzformátorként ismert mélytanulási algoritmuson alapul, amelyet úgy terveztek, hogy „megértse” egy mondat kontextusát, majd olyan illusztrációt generáljon, amely megtartja az eredeti szövegből származó fontos információkat.

A Google teljesíti azt a sokkal nagyobb kihívást jelentő feladatot, hogy megértse a teljes szöveg kontextusát, ellentétben a jelenleg népszerű szöveg-kép rendszerek, amelyek a „mit látok, arról rajzolok” elv „frontális” ábrázolásán alapulnak. Ezen túlmenően, a képeket úgy választják meg, hogy egy „kép egészét” hozzon létre, nem pedig egyedi kijelentéseket és kifejezéseket (mint ahogy azt jelenleg mindenki teszi). Más szóval, a képeket a teljes cikkhez választjuk, miközben figyelembe veszik a kontextust és a jelentéseket.

A Google szerint a modell több mondat összefoglalását is képes generálni egy hírcikkből, és ez így is volt nagy adathalmazra képezték ki NewsStories, amely csaknem 31 millió cikket, 22 millió fényképet és 1 millió videót tartalmaz a bokrok között.

Ebben a projektben egy vadonatúj kihívás elé nézünk: vizuális összefoglalókat készítünk, amelyek hosszabb szövegek, amelyeket képgyűjtemény kísér. Két MIL (Multiple Instance Learning) részfeladat elsajátításával a cél az egyes cikkek és a bemeneti fotók közötti szemantikai hasonlóság maximalizálása.

Az első lépés az, hogy a képet a teljes cikkhez illessze, miután a nyelvi és képkódolók segítségével lefordították a megfelelő reprezentációkra.

A második lépésben egy szöveges cikket külön mondatokra kell osztani, és minden mondatot más-más reprezentációba kell kódolni. A cél a kölcsönös információ optimalizálása, defined a valószínűségi eloszlások szempontjából, a kép- és szövegsorozatok között. Ennek eredményeként a legnagyobb pontosságot sikerült elérni.

A Google bevezetett egy mesterséges intelligencia modellt a hírcikkek illusztrálására
által készített kép Stable Diffusion

Összefoglalva, ez a tanulmány sokrétű hozzájárulást ad, az olyan alkalmazásoktól kezdve, mint az automatizált narratív illusztráció, egészen a történet és az illusztrációk gyűjteményének összeegyeztetésének kihívásaiig. A cég szerint a modell más nyelvekre is alkalmazható, és azon dolgozik, hogy az adatkészletet más webhelyekről származó cikkekkel is bővítse.

Olvasson további kapcsolódó cikkeket:

A felelősség megtagadása

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

További cikkek
Damir Jalalov
Damir Jalalov

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

A volatilitás közepette nő az intézményi étvágy a Bitcoin ETF-ek felé

A 13F bejelentéseken keresztül közzétett információk jelentős intézményi befektetőket tárnak fel a Bitcoin ETF-ek iránt, ami alátámasztja a ...

Tudjon meg többet

Elérkezett az ítélethirdetés napja: CZ sorsa egyensúlyban van, mivel az Egyesült Államok bírósága mérlegeli a DOJ kérelmét

Changpeng Zhao ítéletet vár ma egy seattle-i amerikai bíróságon.

Tudjon meg többet
Csatlakozzon innovatív technológiai közösségünkhöz
KATT ide
Tovább
A Binance beszünteti a BIDR-termékek és -szolgáltatások támogatását, azt tanácsolja a felhasználóknak, hogy augusztus 20. előtt konvertálják át pénzüket
piacok Tudósítást Technológia
A Binance beszünteti a BIDR-termékek és -szolgáltatások támogatását, azt tanácsolja a felhasználóknak, hogy augusztus 20. előtt konvertálják át pénzüket
May 6, 2024
Biztonsági feltörés éri a Fantom ökoszisztéma GNUS.AI-ját, és 1.27 millió dolláros veszteséget okoz
piacok Tudósítást Technológia
Biztonsági feltörés éri a Fantom ökoszisztéma GNUS.AI-ját, és 1.27 millió dolláros veszteséget okoz
May 6, 2024
2024. május kriptográfiai áttörése: Bitgert Coin diadala
Tudósítást
2024. május kriptográfiai áttörése: Bitgert Coin diadala
May 6, 2024
A Bitcoin Network 1 évvel a bevezetése után meghaladja az XNUMX milliárd tranzakciót
piacok Tudósítást Technológia
A Bitcoin Network 1 évvel a bevezetése után meghaladja az XNUMX milliárd tranzakciót
May 6, 2024
CRYPTOMERIA LABS PTE. KFT.