A Google bevezetett egy mesterséges intelligencia modellt a hírcikkek illusztrálására
Röviden
A Google új mesterséges intelligencia-modellt jelent be a hírcikkek kiváló minőségű vizuális összefoglalóinak elkészítéséhez
A Google-nak bejelentés egy új mesterséges intelligencia (AI) modell, amely szerinte automatikusan képes "koherens és gördülékeny" vizuális összefoglalókat generálni a hírcikkekről. A technológiai óriás azt állítja, hogy a modell segíthet abban, hogy az információkat jobban hozzáférhetővé tegye a felhasználók számára generáló hosszú szövegrészek „jó minőségű” vizuális összefoglalásai.
A modell egy transzformátorként ismert mélytanulási algoritmuson alapul, amelyet úgy terveztek, hogy „megértse” egy mondat kontextusát, majd olyan illusztrációt generáljon, amely megtartja az eredeti szövegből származó fontos információkat.
A Google teljesíti azt a sokkal nagyobb kihívást jelentő feladatot, hogy megértse a teljes szöveg kontextusát, ellentétben a jelenleg népszerű szöveg-kép rendszerek, amelyek a „mit látok, arról rajzolok” elv „frontális” ábrázolásán alapulnak. Ezen túlmenően, a képeket úgy választják meg, hogy egy „kép egészét” hozzon létre, nem pedig egyedi kijelentéseket és kifejezéseket (mint ahogy azt jelenleg mindenki teszi). Más szóval, a képeket a teljes cikkhez választjuk, miközben figyelembe veszik a kontextust és a jelentéseket.
A Google szerint a modell több mondat összefoglalását is képes generálni egy hírcikkből, és ez így is volt nagy adathalmazra képezték ki NewsStories, amely csaknem 31 millió cikket, 22 millió fényképet és 1 millió videót tartalmaz a bokrok között.
Az első lépés az, hogy a képet a teljes cikkhez illessze, miután a nyelvi és képkódolók segítségével lefordították a megfelelő reprezentációkra.
A második lépésben egy szöveges cikket külön mondatokra kell osztani, és minden mondatot más-más reprezentációba kell kódolni. A cél a kölcsönös információ optimalizálása, defined a valószínűségi eloszlások szempontjából, a kép- és szövegsorozatok között. Ennek eredményeként a legnagyobb pontosságot sikerült elérni.
Összefoglalva, ez a tanulmány sokrétű hozzájárulást ad, az olyan alkalmazásoktól kezdve, mint az automatizált narratív illusztráció, egészen a történet és az illusztrációk gyűjteményének összeegyeztetésének kihívásaiig. A cég szerint a modell más nyelvekre is alkalmazható, és azon dolgozik, hogy az adatkészletet más webhelyekről származó cikkekkel is bővítse.
Olvasson további kapcsolódó cikkeket:
A felelősség megtagadása
Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.
A szerzőről
Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján.
További cikkekDamir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján.