Novinky Technika
Listopadu 17, 2022

Google představil model AI pro ilustraci zpravodajských článků

Stručně

Google oznamuje nový model umělé inteligence pro vytváření vysoce kvalitních vizuálních shrnutí zpravodajských článků

Google má oznámila, nový model umělé inteligence (AI), o kterém se říká, že dokáže automaticky generovat „souvislé a plynulé“ vizuální shrnutí zpravodajských článků. Technologický gigant říká, že tento model může pomoci zpřístupnit informace uživatelům generování „vysoce kvalitní“ vizuální shrnutí dlouhých textů.

Google představil model AI pro ilustraci zpravodajských článků
Obraz vytvořený uživatelem Stable Diffusion

Model je založen na algoritmu hlubokého učení známého jako transformátor, který je navržen tak, aby „pochopil“ kontext věty a poté vytvořil ilustraci, která zachová důležité informace z původního textu.

Google plní mnohem náročnější úkol, kterým je pochopení celkového kontextu celého textu, na rozdíl od aktuálně populárního převod textu na obrázek systémy, které jsou založeny na „frontálním“ zobrazení principu „co vidím, o tom kreslím“. Kromě toho je výběr obrázků proveden tak, aby vytvořil „obraz jako celek“ spíše než jednotlivé výroky a fráze (jak to nyní dělá prakticky každý). Jinými slovy, obrázky jsou vybírány pro celý článek, přičemž se berou v úvahu kontexty a významy.

Google říká, že model může generovat souhrny více vět ze zpravodajského článku a že tomu tak bylo natrénováno na velkém datovém souboru NewsStories, která obsahuje téměř 31 milionů článků, 22 milionů fotografií a 1 milion videí ukrytých v křoví.

V tomto projektu přijímáme zcela novou výzvu: vytváření vizuálních shrnutí, což jsou delší texty doprovázené kolekcí obrázků. Zvládnutím dvou dílčích úkolů MIL (Multiple Instance Learning) je cílem maximalizovat sémantickou podobnost mezi každým článkem a vstupními fotografiemi.

Prvním krokem je spárování obrázku s celým článkem poté, co byl přeložen do správných reprezentací pomocí kodéru jazyka i obrázku.

Druhý krok znamená rozdělení textového článku do samostatných vět a zakódování každé věty do jiné reprezentace. Cílem je optimalizace vzájemné informovanosti, defiz hlediska rozdělení pravděpodobnosti mezi obrazovými a textovými sekvencemi. Výsledkem byla nejvyšší přesnost.

Google představil model AI pro ilustraci zpravodajských článků
Obraz vytvořený uživatelem Stable Diffusion

Závěrem lze říci, že tato studie přináší různé příspěvky, od aplikací, jako je automatizovaná narativní ilustrace, až po náročný úkol sladit příběh a sbírku ilustrací. Společnost říká, že model lze použít i na jiné jazyky a že se pracuje na rozšíření datové sady tak, aby zahrnovala články z jiných webů.

Přečtěte si další související články:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility

Zveřejnění prostřednictvím podání 13F odhaluje, že pozoruhodní institucionální investoři fušují do bitcoinových ETF, což podtrhuje rostoucí akceptaci...

Vědět více

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Binance ukončí podporu pro produkty a služby BIDR, radí uživatelům převést prostředky do 20. srpna
Trhy Novinky Technika
Binance ukončí podporu pro produkty a služby BIDR, radí uživatelům převést prostředky do 20. srpna
6
Narušení bezpečnosti zasáhlo GNUS.AI Fantom Ecosystem, má za následek ztrátu 1.27 milionu USD
Trhy Novinky Technika
Narušení bezpečnosti zasáhlo GNUS.AI Fantom Ecosystem, má za následek ztrátu 1.27 milionu USD
6
Kryptoprůlom z května 2024: Bitgert Coin's Triumph
Novinky
Kryptoprůlom z května 2024: Bitgert Coin's Triumph
6
Síť bitcoinů překonala 1 miliardu transakcí, patnáct let po svém spuštění
Trhy Novinky Technika
Síť bitcoinů překonala 1 miliardu transakcí, patnáct let po svém spuštění
6
CRYPTOMERIA LABS PTE. LTD.