Google představil model AI pro ilustraci zpravodajských článků
Stručně
Google oznamuje nový model umělé inteligence pro vytváření vysoce kvalitních vizuálních shrnutí zpravodajských článků
Google má oznámila, nový model umělé inteligence (AI), o kterém se říká, že dokáže automaticky generovat „souvislé a plynulé“ vizuální shrnutí zpravodajských článků. Technologický gigant říká, že tento model může pomoci zpřístupnit informace uživatelům generování „vysoce kvalitní“ vizuální shrnutí dlouhých textů.
Model je založen na algoritmu hlubokého učení známého jako transformátor, který je navržen tak, aby „pochopil“ kontext věty a poté vytvořil ilustraci, která zachová důležité informace z původního textu.
Google plní mnohem náročnější úkol, kterým je pochopení celkového kontextu celého textu, na rozdíl od aktuálně populárního převod textu na obrázek systémy, které jsou založeny na „frontálním“ zobrazení principu „co vidím, o tom kreslím“. Kromě toho je výběr obrázků proveden tak, aby vytvořil „obraz jako celek“ spíše než jednotlivé výroky a fráze (jak to nyní dělá prakticky každý). Jinými slovy, obrázky jsou vybírány pro celý článek, přičemž se berou v úvahu kontexty a významy.
Google říká, že model může generovat souhrny více vět ze zpravodajského článku a že tomu tak bylo natrénováno na velkém datovém souboru NewsStories, která obsahuje téměř 31 milionů článků, 22 milionů fotografií a 1 milion videí ukrytých v křoví.
Prvním krokem je spárování obrázku s celým článkem poté, co byl přeložen do správných reprezentací pomocí kodéru jazyka i obrázku.
Druhý krok znamená rozdělení textového článku do samostatných vět a zakódování každé věty do jiné reprezentace. Cílem je optimalizace vzájemné informovanosti, defiz hlediska rozdělení pravděpodobnosti mezi obrazovými a textovými sekvencemi. Výsledkem byla nejvyšší přesnost.
Závěrem lze říci, že tato studie přináší různé příspěvky, od aplikací, jako je automatizovaná narativní ilustrace, až po náročný úkol sladit příběh a sbírku ilustrací. Společnost říká, že model lze použít i na jiné jazyky a že se pracuje na rozšíření datové sady tak, aby zahrnovala články z jiných webů.
Přečtěte si další související články:
Odmítnutí odpovědnosti
V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.
O autorovi
Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu.
Další článkyDamir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu.