Nyheds rapport Teknologier
November 17, 2022

Google introducerede en AI-model til at illustrere nyhedsartikler

Kort sagt

Google annoncerer ny AI-model til fremstilling af højkvalitets visuelle resuméer af nyhedsartikler

Google har annoncerede en ny kunstig intelligens (AI) model, som den siger automatisk kan generere "sammenhængende og flydende" visuelle opsummeringer af nyhedsartikler. Teknologigiganten siger, at modellen kan hjælpe med at gøre information mere tilgængelig for brugerne ved generere Visuelle opsummeringer af "høj kvalitet" af lange tekststykker.

Google introducerede en AI-model til at illustrere nyhedsartikler
Billedet skabt af Stable Diffusion

Modellen er baseret på en deep learning-algoritme kendt som en transformer, som er designet til at "forstå" konteksten af ​​en sætning og derefter generere en illustration, der bevarer den vigtige information fra den originale tekst.

Google udfører den meget mere udfordrende opgave at forstå den overordnede kontekst af hele teksten, i modsætning til den i øjeblikket populære tekst-til-billede systemer, som er baseret på en "frontal" skildring af princippet "hvad jeg ser, tegner jeg om". Derudover er valget af billeder lavet for at skabe et "billede som helhed" frem for individuelle udsagn og sætninger (som praktisk talt alle gør lige nu). Med andre ord vælges billeder til hele artiklen, mens der tages hensyn til sammenhænge og betydninger.

Google siger, at modellen kan generere opsummeringer af flere sætninger fra en nyhedsartikel, og at den har været det trænet på et stort datasæt NewsStories, som indeholder næsten 31 millioner artikler, 22 millioner fotografier og 1 million videoer gemt væk i buskene.

I dette projekt tager vi fat på en helt ny udfordring: at skabe visuelle resuméer, som er længere tekster ledsaget af en samling billeder. Ved at mestre to MIL-underopgaver (Multiple Instance Learning) er målet at maksimere den semantiske lighed mellem hver artikel og inputbillederne.

Det første trin er at matche billedet med den komplette artikel, efter at det er blevet oversat til de rigtige repræsentationer ved hjælp af både sprog- og billedkoderne.

Det andet trin indebærer opdeling af en tekstartikel i separate sætninger og indkodning af hver sætning til en anden repræsentation. Målet er at optimere den gensidige information, defined i form af sandsynlighedsfordelinger, mellem billed- og tekstsekvenser. Den største præcision blev opnået som resultat.

Google introducerede en AI-model til at illustrere nyhedsartikler
Billedet skabt af Stable Diffusion

Som konklusion giver denne undersøgelse en række bidrag, fra applikationer som automatiseret narrativ illustration til den udfordrende opgave at matche en historie og en samling af illustrationer. Virksomheden siger model også kan anvendes på andre sprog, og at den arbejder på at udvide datasættet til at omfatte artikler fra andre sider.

Læs flere relaterede artikler:

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Flere artikler
Damir Yalalov
Damir Yalalov

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Hot Stories
Tilmeld dig vores nyhedsbrev.
Seneste Nyheder

Stilheden før Solana-stormen: Hvad diagrammer, hvaler og signaler på kæden siger nu

Solana har vist stærke resultater, drevet af stigende implementering, institutionel interesse og vigtige partnerskaber, samtidig med at den står over for potentielle ...

Vide mere

Krypto i april 2025: Vigtigste tendenser, ændringer og hvad der kommer bagefter

I april 2025 fokuserede kryptomarkedet på at styrke kerneinfrastrukturen, hvor Ethereum forberedte sig på Pectra ...

Vide mere
Læs mere
Læs mere
AILO AI og MBK Holding etablerer Qatars første fortrolige AI-fabrik, hvor OLLM sikrer op til 35 MW computerkapacitet.
Forretning Nyheds rapport Teknologier
AILO AI og MBK Holding etablerer Qatars første fortrolige AI-fabrik, hvor OLLM sikrer op til 35 MW computerkapacitet.
11. December, 2025
HSC Asset Management 2025 forbinder krypto- og institutionelle aktiver i Abu Dhabi
Hack sæsoner Lifestyle Markeder Nyheds rapport Teknologier
HSC Asset Management 2025 forbinder krypto- og institutionelle aktiver i Abu Dhabi
10. December, 2025
Bybit offentliggør verdensranglister over kryptovalutaer 2025: Fremhæver hvem der fører an i den globale kryptoadoption
Nyheds rapport Teknologier
Bybit offentliggør verdensranglister over kryptovalutaer 2025: Fremhæver hvem der fører an i den globale kryptoadoption
10. December, 2025
Gate Ventures støtter Goblin Finance med 1 million dollars til at fremme Aptos' afkastlag
Forretning Nyheds rapport Teknologier
Gate Ventures støtter Goblin Finance med 1 million dollars til at fremme Aptos' afkastlag
10. December, 2025