Nyheds rapport Teknologier
November 17, 2022

Google introducerede en AI-model til at illustrere nyhedsartikler

Kort sagt

Google annoncerer ny AI-model til fremstilling af højkvalitets visuelle resuméer af nyhedsartikler

Google har annoncerede en ny kunstig intelligens (AI) model, som den siger automatisk kan generere "sammenhængende og flydende" visuelle opsummeringer af nyhedsartikler. Teknologigiganten siger, at modellen kan hjælpe med at gøre information mere tilgængelig for brugerne ved generere Visuelle opsummeringer af "høj kvalitet" af lange tekststykker.

Google introducerede en AI-model til at illustrere nyhedsartikler
Billedet skabt af Stable Diffusion

Modellen er baseret på en deep learning-algoritme kendt som en transformer, som er designet til at "forstå" konteksten af ​​en sætning og derefter generere en illustration, der bevarer den vigtige information fra den originale tekst.

Google udfører den meget mere udfordrende opgave at forstå den overordnede kontekst af hele teksten, i modsætning til den i øjeblikket populære tekst-til-billede systemer, som er baseret på en "frontal" skildring af princippet "hvad jeg ser, tegner jeg om". Derudover er valget af billeder lavet for at skabe et "billede som helhed" frem for individuelle udsagn og sætninger (som praktisk talt alle gør lige nu). Med andre ord vælges billeder til hele artiklen, mens der tages hensyn til sammenhænge og betydninger.

Google siger, at modellen kan generere opsummeringer af flere sætninger fra en nyhedsartikel, og at den har været det trænet på et stort datasæt NewsStories, som indeholder næsten 31 millioner artikler, 22 millioner fotografier og 1 million videoer gemt væk i buskene.

I dette projekt tager vi fat på en helt ny udfordring: at skabe visuelle resuméer, som er længere tekster ledsaget af en samling billeder. Ved at mestre to MIL-underopgaver (Multiple Instance Learning) er målet at maksimere den semantiske lighed mellem hver artikel og inputbillederne.

Det første trin er at matche billedet med den komplette artikel, efter at det er blevet oversat til de rigtige repræsentationer ved hjælp af både sprog- og billedkoderne.

Det andet trin indebærer opdeling af en tekstartikel i separate sætninger og indkodning af hver sætning til en anden repræsentation. Målet er at optimere den gensidige information, defined i form af sandsynlighedsfordelinger, mellem billed- og tekstsekvenser. Den største præcision blev opnået som resultat.

Google introducerede en AI-model til at illustrere nyhedsartikler
Billedet skabt af Stable Diffusion

Som konklusion giver denne undersøgelse en række bidrag, fra applikationer som automatiseret narrativ illustration til den udfordrende opgave at matche en historie og en samling af illustrationer. Virksomheden siger model også kan anvendes på andre sprog, og at den arbejder på at udvide datasættet til at omfatte artikler fra andre sider.

Læs flere relaterede artikler:

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Flere artikler
Damir Yalalov
Damir Yalalov

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Hot Stories
Tilmeld dig vores nyhedsbrev.
Seneste Nyheder

Maj 2024s kryptogennembrud: Bitgert Coins triumf

by Gregory Pudovsky
Maj 06, 2024

Institutionel appetit vokser mod Bitcoin ETF'er midt i volatilitet

Afsløringer gennem 13F-arkivering afslører bemærkelsesværdige institutionelle investorer, der dytter i Bitcoin ETF'er, hvilket understreger en voksende accept af ...

Vide mere

Straffeudmålingsdagen ankommer: CZ's skæbne hænger i balance, da amerikansk domstol overvejer DOJ's anbringende

Changpeng Zhao står klar til at blive dømt ved en amerikansk domstol i Seattle i dag.

Vide mere
Tilmeld dig vores innovative teknologifællesskab
Læs mere
Læs mere
Binance ophører med at understøtte BIDR-produkter og -tjenester, råder brugere til at konvertere midler inden den 20. august
Markeder Nyheds rapport Teknologier
Binance ophører med at understøtte BIDR-produkter og -tjenester, råder brugere til at konvertere midler inden den 20. august
Maj 6, 2024
Sikkerhedsbrud rammer Fantom Ecosystems GNUS.AI, resulterer i et tab på $1.27 mio.
Markeder Nyheds rapport Teknologier
Sikkerhedsbrud rammer Fantom Ecosystems GNUS.AI, resulterer i et tab på $1.27 mio.
Maj 6, 2024
Maj 2024s kryptogennembrud: Bitgert Coins triumf
Nyheds rapport
Maj 2024s kryptogennembrud: Bitgert Coins triumf
Maj 6, 2024
Bitcoin Network overgår 1B transaktioner, femten år efter lanceringen
Markeder Nyheds rapport Teknologier
Bitcoin Network overgår 1B transaktioner, femten år efter lanceringen
Maj 6, 2024