Google introducerede en AI-model til at illustrere nyhedsartikler
Kort sagt
Google annoncerer ny AI-model til fremstilling af højkvalitets visuelle resuméer af nyhedsartikler
Google har annoncerede en ny kunstig intelligens (AI) model, som den siger automatisk kan generere "sammenhængende og flydende" visuelle opsummeringer af nyhedsartikler. Teknologigiganten siger, at modellen kan hjælpe med at gøre information mere tilgængelig for brugerne ved generere Visuelle opsummeringer af "høj kvalitet" af lange tekststykker.
Modellen er baseret på en deep learning-algoritme kendt som en transformer, som er designet til at "forstå" konteksten af en sætning og derefter generere en illustration, der bevarer den vigtige information fra den originale tekst.
Google udfører den meget mere udfordrende opgave at forstå den overordnede kontekst af hele teksten, i modsætning til den i øjeblikket populære tekst-til-billede systemer, som er baseret på en "frontal" skildring af princippet "hvad jeg ser, tegner jeg om". Derudover er valget af billeder lavet for at skabe et "billede som helhed" frem for individuelle udsagn og sætninger (som praktisk talt alle gør lige nu). Med andre ord vælges billeder til hele artiklen, mens der tages hensyn til sammenhænge og betydninger.
Google siger, at modellen kan generere opsummeringer af flere sætninger fra en nyhedsartikel, og at den har været det trænet på et stort datasæt NewsStories, som indeholder næsten 31 millioner artikler, 22 millioner fotografier og 1 million videoer gemt væk i buskene.
Det første trin er at matche billedet med den komplette artikel, efter at det er blevet oversat til de rigtige repræsentationer ved hjælp af både sprog- og billedkoderne.
Det andet trin indebærer opdeling af en tekstartikel i separate sætninger og indkodning af hver sætning til en anden repræsentation. Målet er at optimere den gensidige information, defined i form af sandsynlighedsfordelinger, mellem billed- og tekstsekvenser. Den største præcision blev opnået som resultat.
Som konklusion giver denne undersøgelse en række bidrag, fra applikationer som automatiseret narrativ illustration til den udfordrende opgave at matche en historie og en samling af illustrationer. Virksomheden siger model også kan anvendes på andre sprog, og at den arbejder på at udvide datasættet til at omfatte artikler fra andre sider.
Læs flere relaterede artikler:
Ansvarsfraskrivelse
I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.
Om forfatteren
Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab.
Flere artiklerDamir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab.