Novice Tehnologija
November 17, 2022

Google je predstavil model AI za ilustriranje novičarskih člankov

Na kratko

Google napoveduje nov model AI za izdelavo visokokakovostnih vizualnih povzetkov novičarskih člankov

Google ima razglasitve nov model umetne inteligence (AI), za katerega pravi, da lahko samodejno ustvari "koherentne in tekoče" vizualne povzetke novičarskih člankov. Tehnološki velikan pravi, da lahko model pomaga narediti informacije bolj dostopne uporabnikom ustvarjajo »visokokakovostni« vizualni povzetki dolgih delov besedila.

Google je predstavil model AI za ilustriranje novičarskih člankov
Slika, ki jo je ustvaril Stable Diffusion

Model temelji na algoritmu globokega učenja, znanem kot transformator, ki je zasnovan tako, da »razume« kontekst stavka in nato ustvari ilustracijo, ki ohranja pomembne informacije iz izvirnega besedila.

Google opravi veliko zahtevnejšo nalogo razumevanja splošnega konteksta celotnega besedila v nasprotju s trenutno priljubljenim besedilo v sliko sistemov, ki temeljijo na »frontalnem« upodabljanju po načelu »kar vidim, to narišem«. Poleg tega je izbira slik narejena tako, da se ustvari "slika kot celota" in ne posameznih izjav in besednih zvez (kot trenutno počnejo praktično vsi). Z drugimi besedami, slike so izbrane za celoten članek ob upoštevanju kontekstov in pomenov.

Google pravi, da lahko model ustvari povzetke več stavkov iz novičarskega članka in da je bil usposobljeni na velikem naboru podatkov NewsStories, ki vsebuje skoraj 31 milijonov člankov, 22 milijonov fotografij in 1 milijon videoposnetkov, skritih v grmovju.

V tem projektu se lotevamo povsem novega izziva: ustvarjanja vizualnih povzetkov, ki so daljša besedila, ki jih spremlja zbirka slik. Z obvladovanjem dveh podnalog MIL (Multiple Instance Learning) je cilj povečati semantično podobnost med vsakim člankom in vhodnimi fotografijami.

Prvi korak je povezovanje slike s celotnim člankom, potem ko je bila prevedena v ustrezne predstavitve z uporabo jezika in kodirnikov slik.

Drugi korak vključuje razdelitev besedilnega članka na ločene stavke in kodiranje vsakega stavka v drugačno predstavitev. Cilj je optimizirati medsebojno obveščanje, defined v smislu verjetnostnih porazdelitev med slikovnimi in besedilnimi zaporedji. Kot rezultat je bila dosežena največja natančnost.

Google je predstavil model AI za ilustriranje novičarskih člankov
Slika, ki jo je ustvaril Stable Diffusion

Skratka, ta študija ponuja različne prispevke, od aplikacij, kot je avtomatizirana narativna ilustracija, do zahtevne naloge povezovanja zgodbe in zbirke ilustracij. Družba pravi, Model se lahko uporablja tudi za druge jezike in da si prizadeva razširiti nabor podatkov, da bi vključil članke z drugih spletnih mest.

Preberite več sorodnih člankov:

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

več člankov
Damir Yalalov
Damir Yalalov

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

Hot Stories
Pridružite se našemu glasilu.
Zadnje novice

Institucionalni apetit raste proti Bitcoin ETF-jem sredi volatilnosti

Razkritja prek vlog 13F razkrivajo pomembne institucionalne vlagatelje, ki se ukvarjajo z Bitcoin ETF, kar poudarja vse večje sprejemanje ...

Več o tem

Prihaja dan obsodbe: usoda CZ visi na ravnovesju, ko ameriško sodišče obravnava tožbeni razlog DOJ

Changpeng Zhao se danes sooča z obsodbo na ameriškem sodišču v Seattlu.

Več o tem
Pridružite se naši inovativni tehnološki skupnosti
Preberi več
Preberi več
Binance za prenehanje podpore za izdelke in storitve BIDR uporabnikom svetuje, naj sredstva pretvorijo pred 20. avgustom
Prisotnost Novice Tehnologija
Binance za prenehanje podpore za izdelke in storitve BIDR uporabnikom svetuje, naj sredstva pretvorijo pred 20. avgustom
Maj 6, 2024
Kršitev varnosti je prizadela GNUS.AI ekosistema Fantom, povzročila 1.27 milijona USD izgube
Prisotnost Novice Tehnologija
Kršitev varnosti je prizadela GNUS.AI ekosistema Fantom, povzročila 1.27 milijona USD izgube
Maj 6, 2024
Kripto preboj maja 2024: zmagoslavje kovanca Bitgert
Novice
Kripto preboj maja 2024: zmagoslavje kovanca Bitgert
Maj 6, 2024
Omrežje Bitcoin preseglo 1B transakcij, petnajst let po uvedbi
Prisotnost Novice Tehnologija
Omrežje Bitcoin preseglo 1B transakcij, petnajst let po uvedbi
Maj 6, 2024
CRYPTOMERIA LABS PTE. LTD.