Google ha introdotto un modello AI per illustrare articoli di notizie
In Breve
Google annuncia un nuovo modello di intelligenza artificiale per la produzione di riepiloghi visivi di alta qualità di articoli di notizie
Google ha ha annunciato un nuovo modello di intelligenza artificiale (AI) che si afferma possa generare automaticamente riepiloghi visivi "coerenti e fluenti" di articoli di notizie. Il gigante della tecnologia afferma che il modello può aiutare a rendere le informazioni più accessibili agli utenti la generazione di riassunti visivi di "alta qualità" di lunghi brani di testo.
Il modello si basa su un algoritmo di deep learning noto come trasformatore, progettato per "comprendere" il contesto di una frase e quindi generare un'illustrazione che conserva le informazioni importanti dal testo originale.
Google svolge il compito molto più impegnativo di comprendere il contesto generale dell'intero testo, in contrasto con quello attualmente popolare da testo a immagine sistemi, che si basano su una rappresentazione “frontale” del principio “quello che vedo, disegno”. Inoltre, la scelta delle immagini è fatta per creare una "foto nel suo insieme" piuttosto che singole affermazioni e frasi (come praticamente tutti stanno facendo in questo momento). In altre parole, le immagini vengono scelte per l'intero articolo tenendo conto dei contesti e dei significati.
Google afferma che il modello può generare riepiloghi di più frasi da un articolo di notizie e che lo è stato addestrato su un grande set di dati NewsStories, che contiene quasi 31 milioni di articoli, 22 milioni di fotografie e 1 milione di video nascosti tra i cespugli.
Il primo passaggio consiste nell'associare l'immagine all'articolo completo dopo che è stato tradotto nelle rappresentazioni appropriate utilizzando sia la lingua che i codificatori di immagini.
Il secondo passo prevede la divisione di un articolo di testo in frasi separate e la codifica di ciascuna frase in una rappresentazione diversa. L’obiettivo è ottimizzare le informazioni reciproche, defidefinita in termini di distribuzioni di probabilità, tra sequenze di immagini e testo. In questo modo è stata ottenuta la massima precisione.
In conclusione, questo studio apporta una varietà di contributi, da applicazioni come l'illustrazione narrativa automatizzata al compito impegnativo di abbinare una storia e una raccolta di illustrazioni. La società dice il modello può essere applicato anche ad altre lingue e che sta lavorando per espandere il set di dati per includere articoli da altri siti.
Leggi altri articoli correlati:
Negazione di responsabilità
In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.
Circa l'autore
Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet.
Altri articoliDamir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet.