Google a introdus un model AI pentru ilustrarea articolelor de știri
Pe scurt
Google anunță un nou model AI pentru producerea de rezumate vizuale de înaltă calitate ale articolelor de știri
Google are a anunțat un nou model de inteligență artificială (AI) despre care se spune că poate genera automat rezumate vizuale „coerente și fluente” ale articolelor de știri. Gigantul tehnologic spune că modelul poate ajuta la accesibilitatea informațiilor utilizatorilor generator rezumate vizuale „de înaltă calitate” ale unor fragmente lungi de text.
Modelul se bazează pe un algoritm de învățare profundă cunoscut sub numele de transformator, care este conceput pentru a „înțelege” contextul unei propoziții și apoi a genera o ilustrație care reține informațiile importante din textul original.
Google îndeplinește sarcina mult mai dificilă de a înțelege contextul general al întregului text, spre deosebire de popularul în prezent. text-to-image sisteme, care se bazează pe o reprezentare „frontală” a principiului „ce văd, despre ce desenez”. În plus, alegerea imaginilor este făcută pentru a crea o „imagine în ansamblu”, mai degrabă decât declarații și fraze individuale (cum face practic toată lumea în acest moment). Cu alte cuvinte, imaginile sunt alese pentru întregul articol luând în minte contexte și semnificații.
Google spune că modelul poate genera rezumate ale mai multor propoziții dintr-un articol de știri și că a fost instruit pe un set mare de date NewsStories, care conține aproape 31 de milioane de articole, 22 de milioane de fotografii și 1 milion de videoclipuri ascunse în tufișuri.
Primul pas este să potriviți imaginea cu articolul complet după ce a fost tradusă în reprezentările adecvate folosind atât limbajul, cât și codificatoarele de imagine.
Al doilea pas implică împărțirea unui articol text în propoziții separate și codificarea fiecărei propoziții într-o reprezentare diferită. Obiectivul este optimizarea informației reciproce, defiîn termeni de distribuții de probabilitate, între secvențe de imagini și de text. Ca rezultat s-a obținut cea mai mare precizie.
În concluzie, acest studiu aduce o varietate de contribuții, de la aplicații precum ilustrarea narativă automată la sarcina provocatoare de a potrivi o poveste și o colecție de ilustrații. Compania spune că model poate fi aplicat și în alte limbi și că lucrează la extinderea setului de date pentru a include articole de pe alte site-uri.
Citiți mai multe articole conexe:
Declinare a responsabilităţii
În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.
Despre autor
Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului.
Mai multe articoleDamir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului.