Nachrichtenbericht Technologie
17. November 2022

Google hat ein KI-Modell zur Illustration von Nachrichtenartikeln eingeführt

In Kürze

Google kündigt neues KI-Modell zur Erstellung hochwertiger visueller Zusammenfassungen von Nachrichtenartikeln an

Google hat angekündigt ein neues Modell der künstlichen Intelligenz (KI), von dem es heißt, dass es automatisch „kohärente und fließende“ visuelle Zusammenfassungen von Nachrichtenartikeln generieren kann. Der Technologieriese sagt, dass das Modell dazu beitragen kann, Informationen für Benutzer zugänglicher zu machen Erzeugung „hochwertige“ visuelle Zusammenfassungen langer Texte.

Google hat ein KI-Modell zur Illustration von Nachrichtenartikeln eingeführt
Das Bild erstellt von Stable Diffusion

Das Modell basiert auf einem als Transformer bekannten Deep-Learning-Algorithmus, der den Kontext eines Satzes „verstehen“ und dann eine Illustration generieren soll, die die wichtigen Informationen aus dem Originaltext enthält.

Google bewältigt die wesentlich anspruchsvollere Aufgabe, den Gesamtzusammenhang des gesamten Textes zu erfassen, im Gegensatz zu den derzeit gängigen Text-zu-Bild Systeme, die auf einer „frontalen“ Darstellung des „Was ich sehe, zeichne ich darüber“-Prinzips basieren. Außerdem wird die Bildauswahl so getroffen, dass ein „Bild als Ganzes“ entsteht und nicht einzelne Aussagen und Phrasen (wie es derzeit praktisch jeder tut). Das heißt, die Bilder werden unter Berücksichtigung von Kontexten und Bedeutungen für den gesamten Artikel ausgewählt.

Google sagt, dass das Modell Zusammenfassungen mehrerer Sätze aus einem Nachrichtenartikel generieren kann und dass dies auch der Fall war auf einem großen Datensatz trainiert NewsStories, das fast 31 Millionen Artikel, 22 Millionen Fotos und 1 Million Videos enthält, die in den Büschen versteckt sind.

In diesem Projekt stellen wir uns einer ganz neuen Herausforderung: der Erstellung visueller Zusammenfassungen, die aus längeren Texten und einer Sammlung von Bildern bestehen. Durch die Beherrschung von zwei MIL-Unteraufgaben (Multiple Instance Learning) soll die semantische Ähnlichkeit zwischen jedem Artikel und den Eingabefotos maximiert werden.

Der erste Schritt besteht darin, das Bild mit dem vollständigen Artikel abzugleichen, nachdem es unter Verwendung sowohl des Sprach- als auch des Bildcodierers in die richtige Darstellung übersetzt wurde.

Der zweite Schritt besteht darin, einen Textartikel in einzelne Sätze zu unterteilen und jeden Satz in eine andere Darstellung zu kodieren. Ziel ist die Optimierung der gegenseitigen Information, defianhand von Wahrscheinlichkeitsverteilungen zwischen Bild- und Textsequenzen ermittelt. Dadurch wurde höchste Präzision erreicht.

Google hat ein KI-Modell zur Illustration von Nachrichtenartikeln eingeführt
Das Bild erstellt von Stable Diffusion

Zusammenfassend lässt sich sagen, dass diese Studie eine Vielzahl von Beiträgen leistet, von Anwendungen wie der automatisierten narrativen Illustration bis hin zu der herausfordernden Aufgabe, eine Geschichte und eine Sammlung von Illustrationen zusammenzubringen. Das Unternehmen sagt die Modell auch auf andere Sprachen übertragen werden kann und daran arbeitet, den Datensatz um Artikel von anderen Websites zu erweitern.

Lesen Sie weitere verwandte Artikel:

Haftungsausschluss

Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.

Über den Autor

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Weitere Artikel
Damir Jalalow
Damir Jalalow

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Angesichts der Volatilität wächst der institutionelle Appetit auf Bitcoin-ETFs

Offenlegungen in 13F-Anmeldungen zeigen, dass namhafte institutionelle Anleger sich mit Bitcoin-ETFs beschäftigen, was die wachsende Akzeptanz von ... unterstreicht.

Weitere Informationen

Der Tag der Verurteilung steht vor der Tür: Das Schicksal von CZ bleibt ungewiss, während das US-Gericht den Plädoyer des DOJ prüft

Changpeng Zhao steht heute vor einer Verurteilung vor einem US-Gericht in Seattle.

Weitere Informationen
Treten Sie unserer innovativen Tech-Community bei
Weiterlesen
Lesen Sie weiter
Binance stellt den Support für BIDR-Produkte und -Dienste ein und rät Benutzern, Gelder vor dem 20. August umzutauschen
Märkte Nachrichtenbericht Technologie
Binance stellt den Support für BIDR-Produkte und -Dienste ein und rät Benutzern, Gelder vor dem 20. August umzutauschen
6. Mai 2024
Sicherheitsverstoß trifft GNUS.AI von Fantom Ecosystem und führt zu einem Verlust von 1.27 Millionen US-Dollar
Märkte Nachrichtenbericht Technologie
Sicherheitsverstoß trifft GNUS.AI von Fantom Ecosystem und führt zu einem Verlust von 1.27 Millionen US-Dollar
6. Mai 2024
Der Krypto-Durchbruch im Mai 2024: Der Triumph von Bitgert Coin
Nachrichtenbericht
Der Krypto-Durchbruch im Mai 2024: Der Triumph von Bitgert Coin
6. Mai 2024
Das Bitcoin-Netzwerk übersteigt 1 Milliarde Transaktionen, fünfzehn Jahre nach seiner Einführung
Märkte Nachrichtenbericht Technologie
Das Bitcoin-Netzwerk übersteigt 1 Milliarde Transaktionen, fünfzehn Jahre nach seiner Einführung
6. Mai 2024