Nachrichtenbericht Technologie
08. Februar 2023

Gen-1: KI generiert neue Videos aus bestehenden, indem sie Eingabeaufforderungen und Bilder kombiniert

In Kürze

Gen-1 ist ein neuronales Netzwerk, das durch Kombination aus bestehenden Videos neue Videos generieren kann Eingabeaufforderungen und Bilder.

Es könnte auch verwendet werden, um völlig neue Videos von Grund auf neu zu erstellen.

Die Fähigkeit, neue Videos aus bestehenden Videos zu generieren, hat eine Reihe potenzieller Anwendungen.

RunWayML, ein Startup für künstliche Intelligenz, hat angekündigt, ein neues Produkt namens Gen-1, ein neuronales Netzwerk, das neue Videos aus bestehenden erstellen kann, indem es Eingabeaufforderungen und Bilder kombiniert. Seit Jahren beschränken sich neuronale Netze auf die Aufgabe des Stiltransfers, d. h. des Vorgangs, ein Bild zu nehmen und ihm den Stil eines anderen Bildes zuzuweisen. So erhalten wir diese abgefahrenen Transfervideos im Deep-Learning-Stil, in denen beispielsweise eine Landschaft im Stil von Van Goghs Sternennacht gerendert wird.

Gen-1: KI generiert neue Videos aus bestehenden, indem sie Eingabeaufforderungen und Bilder kombiniert
@Midjourney / Dieser seltsame Geist

Mit Gen-1 können neuronale Netze jetzt mehr als nur Stilübertragungen leisten. Es kann neue Videos von Grund auf neu erstellen, indem es Eingabeaufforderungen und Bilder als Eingabe verwendet. Das eröffnet ganz neue Möglichkeiten für KI-erstellte Videos. Derzeit sind die von Gen-1 generierten Videos kurz und einfach. Aber mit der Weiterentwicklung der Technologie können wir mit komplexeren und komplexeren Entwicklungen rechnen realistische Videos, die von KI generiert werden.

Empfohlener Beitrag: Die reproduktive Gesundheit von Männern wird durch das Ansehen von Videos für Erwachsene in der virtuellen Realität verbessert

Was ist Gen-1?

Starke Bilderstellungs- und Bearbeitungswerkzeuge werden durch Textführung freigeschaltet Generative Diffusionsmodelle. Während diese auf die Erstellung von Videos angewendet wurden, erfordern die derzeitigen Verfahren zum Editieren des Inhalts von bereits vorhandenem Material unter Beibehaltung seiner Struktur ein teures Umlernen für jede Eingabe oder hängen von der riskanten Ausbreitung von Bildänderungen zwischen Einzelbildern ab.

Entwickler beschreiben ein Modell für struktur- und inhaltsgesteuerte Videoverbreitung, das Filme basierend auf entweder schriftlichen oder visuellen Beschreibungen des gewünschten Ergebnisses verändert. Aufgrund unzureichender Entkopplung entstehen Konflikte zwischen vom Benutzer bereitgestellten Inhaltsänderungen und Strukturdarstellungen. Sie demonstrieren, dass die Struktur und Inhaltsintegrität durch Training an monokularen Tiefenschätzungen mit verschiedenen Detaillierungsgraden kontrolliert werden können.

Synthetisieren Sie neue Videos auf realistische und konsistente Weise, indem Sie die Komposition und den Stil einer Bild- oder Textaufforderung auf die Struktur Ihres Quellvideos anwenden. Es ist, als würde man etwas Neues filmen, ohne tatsächlich etwas zu filmen.

Die Synthese eines neuen Videos mit dieser Methode ermöglicht es Filmemachern, Inhalte schnell und kostengünstig zu produzieren
Die Synthese eines neuen Videos mit dieser Methode ermöglicht es Filmemachern, Inhalte schnell und kostengünstig zu produzieren

Das Übertragen des Stils eines Bildes oder einer Aufforderung auf jeden Frame eines Videos kann eine großartige Möglichkeit sein, Ihr Projekt zu vereinheitlichen, ihm ein übergreifendes visuelles Thema zu geben und Konsistenz zu schaffen.

Durch den Einsatz von Software und kreativem Design können Mockups in ästhetisch ansprechende und interaktive Renderings umgewandelt werden, die die Vision des Benutzers zum Leben erwecken.

Mit Modellen können Designer ihre Ideen visualisieren und greifbare Ergebnisse erstellen, die zur Überprüfung vorgelegt werden können
Mit Modellen können Designer ihre Ideen visualisieren und greifbare Ergebnisse erstellen, die zur Überprüfung vorgelegt werden können

Mit den Videobearbeitungsfunktionen ist es einfach, Teile eines Videos zu isolieren und sie mit Textansagen zu verbessern.

Anwenden eines Eingabebildes oder Eingabeaufforderung Untexturierte Renderings können ihren Realismus erheblich verbessern und die 3D-Modelle zum Leben erwecken.

Runway Research widmet sich dem Aufbau multimodaler KI-Systeme, die neue Formen der Kreativität ermöglichen. Gen-1 stellt einen weiteren unserer entscheidenden Schritte in dieser Mission dar. Wenn Sie ein Kreativer sind, der mit der Zukunft des Geschichtenerzählens experimentieren möchte, fordern Sie unten Zugriff an.

Gen-1 kann auch verwendet werden, um völlig neue Videos von Grund auf neu zu erstellen. Es kann für eine Reihe von Zwecken verwendet werden, einschließlich der Erstellung neuer Versionen vorhandener Filme oder der Erstellung ganz neuer Filme. Diese Neuigkeiten werden Filmemacher und andere Kreative begeistern, die immer nach neuen Wegen suchen, die Grenzen ihrer Kunst zu erweitern. Mit Gen-1 steht ihnen nun ein neues mächtiges Werkzeug zur Verfügung.

Die Fähigkeit zu neue Videos generieren von bestehenden hat eine Reihe von potenziellen Anwendungen. Beispielsweise könnte es verwendet werden, um neue Versionen bestehender Videoinhalte zu erstellen, sodass es zum Erstellen alternativer Versionen von Szenen oder Einstellungen verwendet werden könnte, die möglicherweise zu teuer oder logistisch schwierig zu filmen sind.

Sie können sich für die Nutzung des Modells bewerben, während es sich im Betatest befindet hier.

Lesen Sie mehr über KI:

Haftungsausschluss

Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.

Über den Autor

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Weitere Artikel
Damir Jalalow
Damir Jalalow

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Von Ripple zum Big Green DAO: Wie Kryptowährungsprojekte zur Wohltätigkeit beitragen

Lassen Sie uns Initiativen erkunden, die das Potenzial digitaler Währungen für wohltätige Zwecke nutzen.

Weitere Informationen

AlphaFold 3, Med-Gemini und andere: Die Art und Weise, wie KI das Gesundheitswesen im Jahr 2024 verändert

KI manifestiert sich im Gesundheitswesen auf verschiedene Weise, von der Aufdeckung neuer genetischer Zusammenhänge bis hin zur Stärkung robotergestützter chirurgischer Systeme ...

Weitere Informationen
Treten Sie unserer innovativen Tech-Community bei
Weiterlesen
Lesen Sie weiter
Von Ripple zum Big Green DAO: Wie Kryptowährungsprojekte zur Wohltätigkeit beitragen
Analyse Crypto Wiki Geschäft Bildungswesen Lifestyle Märkte Software Technologie
Von Ripple zum Big Green DAO: Wie Kryptowährungsprojekte zur Wohltätigkeit beitragen
13. Mai 2024
AlphaFold 3, Med-Gemini und andere: Die Art und Weise, wie KI das Gesundheitswesen im Jahr 2024 verändert
AI Wiki Analyse Digest Meinung Geschäft Märkte Nachrichtenbericht Software Geschichten und Rezensionen Technologie
AlphaFold 3, Med-Gemini und andere: Die Art und Weise, wie KI das Gesundheitswesen im Jahr 2024 verändert
13. Mai 2024
Nim Network führt ein AI-Ownership-Tokenization-Framework ein und führt einen Yield-Sale durch. Der Snapshot-Termin ist für Mai geplant
Märkte Nachrichtenbericht Technologie
Nim Network führt ein AI-Ownership-Tokenization-Framework ein und führt einen Yield-Sale durch. Der Snapshot-Termin ist für Mai geplant
13. Mai 2024
Binance arbeitet mit Argentinien zur Bekämpfung der Cyberkriminalität zusammen
Meinung Geschäft Märkte Nachrichtenbericht Software Technologie
Binance arbeitet mit Argentinien zur Bekämpfung der Cyberkriminalität zusammen
13. Mai 2024