Nachrichtenbericht Technologie
22. März 2023

Das Text-zu-Video-Modell Gen-2 kann mithilfe von Texteingabeaufforderungen kurze Videos erstellen

In Kürze

Das neue Text2Video-Modell Gen-2 von RunWayML kann nicht nur bestehende bearbeiten Videos Sie können aber auch von Grund auf neue generieren, indem Sie nur eine Texteingabe verwenden.

Es wird erwartet, dass diese Funktion die Art und Weise verbessert, wie Menschen Inhalte auf Social-Media-Plattformen erstellen und teilen, und den Benutzern eine Transformation ermöglicht statische Bilder in dynamische umwandeln und ansprechende Videoclips ohne Vorkenntnisse in der Videobearbeitung.

Das neue Text-to-Video-Modell Gen-2 von Runway kann nicht nur vorhandene Videos bearbeiten, sondern auch neue von Grund auf neu erstellen, indem es nur eine Texteingabe verwendet. Dies ist eine deutliche Verbesserung gegenüber der vorherigen Version von Gen, die nur vorhandene Videos bearbeiten konnte. Das Text-zu-Video-Modell Gen-2 nutzt die hochmoderne KI-Technologie von Runway, um Videos zu erstellen, die nicht von denen zu unterscheiden sind, die von Menschen gemacht wurden. Mit dieser neuen Funktion können Benutzer Zeit und Mühe sparen, indem sie Videos automatisch erstellen, ohne dass umfangreiche Videobearbeitungskenntnisse erforderlich sind.

Das Text-zu-Video-Modell Gen-2 kann mithilfe von Texteingabeaufforderungen kurze Videos erstellen

Das neue Gen-2-Modell ist auch in der Lage, ein hochgeladenes Bild in ein zu verwandeln kurzes Video Clip. Dies geschieht durch die Bereitstellung eines Texthinweises, der beschreibt, wie der Benutzer das Video gestalten möchte. Bisher beträgt die Dauer der Videos nicht mehr als ein paar Sekunden, aber die Qualität ist bereits deutlich höher als bei Mitbewerbern (zumal die Mitbewerber Neuronale Netze sind nicht öffentlich zugänglich). Diese Funktion soll die Art und Weise verbessern, wie Menschen Inhalte auf Social-Media-Plattformen erstellen und teilen. Mit dem Gen-2-Modell können Benutzer ihre statischen Bilder ganz einfach in dynamische Videoclips umwandeln. Es besteht eine gute Chance, dass Facebook oder Tiktok diese Technologie nutzen werden, um die Menge an KI-Tools zu erweitern, die den Erstellern von Inhalten zur Verfügung stehen.

Das KI-Videorennen ist wild. Seit dem Start von Gen-1 ist nur eine Woche vergangen, und Gen-2 ist bereits draußen. Der Wettbewerb zwischen Technologieunternehmen um die Entwicklung der fortschrittlichsten KI-Videotechnologie nimmt rapide zu, wobei jedes Unternehmen danach strebt, das andere zu übertreffen.

Um die neue Version von Gen auszuprobieren, müssen Sie sich in der Warteschlange auf der anmelden Runway-Website.

  • Runway, ein Startup für künstliche Intelligenz, angekündigt Gen-1, ein neuronales Netzwerk, das durch die Kombination von Eingabeaufforderungen und Bildern alte Videos in neue umwandeln kann. Mit Gen-1 können Filmemacher schnell und kostengünstig Inhalte produzieren, indem sie die Komposition und den Stil eines Films anwenden Bild- oder Textaufforderung zur Struktur des Quellvideos. Runway Research widmet sich dem Aufbau multimodaler KI-Systeme, die neue Formen der Kreativität ermöglichen, und Gen-1 kann genutzt werden, um mit der Zukunft des Geschichtenerzählens zu experimentieren.
  • Letzten Monat hat Sam Altman, Mitbegründer und CEO von OpenAI, sprach kürzlich mit TechCrunch und sagte das OpenAI entwickelt ein KI-Modell für Videos und GPT-4, die der Öffentlichkeit zugänglich sein wird, nachdem das Unternehmen seine Vertrauenswürdigkeit und Sicherheit bestätigt hat.
  • Im Oktober entwickelte Google Imagen Video, eine Methode zum Erstellen textbedingter Videos basierend auf einer Videoserie Diffusionsmodelle. Das System akzeptiert eine Textbeschreibung und generiert einen 16-Frame-Film mit drei Bildern pro Sekunde und einer Auflösung von 24 x 48 Pixeln. Das System skaliert und „prognostiziert“ die zusätzlichen Bilder und erstellt ein endgültiges Video mit 128 Bildern bei 24 Bildern pro Sekunde und einer Auflösung von 720p (1280 x 768). Zum Trainieren von Imagen Video wurden 14 Millionen Bild-Text-Paare und XNUMX Millionen Video-Text-Paare verwendet.

Lesen Sie weitere verwandte Artikel:

Haftungsausschluss

Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.

Über den Autor

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Weitere Artikel
Damir Jalalow
Damir Jalalow

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Hot Stories
Abonnieren Sie unseren Newsletter.
Aktuelles

Von Ripple zum Big Green DAO: Wie Kryptowährungsprojekte zur Wohltätigkeit beitragen

Lassen Sie uns Initiativen erkunden, die das Potenzial digitaler Währungen für wohltätige Zwecke nutzen.

Weitere Informationen

AlphaFold 3, Med-Gemini und andere: Die Art und Weise, wie KI das Gesundheitswesen im Jahr 2024 verändert

KI manifestiert sich im Gesundheitswesen auf verschiedene Weise, von der Aufdeckung neuer genetischer Zusammenhänge bis hin zur Stärkung robotergestützter chirurgischer Systeme ...

Weitere Informationen
Treten Sie unserer innovativen Tech-Community bei
Weiterlesen
Lesen Sie weiter
Apeiron kündigt das „Apeiron Guild Wars 2024“-Turnier mit einem Preispool von 1 Million US-Dollar an und freut sich über die Teilnahme von Web3 Gemeinschaft und etablierte Gilden
Lifestyle Nachrichtenbericht Technologie
Apeiron kündigt das „Apeiron Guild Wars 2024“-Turnier mit einem Preispool von 1 Million US-Dollar an und freut sich über die Teilnahme von Web3 Gemeinschaft und etablierte Gilden
15. Mai 2024
Lens-Protokoll zur Einführung eines hybriden und modularen Infrastruktur-Linsennetzwerks, basierend auf ZK Stack
Nachrichtenbericht Technologie
Lens-Protokoll zur Einführung eines hybriden und modularen Infrastruktur-Linsennetzwerks, basierend auf ZK Stack
15. Mai 2024
BitSmiley wird im Merlin-Chain-Mainnet eingesetzt und führt ein „Liquiditätszuschussprogramm“ für die Merlin-Chain-Community ein, um die Liquidität zu stärken
Märkte Nachrichtenbericht Technologie
BitSmiley wird im Merlin-Chain-Mainnet eingesetzt und führt ein „Liquiditätszuschussprogramm“ für die Merlin-Chain-Community ein, um die Liquidität zu stärken
15. Mai 2024
Manta Network führt natives Abstecken ein und ermöglicht Benutzern das Abstecken von MANTA mit Omni Liquid Staking
Märkte Nachrichtenbericht Technologie
Manta Network führt natives Abstecken ein und ermöglicht Benutzern das Abstecken von MANTA mit Omni Liquid Staking
15. Mai 2024