Stability AI Kündigt an Stable Diffusion Neudenken für die Bild-zu-Bild-Generierung
In Kürze
Anfang März Stability AI erwarb das französische Unternehmen Init ML, Hersteller der Clipdrop-Suite von KI-Bildgebungsanwendungen.
Diese Zusammenarbeit zwischen Stability AI und Init ML führt zum neuen Produkt, Stable Diffusion Reimagined, das auf der Grundlage eines einzigen Bildes neue Ideen generiert.
Anfang März Stability AI erworben Frankreichs Init ML, Hersteller der Clipdrop-Suite von KI-Bildgebungsanwendungen. Dies ist der erste Kauf von Stability AI seit der Spendenaktion.
Das in Paris ansässige Unternehmen Init ML wurde im Juli 2020 mit einer Startfinanzierung der Risikokapitalgesellschaft Air Street Capital gegründet. Clipdrop hat seitdem über 15 Millionen Benutzer seiner Tools Relight, Text Remover, Remove/Replace Background, Super Resolution und Clean Up. Init ML wird als hundertprozentige, unabhängige Tochtergesellschaft von agieren Stability AI, alle Mitarbeiter bleiben im Personalbestand. Laut der ClipDrop-Website „wird erwartet, dass diese Übernahme das Fachwissen beider Unternehmen bündelt, um ihre KI-gestützten Lösungen zu verbessern.“ Stability AI Ziel ist es, die Fähigkeiten von Init ML zu nutzen, um seinen Kunden innovativere und effizientere Dienstleistungen anzubieten.
Und jetzt diese Zusammenarbeit zwischen Stability AI und Init ML führt zum neuen Produkt, Stable Diffusion Reimagine. Stable Diffusion Reimagine erstellt keine Bilder basierend auf Originaldaten neu. Stattdessen, Stable Diffusion Reimagine erstellt neue Bilder, die von den Originalen inspiriert sind.
Es ist wie ein Generator neuer Ideen, der auf einem einzigen Bild basiert. Andererseits kann es als Kopieren und Einfügen mit maximaler Geschwindigkeit betrachtet werden, eine vollständige Analogie zur Anfrage an ChatGPT "Nimm das Text und umschreiben es anders.“ Im Wesentlichen kann dieses Tool als Katalysator für Kreativität wahrgenommen werden, der aus einem einzelnen visuellen Hinweis neue Konzepte hervorbringt. Umgekehrt kann es auch mit einem schnellen Vervielfältigungsprozess verglichen werden, ähnlich dem Akt der Bitte um Hilfe ChatGPT um diese Passage umzuformulieren.
Bilder werden basierend auf dem Bild generiert. Nachdem der Encoder den Algorithmus durchlaufen hat, wird etwas Rauschen hinzugefügt, um Variationen zu erzeugen. Dieser Ansatz führt zu ähnlichen Bildern mit unterschiedlichen Details und Kompositionen. Im Gegensatz zum Bild-zu-Bild-Algorithmus wird das Originalbild zunächst vollständig codiert. Das bedeutet, dass der Generator keine Pixel aus dem Originalbild verwendet. Damit Künstler nicht auf Plagiate schwören.
StabilityAI setzt auf Open Source und verspricht, den Code auf GitHub zu veröffentlichen, was sehr cool ist. In der Zwischenzeit können Sie es kostenlos testen hier.
Frisch generierte Beispiele folgen unten:
In der Zwischenzeit warten Benutzer auf einen Generator von Websites, Präsentationen, Pitch-Decks und glamourösen Magazinen mit einer Schaltfläche: „Geben Sie eine URL oder Datei ein; unsere KI wird die Texte umschreiben und die Bilder regenerieren.“
- Stability AI, Hugging Face und Canva gründen eine neue gemeinnützige Organisation für KI-Forschung. EleutherAI, eine von Connor Leahy, Leo Gao und Sid Black gegründete Community-Forschungsgruppe, gründet eine gemeinnützige Stiftung.
- Im November, Stability AI veröffentlichte auf seinem Blog einen neuen Artikel über Stable Diffusion 2.0, ein neuer Algorithmus, der effizienter und robuster als der vorherige ist und ihn gleichzeitig mit anderen hochmodernen Methoden vergleicht. Diese Version verfügt über robuste Funktionen Text-zu-Bild-Modelle trainiert mit einem neuen Text-Encoder (OpenCLIP), der von LAION mit Unterstützung von entwickelt wurde Stability AI, was die Qualität der generierten Bilder im Vergleich zu früheren V1-Versionen erheblich verbessert. Diese Modelle werden mithilfe einer ästhetischen Teilmenge des von generierten LAION-5B-Datensatzes trainiert Stability AIDas DeepFloyd-Team wird dann mithilfe des NSFW-Filters von LAION gefiltert, um Inhalte für Erwachsene auszuschließen.
- Im Oktober, Stability AI angekündigt KI-Musikgenerator Harmoniai basierend auf dem Dance Diffusion Model. Harmonai ist eine von der Community getragene Organisation, die Open Source veröffentlicht generatives Audio Werkzeuge, um den Zugang und die Freude an der Musikkomposition für alle zu verbessern. Es basiert auf dem Dance Diffusion Model, das in einem Prozess namens Diffusion nie zuvor gehörte Klänge erzeugt.
Lesen Sie weitere verwandte Artikel:
Haftungsausschluss
Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.
Über den Autor
Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein.
Weitere ArtikelDamir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein.