Stability AI Oznámí Stable Diffusion Reimagine pro generování obrázku na obrázek
Stručně
Na začátku března Stability AI získala francouzskou společnost Init ML, výrobce sady Clipdrop aplikací pro zobrazování AI.
Tato spolupráce mezi Stability AI a Init ML vede k novému produktu, Stable Diffusion Reimagined, což je generátor nových nápadů založených na jediném obrázku.
Na začátku března Stability AI získaný Francouzská společnost Init ML, výrobce sady Clipdrop aplikací pro zobrazování AI. Jedná se o první nákup Stability AI od fundraisingu.
Společnost Init ML se sídlem v Paříži byla založena v červenci 2020 s počátečním financováním od společnosti rizikového kapitálu Air Street Capital. Od té doby má Clipdrop více než 15 milionů uživatelů svých nástrojů Relight, Text Remover, Remove/Replace Background, Super Resolution a Clean Up. Init ML bude fungovat jako nezávislá dceřiná společnost ve stoprocentním vlastnictví Stability AI, přičemž všichni její zaměstnanci zůstávají v řadách zaměstnanců. Podle webu ClipDrop: „Očekává se, že tato akvizice spojí odborné znalosti obou společností s cílem vylepšit jejich řešení založená na umělé inteligenci.“ Stability AI si klade za cíl využít schopnosti Init ML k poskytování inovativnějších a efektivnějších služeb svým klientům.
A nyní tato spolupráce mezi Stability AI a Init ML vede k novému produktu, Stable Diffusion Reimagine. Stable Diffusion Reimagine nevytváří obrázky na základě původních dat. Namísto, Stable Diffusion Reimagine vytváří nové obrazy inspirované originály.
Je to jako generátor nových nápadů založený na jediném obrázku. Na druhou stranu na něj lze nahlížet jako na kopírování a vkládání při maximální rychlosti, což je úplná obdoba požadavku ChatGPT „Vezmi si tohle text a přepsat je to jinak." V podstatě lze tento nástroj vnímat jako katalyzátor kreativity, který z osamoceného vizuálního podnětu podněcuje nové koncepty. Naopak to lze také přirovnat k rychlému duplikačnímu procesu, podobnému aktu žádosti o pomoc od ChatGPT přeformulovat tuto pasáž.
Obrázky jsou generovány na základě obrázku. Poté, co kodér projde algoritmem, je přidán nějaký šum, aby se vytvořily variace. Výsledkem tohoto přístupu jsou podobné snímky s různými detaily a kompozicí. Na rozdíl od algoritmu image-to-image je původní snímek nejprve plně zakódován. To znamená, že generátor nepoužívá žádný z pixelů převzatých z původního obrázku. To proto, aby umělci nenadávali na plagiáty.
StabilityAI je oddaný open source a slibuje umístit kód na GitHub, což je velmi cool. Zatím si to můžete vyzkoušet zdarma zde.
Níže jsou uvedeny čerstvě vygenerované příklady:
Mezitím uživatelé čekají na generátor stránek, prezentací, prezentací a okouzlujících časopisů s jedním tlačítkem: „Zadejte URL nebo soubor; naše AI přepíše texty a obnoví obrázky.“
- Stability AI, Hugging Face a Canva zakládají novou neziskovou organizaci pro výzkum AI. EleutherAI, komunitní výzkumná skupina, kterou založili Connor Leahy, Leo Gao a Sid Black, zakládá neziskovou nadaci.
- V listopadu, Stability AI vydal na svém blogu nový článek o Stable Diffusion 2.0, nový algoritmus, který je efektivnější a robustnější než předchozí, a zároveň jej porovnává s jinými nejmodernějšími metodami. Tato verze se vyznačuje robustností modely text-to-image vyškoleni s novým kodérem textu (OpenCLIP) vyvinutým LAION s pomocí Stability AI, což výrazně zvyšuje kvalitu generovaných obrázků oproti předchozím verzím V1. Tyto modely jsou trénovány pomocí estetické podmnožiny datové sady LAION-5B vytvořené pomocí Stability AI's DeepFloyd tým, který je poté filtrován, aby se vyloučil obsah pro dospělé pomocí LAION NSFW filtru.
- V říjnu, Stability AI oznámila, AI Music Generator Harmonai založený na modelu Dance Diffusion. Harmonai je komunitou řízená organizace, která vydává open-source generativní zvuk nástroje ke zvýšení přístupu každého k hudební kompozici a požitku z ní. Je založen na modelu Dance Diffusion Model, který generuje dosud neslyšené zvuky v procesu zvaném difúze.
Přečtěte si další související články:
Odmítnutí odpovědnosti
V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.
O autorovi
Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu.
Další článkyDamir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu.