Stability AI Spouští model „Stable Zero123“, který dokáže generovat 3D objekty z jednoho obrázku
Stručně
Stability AI oznámila Stable Zero123, generativní model umělé inteligence, který dokáže vytvářet 3D obrázky z běžných obrázků.
Stability AI — spuštění systému umělé inteligence generujícího obraz Stable Diffusion, představila svou nejnovější novinku – Stable Zero123. Generativní model umělé inteligence vyškolený interně dokáže vytvářet 3D obrázky z běžných obrázků se zvýšenou kvalitou a účinností.
Podle společnosti představuje nově uvedený model vylepšení oproti svým předchůdcům Zero1-to-3 a Zero123-XL díky pokročilým trénovacím datovým sadám a technikám. Na rozdíl od svých protějšků, Stable Zero123 prokazuje hluboké porozumění objektům a vytváří neotřelé kvalitní pohledy z různých úhlů.
Společnost je blogu říká, že Stable Zero123 je založen na Stable Diffusion 1.5, využívající stejné množství paměti Video Random Access Memory (VRAM) k vytvoření jednoho nového pohledu. Nicméně, Stability AI objasnil, že generování 3D objektů s tímto modelem vyžaduje více času a paměti, a doporučuje podstatnou 24GB VRAM pro optimální výkon.
Důležitým bodem, který je třeba poznamenat z oznámení, je, že model byl zpřístupněn pouze pro nekomerční a výzkumné účely, protože cílem společnosti je podporovat inovace ve vědecké komunitě.
Společnost oznámila, že výzkumníci a nadšenci mají nyní přístup ke Stable Zero123 na Objímání obličeje, což usnadňuje experimentování a zkoumání jeho schopností.
Nastavení nových standardů ve 3D generování obrazu
Se Stable Zero123, Stability AI si klade za cíl pokročit v oblasti počítačově generovaných snímků a poskytnout výzkumníkům nástroj k prozkoumání možností generování 3D snímků. Za tímto účelem vylepšila trénovací datovou sadu pro Stabile Zero123. Využívá filtrovaný tréninkový datový soubor pocházející z Objaverse, který se zaměřuje výhradně na zachování vysoce kvalitních 3D objektů.
Společnost tyto objekty ztvárnila realisticky, aby překonala předchozí metody.
Během tréninku i vyvozování těží generativní model umělé inteligence z úpravy nadmořské výšky. Tím, že model poskytuje odhadovaný úhel kamery, vytváří informovanější a kvalitnější předpovědi, což vede k vynikajícím vizuálním výsledkům.
Navíc, začlenění předem vypočítané dataset (předem vypočítané latentní znaky) a vylepšený zavaděč dat v kombinaci s prvními dvěma vedly ke 40násobnému zrychlení efektivity tréninku ve srovnání s jeho předchůdcem Zero123-XL.
Abychom podpořili otevřený výzkum generování 3D objektů, Stability AI vylepšila open-source kód projektu threestudio na podporu Zero123 a Stable Zero123. Zjednodušená verze procesu Stable 3D je aktuálně v soukromém náhledu, který využívá Score Destillation Sampling (SDS) k optimalizaci pole Neural Radiance Field (NeRF) pomocí Stable Zero123.
Není však určen pro komerční použití. Společnost zdůraznila, že jde o vydání exkluzivní pro výzkumné účely.
Odmítnutí odpovědnosti
V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.
O autorovi
Kumar je zkušený technický novinář se specializací na dynamické průniky AI/ML, marketingové technologie a nově vznikající obory, jako jsou kryptoměny, blockchain a NFTs. S více než 3 lety zkušeností v oboru si Kumar vytvořil prokazatelné výsledky ve vytváření působivých příběhů, vedení zasvěcených rozhovorů a poskytování komplexních poznatků. Kumarova odbornost spočívá ve vytváření vysoce působivého obsahu, včetně článků, zpráv a výzkumných publikací pro prominentní průmyslové platformy. Díky jedinečné sadě dovedností, které kombinují technické znalosti a vyprávění příběhů, Kumar vyniká v komunikaci složitých technologických konceptů pro různé publikum jasným a poutavým způsobem.
Další články
Kumar je zkušený technický novinář se specializací na dynamické průniky AI/ML, marketingové technologie a nově vznikající obory, jako jsou kryptoměny, blockchain a NFTs. S více než 3 lety zkušeností v oboru si Kumar vytvořil prokazatelné výsledky ve vytváření působivých příběhů, vedení zasvěcených rozhovorů a poskytování komplexních poznatků. Kumarova odbornost spočívá ve vytváření vysoce působivého obsahu, včetně článků, zpráv a výzkumných publikací pro prominentní průmyslové platformy. Díky jedinečné sadě dovedností, které kombinují technické znalosti a vyprávění příběhů, Kumar vyniká v komunikaci složitých technologických konceptů pro různé publikum jasným a poutavým způsobem.