Meta spouští dvě nové generativní funkce AI pro úpravy videa na Facebooku a Instagramu
Stručně
Meta spustila dvě generativní funkce umělé inteligence pro úpravu videa – „Emu Video“ a „Emu Edit“ – pro posílení uživatelských příspěvků na Facebooku a Instagramu.
Obr sociálních sítí vlastněný Markem Zuckerbergem meta ve čtvrtek spustila dvě nové generativní funkce pro úpravu videa založené na AI, pojmenované „Emu Video“ a „Emu Edit“, které uživatelům umožňují přidávat příspěvky na Facebook a Instagram.
Emu Video umožní uživatelům vytvářet čtyřsekundová videa s výzvou k vložení titulku, fotografie nebo obrázku, spárovaného s popisem; zatímco Emu Edit poskytne uživatelům jednodušší způsob, jak upravovat nebo upravovat videa pomocí textových výzev.
Podle giganta sociálních médií je vývoj součástí Emu (Expressive Media Universe) – první základní model společnosti oznámený v září 2023, který dokáže generovat neuvěřitelně realistické a esteticky příjemné obrázky z textových titulků.
Vynikající funkcí Emu je její technika „ladění kvality“, která zvyšuje vizuální půvab obrázků generovaných modely AI text-to-image, dodal.
V jádru Emu generativní AI technologie jsou sada nástrojů pro úpravu obrázků AI pro Instagram, která uživatelům umožňuje kliknout na fotku a upravit její vizuální styl nebo pozadí.
Během posledního roku byly podniky a podniky přitahovány na vznikající generativní trh s umělou inteligencí, hledající vylepšené možnosti a efektivnější obchodní procesy od uvedení produktu OpenAIJe ChatGPT minulý rok.
Klíčový diferenciátor Emu od jiných generativních nástrojů umělé inteligence
Přístup Emu Video zahrnuje dvoustupňový proces: Za prvé se zaměřuje na generování obrázků podmíněných daným textovým příkazem; a poté vytváří videa podmíněná jak původním textem, tak vygenerovaným obrázkem. Tato „faktorizovaná“ nebo rozdělená strategie při generování videa zvyšuje efektivitu a umožňuje efektivní trénování modelů generování videa.
Emu Video si klade za cíl demonstrovat to faktorizované generování videa lze implementovat prostřednictvím jediného difúzního modelu. Prezentací klíčových návrhových rozhodnutí, jako je jemné doladění plánů šumu šitých na míru pro šíření videa, se Meta snaží svou technologii dále zdokonalovat.
Dalším rysem Meta je implementace vícestupňového školení, které umožňuje přímé generování videí ve vyšším rozlišení a ukazuje potenciál Emu Video zvýšit kvalitu video obsahu.
Podle Meta řeší Emu Edit společnou výzvu – mnoho přístupů má tendenci buď přehnaně modifikovat, nebo podléhat různým editačním úlohám, což vede k méně než optimálním výsledkům. Primární cíl úpravy obrázků by se neměl točit pouze kolem vytváření „věrohodného“ obrázku, místo toho by se mělo zaměřit na přesnou změnu pouze pixelů relevantních pro konkrétní požadavek na úpravu.
Na rozdíl od jiných generativní modely AI, Emu Edit se řídí pokyny, aby zajistil, že pixely ve vstupním obrázku nesouvisející s určenými úpravami zůstanou nedotčeny.
S takovými oznámeními a technologickými vylepšeními se Meta umisťuje jako hlavní ústřední bod v konkurenčním prostředí vedle gigantů jako Microsoft, Google Alphabet a Amazon.
Odmítnutí odpovědnosti
V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.
O autorovi
Kumar je zkušený technický novinář se specializací na dynamické průniky AI/ML, marketingové technologie a nově vznikající obory, jako jsou kryptoměny, blockchain a NFTs. S více než 3 lety zkušeností v oboru si Kumar vytvořil prokazatelné výsledky ve vytváření působivých příběhů, vedení zasvěcených rozhovorů a poskytování komplexních poznatků. Kumarova odbornost spočívá ve vytváření vysoce působivého obsahu, včetně článků, zpráv a výzkumných publikací pro prominentní průmyslové platformy. Díky jedinečné sadě dovedností, které kombinují technické znalosti a vyprávění příběhů, Kumar vyniká v komunikaci složitých technologických konceptů pro různé publikum jasným a poutavým způsobem.
Další články
Kumar je zkušený technický novinář se specializací na dynamické průniky AI/ML, marketingové technologie a nově vznikající obory, jako jsou kryptoměny, blockchain a NFTs. S více než 3 lety zkušeností v oboru si Kumar vytvořil prokazatelné výsledky ve vytváření působivých příběhů, vedení zasvěcených rozhovorů a poskytování komplexních poznatků. Kumarova odbornost spočívá ve vytváření vysoce působivého obsahu, včetně článků, zpráv a výzkumných publikací pro prominentní průmyslové platformy. Díky jedinečné sadě dovedností, které kombinují technické znalosti a vyprávění příběhů, Kumar vyniká v komunikaci složitých technologických konceptů pro různé publikum jasným a poutavým způsobem.