Novinky Technika
06. prosince 2023

Google Research a Tel Aviv University vyvíjejí rámec umělé inteligence pro přesné generování obrázků

Stručně

Google Research a Tel Aviv University vyvinuly AI, která pro vykreslování obrazu kombinuje šíření textu do obrazu s geometrií čočky.

Google Research a Tel Aviv University odhalují rámec umělé inteligence pro přesné generování obrázků

Výzkum Google ve spolupráci s Tel Aviv University, představila nový rámec umělé inteligence (AI), který kombinuje model šíření textu do obrazu se specializovanou geometrií čoček pro vykreslování obrazu.

Tato integrace umožňuje přesnou kontrolu nad geometrií vykreslování, což usnadňuje generování různých vizuálních efektů, jako je rybí oko, panoramatické pohledy a sférické texturování pomocí jediného modelu difúze.

V nejnovějším výzkum papír, vědci řešili úkol začlenit různé optické ovládací prvky do modelů difúze textu do obrazu. Tento přístup zahrnoval, že model zohlednil místní geometrii čočky, čímž se zlepšila jeho schopnost replikovat složité optické efekty a vytvářet realisticky vypadající obrazy.

Namísto pouhé změny standardního tvaru obrázků umožňuje tato metoda prakticky jakékoli deformace mřížky prostřednictvím úpravy souřadnic na pixel. Tento inovativní přístup podporuje různé aplikace, jako je generování panoramatických scén, které dodávají pocit přítomnosti a texturování koulí. 

Kromě toho tento rámec zavádí mnohostranný rámec pro generování obrazu s ohledem na geometrii s metrickou úpravou tenzoru. To poskytuje další možnosti pro ovládání a úpravu způsobu generování obrázků a odhaluje řadu možností pro vytváření a zdokonalování obrázků.

Přesné generování obrázků prostřednictvím integrace difúze textu na obrázek

Rámec se integruje převod textu na obrázek difúzní modely se specifickou geometrií čoček prostřednictvím úpravy souřadnic na pixel. Metoda zahrnuje upřesnění předem připraveného modelu latentní difúze využitím dat generovaných zkreslením obrazů náhodnými deformačními poli.

Převážení tokenů bylo implementováno ve vrstvách s vlastní pozorností, což umožňuje manipulaci s vlastnostmi zakřivení a přináší různé efekty, jako je rybí oko a panoramatické pohledy. Tento přístup překračuje pevné rozlišení při generování obrazu a zahrnuje úpravu metrických tenzorů pro lepší ovládání.

Revoluční manipulace s obrázky

Rámec rozšiřuje možnosti manipulace s obrázky, řeší problémy, jako je generování velkých obrázků a úprava měřítek sebepozorování v modelech difúze.

Rámec efektivně integruje model difúze textu do obrázku se specifickou geometrií čočky, což umožňuje řadu vizuálních efektů, jako je rybí oko, panoramatické pohledy a sférické texturování pomocí jediného modelu. Poskytuje pečlivou kontrolu nad vlastnostmi zakřivení a geometrií vykreslování, což vede k vytváření realistických a jemných obrázků.

Metoda, která je trénována na rozsáhlém textově anotovaném datovém souboru a polích deformace na pixel, vytváří libovolné pokřivené obrázky s jemně nezkreslenými výsledky těsně zarovnanými s cílovou geometrií. Navíc usnadňuje vytváření sférických panoramat vyznačujících se realistickými proporcemi a minimem artefaktů.

Google Research a Tel Aviv University odhalují rámec umělé inteligence pro přesné generování obrázků

Nedávno představený rámec, který do vykreslování obrazu integruje různé geometrie čoček, nabízí lepší kontrolu nad vlastnostmi zakřivení a vizuálními efekty.

Výzkumníci navrhují rozšířit tento přístup, aby bylo dosaženo výsledků srovnatelných se specializovanými čočkami zachycujícími odlišné scény. S ohledem na potenciální využití pokročilejších technik úpravy, rámec předpokládá vylepšené generování obrazu a rozšířené možnosti.

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Alisa, oddaná novinářka v MPost, se specializuje na kryptoměny, důkazy s nulovými znalostmi, investice a rozsáhlou oblast Web3. S velkým okem pro nové trendy a technologie poskytuje komplexní pokrytí, aby informovala a zapojila čtenáře do neustále se vyvíjejícího prostředí digitálních financí.

Další články
Alisa Davidsonová
Alisa Davidsonová

Alisa, oddaná novinářka v MPost, se specializuje na kryptoměny, důkazy s nulovými znalostmi, investice a rozsáhlou oblast Web3. S velkým okem pro nové trendy a technologie poskytuje komplexní pokrytí, aby informovala a zapojila čtenáře do neustále se vyvíjejícího prostředí digitálních financí.

Hot Stories
Připojte se k našemu zpravodaji.
Novinky

Od zvlnění k velké zelené DAO: Jak kryptoměnové projekty přispívají k charitě

Pojďme prozkoumat iniciativy využívající potenciál digitálních měn pro charitativní účely.

Vědět více

AlphaFold 3, Med-Gemini a další: The Way AI Transforms Healthcare in 2024

Umělá inteligence se ve zdravotnictví projevuje různými způsoby, od odhalování nových genetických korelací až po posílení robotických chirurgických systémů...

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Tether spouští Alloy platformu podporovanou Tether Gold a představuje první token aUSD₮
Trhy Novinky Technika
Tether spouští Alloy platformu podporovanou Tether Gold a představuje první token aUSD₮
Června 17, 2024
Spoluzakladatel Binance Yi He naléhá na Elona Muska, aby řešil rostoucí krypto podvody na X
Názor Business Životní styl Trhy Vývoj Technika
Spoluzakladatel Binance Yi He naléhá na Elona Muska, aby řešil rostoucí krypto podvody na X
Června 17, 2024
Rekapitulace krypto trhu: Analýza týdenních trendů v bitcoinech, ethereu a toncoinech
Strávit Business Trhy Technika
Rekapitulace krypto trhu: Analýza týdenních trendů v bitcoinech, ethereu a toncoinech
Června 17, 2024
Trader Joe uvádí na trh Liquidity Book V2.2 a zavádí funkci „Concentrated Incentives“
Novinky Technika
Trader Joe uvádí na trh Liquidity Book V2.2 a zavádí funkci „Concentrated Incentives“
Června 17, 2024
CRYPTOMERIA LABS PTE. LTD.