Novinky Technika
Listopadu 22, 2023

Výzkumní pracovníci MIT a Google představují StableRep, model umělé inteligence pro posílení výroby obrázků

Stručně

Počítačoví vědci MIT a Google představili StableRep, model umělé inteligence, který převádí textové výzvy na přesné obrázky pomocí Stable Diffusion.

Výzkumní pracovníci MIT a Google zavádějí program umělé inteligence, který zlepšuje produkci obrázků z výzev

MIT a Google počítačoví vědci představili StableRep, model umělé inteligence určený k transformaci popisných psaných titulků na přesné odpovídající obrázky pomocí obrázků generovaných Stable Diffusion. Tento nástroj je zaměřen na zlepšení schopnosti neuronových sítí generovat obrázky založené na textových popisech.

Podle výzkumníků mohou syntetické obrázky pomoci modelům umělé inteligence naučit se vizuální reprezentace přesněji než skutečné fotografie.

StableRep si klade za cíl umožnit výzkumníkům řídit algoritmický proces strojového učení trénováním modelu na množství obrázků generovaných Stable Diffusion v reakci na stejnou výzvu. Model se tak naučí širší škálu vizuálních reprezentací, defikteré obrázky těsně odpovídají daným výzvám.

Výzkumníci předpokládají vznik ekosystému modelů umělé inteligence, z nichž některé budou trénovány na skutečných nebo syntetických datech. V současné době se úsilí zaměřuje na výuku modelu, aby se dozvěděl více o konceptech na vysoké úrovni prostřednictvím kontextového porozumění a variability, namísto pouhého dodávání dat.

StableRep pomůže vývojářům a motorům AI 

V jádru modely text-to-image spočívá v jejich schopnosti spojovat předměty se slovy. Když jsou tyto modely prezentovány se vstupní textovou výzvou, měly by generovat obrázek, který se co nejvíce shoduje s poskytnutým popisem. Aby toho dosáhli, musí porozumět vizuální reprezentaci objektů reálného světa.

Podle nedávné předtiskový papír na arXiv, StableRep překonává SimCLR a CLIP, pokud jde o naučené reprezentace pomocí stejné sady textových výzev a odpovídajících skutečných obrázků na rozsáhlých souborech dat, pouze se spoléhá na syntetické obrázky. 

Článek pokračuje: „Když dále zavedeme jazykovou supervizi, StableRep trénovaný s 20 miliony syntetických obrázků dosahuje lepší přesnosti než CLIP trénovaný s 50 miliony skutečných obrázků.“

SimCLR a CLIP jsou algoritmy strojového učení používané pro generování obrázků z textových výzev.

Tento inovativní přístup umožňuje vývojářům umělé inteligence trénovat neuronové sítě s menším množstvím syntetických obrázků než ve skutečných a zároveň dosahovat lepších výsledků. Vznik metod podobných StableRep naznačuje budoucnost, kde by modely text-to-image mohly být trénovány převážně na syntetických datech, což by snížilo závislost na skutečných obrázcích a podpořilo AI motory, když čelí omezením v dostupných online zdrojích.

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Alisa, oddaná novinářka v MPost, se specializuje na kryptoměny, důkazy s nulovými znalostmi, investice a rozsáhlou oblast Web3. S velkým okem pro nové trendy a technologie poskytuje komplexní pokrytí, aby informovala a zapojila čtenáře do neustále se vyvíjejícího prostředí digitálních financí.

Další články
Alisa Davidsonová
Alisa Davidsonová

Alisa, oddaná novinářka v MPost, se specializuje na kryptoměny, důkazy s nulovými znalostmi, investice a rozsáhlou oblast Web3. S velkým okem pro nové trendy a technologie poskytuje komplexní pokrytí, aby informovala a zapojila čtenáře do neustále se vyvíjejícího prostředí digitálních financí.

Hot Stories
Připojte se k našemu zpravodaji.
Novinky

Od zvlnění k velké zelené DAO: Jak kryptoměnové projekty přispívají k charitě

Pojďme prozkoumat iniciativy využívající potenciál digitálních měn pro charitativní účely.

Vědět více

AlphaFold 3, Med-Gemini a další: The Way AI Transforms Healthcare in 2024

Umělá inteligence se ve zdravotnictví projevuje různými způsoby, od odhalování nových genetických korelací až po posílení robotických chirurgických systémů...

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Sophon zahajuje likvidní farmaření a přiděluje 10 % celkové dodávky tokenů SOPH pro odměny účastníkům
Trhy Novinky Technika
Sophon zahajuje likvidní farmaření a přiděluje 10 % celkové dodávky tokenů SOPH pro odměny účastníkům
Června 18, 2024
API3 představuje Oracle Stack na bitlayeru pro lepší vývojářské zkušenosti
Novinky Technika
API3 představuje Oracle Stack na bitlayeru pro lepší vývojářské zkušenosti
Června 18, 2024
Zmírnění znečištění? Jak se bývalí energetici prasata bitcoinu snaží zastavit přejídání uhlíku AI
Názor Business Trhy Vývoj Technika
Zmírnění znečištění? Jak se bývalí energetici prasata bitcoinu snaží zastavit přejídání uhlíku AI
Června 18, 2024
dForce zavádí decentralizovaný Stablecoin sUSX pro výdělek a poskytuje uživatelům vylepšenou likviditu
Novinky Technika
dForce zavádí decentralizovaný Stablecoin sUSX pro výdělek a poskytuje uživatelům vylepšenou likviditu
Června 18, 2024
CRYPTOMERIA LABS PTE. LTD.