Yangiliklar hisoboti texnologiya
Yanvar 24, 2023

GLIGEN: cheklov qutisi bilan muzlatilgan matndan tasvirga yangi ishlab chiqarish modeli

Qisqacha

GLIGEN yoki Grounded-Language-to-Image Generation - bu oldindan o'rgatilgan diffuziya modellarining imkoniyatlariga asoslanadigan va kengaytiradigan yangi texnika.

Sarlavha va chegaralovchi quti holatini kiritish bilan GLIGEN modeli ochiq dunyoga asoslangan matn2img hosil qiladi.

GLIGEN oldindan tayyorlangan text2img modelidagi bilimlardan foydalanib, ma'lum joylarda va uslublarda turli xil ob'ektlarni yaratishi mumkin.

GLIGEN shuningdek, matndan-tasvirga yaratishda insonning asosiy nuqtalarini asoslashi mumkin.

Katta hajmdagi matndan tasvirga diffuziya modellari uzoq yo'lni bosib o'tdi. Biroq, hozirgi amaliyot faqat matn kiritishga tayanadi, bu esa nazoratni cheklashi mumkin. GLIGEN, yoki Grounded-Language-to-Image Generation - bu oldindan o'rgatilgan matndan tasvirga diffuziya modellariga asoslanadigan va ularni topraklama kirishlari bilan bog'lash imkonini beruvchi imkoniyatlarini kengaytiruvchi yangi uslubdir.

GLIGEN: cheklov qutisi bilan muzlatilgan matndan tasvirga yangi ishlab chiqarish modeli

Oldindan o'rgatilgan modelning keng qamrovli tushuncha bilimini saqlab qolish uchun ishlab chiquvchilar uning barcha og'irliklarini muzlatib qo'yadilar va boshqariladigan jarayon orqali yerga ulash ma'lumotlarini yangi o'rgatiladigan qatlamlarga pompalaydilar. Sarlavha va chegaralovchi quti holati kiritishlari bilan GLIGEN modeli ochiq dunyoga asoslangan matnni tasvirga aylantiradi va yerga ulash qobiliyati yangi fazoviy konfiguratsiyalar va tushunchalarni samarali umumlashtiradi.

tekshiring demo bu yerda.

GLIGEN mavjud oldindan tayyorlangan diffuziya modellariga asoslanadi, ularning asl og'irliklari oldindan o'rgatilgan bilimlarning katta miqdorini saqlab qolish uchun muzlatilgan.
  • GLIGEN mavjud oldindan o'qitilganlarga asoslangan diffuziya modellari, asl og'irliklari oldindan o'rgatilgan bilimlarning katta miqdorini saqlab qolish uchun muzlatilgan.
  • Har bir transformator blokida qo'shimcha topraklama kiritishni o'zlashtirish uchun yangi o'rgatiladigan Gated Self-Attention qatlami yaratiladi.
  • Har bir topraklama belgisi ikki xil ma'lumotga ega: erga ulangan narsa haqida semantik ma'lumot (kodlangan matn yoki rasm) va fazoviy joylashuv ma'lumoti (kodlangan chegara qutisi yoki asosiy nuqtalar).
O'xshash maqola: VToonify: Badiiy portret videolarini yaratish uchun real vaqtda sun'iy intellekt modeli
Yangi qo'shilgan modulyatsiyalangan qatlamlar doimiy ravishda massiv topraklama ma'lumotlari (tasvir-matn-box) bo'yicha oldindan o'qitiladi, bu to'liq modelni nozik sozlash kabi oldindan tayyorlangan diffuziya modelidan foydalanishning muqobil usullariga qaraganda ancha tejamkorroqdir. Legoga o'xshab, turli xil yangi imkoniyatlarga ruxsat berish uchun turli o'qitilgan qatlamlarni ulash va chiqarish mumkin.
Yangi qo'shilgan modulyatsiyalangan qatlamlar doimiy ravishda massiv topraklama ma'lumotlari (rasm-matn-box) bo'yicha oldindan o'qitiladi. Bu oldindan o'qitilgandan foydalanishning muqobil usullariga qaraganda ancha tejamkor diffuziya modeli, masalan, toʻliq modelli nozik sozlash. Legoga o'xshab, turli xil yangi imkoniyatlarga ruxsat berish uchun turli o'qitilgan qatlamlarni ulash va chiqarish mumkin.
GLIGEN xulosa chiqarish uchun diffuziya jarayonida rejalashtirilgan namuna olishni qo‘llab-quvvatlaydi, bunda model tuproqli tokenlardan (yangi qatlamni qo‘shish orqali) yoki yaxshi oldingi (yangi qatlamni chiqarib tashlash orqali) asl diffuziya modelidan foydalanishni dinamik ravishda tanlashi va shu bilan hosil sifatini muvozanatlashi mumkin. va topraklama qobiliyati.
GLIGEN xulosa chiqarish uchun diffuziya jarayonida rejalashtirilgan namuna olishni qo‘llab-quvvatlaydi, bunda model tuproqli tokenlardan (yangi qatlamni qo‘shish orqali) yoki yaxshi oldingi (yangi qatlamni chiqarib tashlash orqali) asl diffuziya modelidan foydalanishni dinamik ravishda tanlashi va shu bilan hosil sifatini muvozanatlashi mumkin. va topraklama qobiliyati.
GLIGEN oldindan tayyorlangan text2img modelidagi bilimlardan foydalanib, ma'lum joylarda va uslublarda turli xil ob'ektlarni yaratishi mumkin.
GLIGEN oldindan tayyorlangan text2img modelidagi bilimlardan foydalanib, ma'lum joylarda va uslublarda turli xil ob'ektlarni yaratishi mumkin.
O'xshash maqola: Microsoft kompaniyasi insonning bitta suratidan 3D avatar yasay oladigan diffuziya modelini chiqardi
GLIGENni mos yozuvlar rasmlari yordamida ham o'rgatish mumkin.
GLIGENni mos yozuvlar rasmlari yordamida ham o'rgatish mumkin. Yuqori qatordan ma'lumot fotosuratlari yozma tavsiflarga qo'shimcha ravishda avtomobilning uslubi va shakli kabi yanada nozik xususiyatlarni taqdim etishi mumkinligini ko'rsatadi. Ikkinchi qator mos yozuvlar tasviridan uslub tasviri sifatida ham foydalanish mumkinligini ko'rsatadi, bu holda biz uni tasvirning burchagi yoki chetiga asoslash kifoya qiladi.
GLIGEN, boshqa diffuziya modellari kabi, taqdim etilgan chegara qutilariga yaqindan mos keladigan ob'ektlarni yaratishi mumkin bo'lgan tuproqli tasvirni bo'yashni amalga oshirishi mumkin.
GLIGEN, boshqa diffuziya modellari kabi, taqdim etilgan chegara qutilariga yaqindan mos keladigan ob'ektlarni yaratishi mumkin bo'lgan tuproqli tasvirni bo'yashni amalga oshirishi mumkin.
GLIGEN shuningdek, matndan-tasvirga yaratishda insonning asosiy nuqtalarini asoslashi mumkin.
GLIGEN insonning asosiy fikrlarini ham asoslashi mumkin matndan tasvirga yaratish.

AI haqida ko'proq o'qing:

Masʼuliyatdan voz kechish

Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.

Muallif haqida

Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi. 

Boshqa maqolalar
Damir Yalolov
Damir Yalolov

Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi. 

Institutsional ishtaha o'zgaruvchanlik sharoitida Bitcoin ETFlariga nisbatan o'sib bormoqda

13F arizalari orqali oshkor qilish Bitcoin ETFs bilan shug'ullanadigan taniqli institutsional investorlarni ochib beradi, bu esa tobora ortib borayotgan qabul qilinishini ta'kidlaydi ...

Ko'proq ma'lumot oling

Hukm chiqarish kuni keldi: AQSh sudi DOJning iltimosini ko'rib chiqayotgani sababli CZ taqdiri muvozanatda.

Changpeng Chjao bugun AQShning Sietldagi sudida hukm chiqarilishiga tayyor.

Ko'proq ma'lumot oling
Innovatsion texnologiyalar hamjamiyatimizga qo'shiling
Ko'proq o'qing
Ko'proq o'qing
Injective inEVM-ga qayta tiklash xavfsizligini olib kelish uchun AltLayer bilan kuchlarni birlashtiradi
ish Yangiliklar hisoboti texnologiya
Injective inEVM-ga qayta tiklash xavfsizligini olib kelish uchun AltLayer bilan kuchlarni birlashtiradi
, 3 2024 mumkin
Masa, MASA kreditlash pulini joriy qilish uchun kassa bilan hamkorlik qiladi, USDC asosida qarz olishga imkon beradi
Birja Yangiliklar hisoboti texnologiya
Masa, MASA kreditlash pulini joriy qilish uchun kassa bilan hamkorlik qiladi, USDC asosida qarz olishga imkon beradi
, 3 2024 mumkin
Velodrome kelgusi haftalarda Superchain beta-versiyasini ishga tushiradi va OP Stack Layer 2 blokcheynlarida kengayadi
Birja Yangiliklar hisoboti texnologiya
Velodrome kelgusi haftalarda Superchain beta-versiyasini ishga tushiradi va OP Stack Layer 2 blokcheynlarida kengayadi
, 3 2024 mumkin
CARV o'zining ma'lumotlar qatlamini markazsizlashtirish va mukofotlarni tarqatish uchun Aethir bilan hamkorlikni e'lon qiladi
ish Yangiliklar hisoboti texnologiya
CARV o'zining ma'lumotlar qatlamini markazsizlashtirish va mukofotlarni tarqatish uchun Aethir bilan hamkorlikni e'lon qiladi
, 3 2024 mumkin
CRYPTOMERIA LABS PTE. LTD.