GLIGEN: cheklov qutisi bilan muzlatilgan matndan tasvirga yangi ishlab chiqarish modeli
Qisqacha
GLIGEN yoki Grounded-Language-to-Image Generation - bu oldindan o'rgatilgan diffuziya modellarining imkoniyatlariga asoslanadigan va kengaytiradigan yangi texnika.
Sarlavha va chegaralovchi quti holatini kiritish bilan GLIGEN modeli ochiq dunyoga asoslangan matn2img hosil qiladi.
GLIGEN oldindan tayyorlangan text2img modelidagi bilimlardan foydalanib, ma'lum joylarda va uslublarda turli xil ob'ektlarni yaratishi mumkin.
GLIGEN shuningdek, matndan-tasvirga yaratishda insonning asosiy nuqtalarini asoslashi mumkin.
Katta hajmdagi matndan tasvirga diffuziya modellari uzoq yo'lni bosib o'tdi. Biroq, hozirgi amaliyot faqat matn kiritishga tayanadi, bu esa nazoratni cheklashi mumkin. GLIGEN, yoki Grounded-Language-to-Image Generation - bu oldindan o'rgatilgan matndan tasvirga diffuziya modellariga asoslanadigan va ularni topraklama kirishlari bilan bog'lash imkonini beruvchi imkoniyatlarini kengaytiruvchi yangi uslubdir.
Oldindan o'rgatilgan modelning keng qamrovli tushuncha bilimini saqlab qolish uchun ishlab chiquvchilar uning barcha og'irliklarini muzlatib qo'yadilar va boshqariladigan jarayon orqali yerga ulash ma'lumotlarini yangi o'rgatiladigan qatlamlarga pompalaydilar. Sarlavha va chegaralovchi quti holati kiritishlari bilan GLIGEN modeli ochiq dunyoga asoslangan matnni tasvirga aylantiradi va yerga ulash qobiliyati yangi fazoviy konfiguratsiyalar va tushunchalarni samarali umumlashtiradi.
tekshiring demo bu yerda.
- GLIGEN mavjud oldindan o'qitilganlarga asoslangan diffuziya modellari, asl og'irliklari oldindan o'rgatilgan bilimlarning katta miqdorini saqlab qolish uchun muzlatilgan.
- Har bir transformator blokida qo'shimcha topraklama kiritishni o'zlashtirish uchun yangi o'rgatiladigan Gated Self-Attention qatlami yaratiladi.
- Har bir topraklama belgisi ikki xil ma'lumotga ega: erga ulangan narsa haqida semantik ma'lumot (kodlangan matn yoki rasm) va fazoviy joylashuv ma'lumoti (kodlangan chegara qutisi yoki asosiy nuqtalar).
O'xshash maqola: VToonify: Badiiy portret videolarini yaratish uchun real vaqtda sun'iy intellekt modeli |
O'xshash maqola: Microsoft kompaniyasi insonning bitta suratidan 3D avatar yasay oladigan diffuziya modelini chiqardi |
AI haqida ko'proq o'qing:
Masʼuliyatdan voz kechish
Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.
Muallif haqida
Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi.
Boshqa maqolalarDamir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi.