Yangiliklar hisoboti texnologiya
, 29 2023 mumkin

Google Flamingo AI modeliga YouTube videolari uchun tavsif yozishni o‘rgatdi

Qisqacha

Flamingo qisqa videolarni qidirish orqali topish qiyin bo'lgan muammoni avtomatik ravishda tavsiflarni yaratish orqali hal qiladi.

Google DeepMind, AI tadqiqot laboratoriyasi mavjud rivojlangan Flamingo deb nomlangan vizual til modeli YouTube'da qisqa videolar uchun tavsif yozishga qodir. Flamingo hal qiladigan muammo shundaki, tavsifda kerakli ma'lumotlar yo'qligi sababli qisqa videolarni qidirish orqali topish odatda qiyin. Flamingo modeli ushbu muammoni videoxosting saytlarida millionlab qisqa videokliplar uchun matnlarni avtomatik ravishda yaratish orqali hal qiladi, ular oson qidiruvni ta'minlash uchun "sahna ortida" qo'llaniladi. Video mualliflari metama’lumotlarni ko‘rmasalar-da, bu tomoshabinlarga shortiklarni topish va navigatsiya qilishga yordam beradi. Hozirda Flamingo uzoq vaqtdan beri yangi kliplar ustida ishlamoqda va YouTube’ga yuklangan eski videolarni qayta ishlamoqda.

Google Flamingo AI modeliga YouTube videolari uchun tavsif yozishni o‘rgatdi
deepmind.com

Ilgari, Google qidiruv paneli yordamida odamlarga videolar ichida ma'lumot qidirish imkonini beruvchi algoritmni taqdim etdi. Yaqinda TwelveLabs shunga o'xshash rivojlanish uchun investorlardan 12 million dollar to'pladi. Ushbu vositalar video uchun yangi imkoniyatlar yaratadi kontent yaratuvchilari ularning ta'sir doirasini va ko'rinishini oshirish. Qidiruv jarayonini yaxshilash va soddalashtirish uchun sun'iy intellektdan foydalanib, DeepMind va shunga o'xshash startaplar videoni inqilob qilmoqda. Oqimli xizmatlar. Ular yanada aqlli va samarali qidiruv texnologiyalarini ishlab chiqishga hissa qo'shmoqda, bu esa tomoshabinlar uchun haqiqatan ham ularni qiziqtiradigan kontentni topishni yanada soddalashtirmoqda.

Sun'iy intellekt qidiruv texnologiyalarini yangilashda muhim rol o'ynaydi. Sun'iy intellektdan foydalangan holda, Flamingo modeli kontentni skanerlashi va seriyalashtirishi va foydalanuvchilarga navigatsiya qilishda yordam berish uchun tarkibni umumlashtiradigan matnlarni yaratishi mumkin. Flamingo modeli videoning audio va vizual mazmuni asosida videoklipning matnli tavsiflarini yaratish uchun chuqur neyron tarmoqlardan foydalanadi. U qisqa shakldagi kontentning eshitish va vizual komponentlarini qamrab olishi va ularni foydalanuvchilar uchun izlash va kirish uchun qulay bo'lgan xulosaga aylantirishi mumkin.

Sun'iy intellektdan foydalanish foydalanuvchilar uchun muhim ma'lumotlarni aniqlashga yordam beradi, bu esa ta'riflarni qo'shishda ijodkorlarning qo'l harakatlarida o'tkazib yuborilishi mumkin. Har bir tafsilotni qo'lda suratga olish uchun ko'p vaqt talab qiladigan harakatlar har doim ham amaliy emas, ayniqsa YouTube kabi platformalarga yuklangan qisqa shakldagi video kontentning doimiy oqimi bilan. Bu aniq qisqa shakldagi kontentni qidirishda foydalanuvchining chalkashishi va umidsizlikka olib kelishi mumkin. Biroq, Flamingo kabi vizual til modellaridan foydalangan holda, metama'lumotlar oson kirish uchun qisqacha ma'lumot berish uchun avtomatik tarzda yaratilishi mumkin, bu esa vaqtni tejaydi va qidiruv jarayonini yanada samarali va aniqroq qiladi.

Flamingo ochiq topshiriqlar uchun yangi zamonaviy vizual til modellarini o'rnatdi

Eng muhim tafsilotlar - Flamingoning yagona vizual til modeli (VLM) keng ko'lamli ochiq multimodal vazifalarni bir necha marta o'rganishda yangi san'at darajasini belgilaydi. Flamingo - bu yagona vizual til modeli (VLM).defikeng ko'lamli ochiq multimodal faoliyat bo'yicha bir necha marta o'rganish. a oladi so'rovi qo'shilgan tasvirlar, videolar va matnlardan iborat bo'lgan kirish va tegishli tilni chiqaradi. Flamingoning vizual va matnli interfeysi, katta til modellari kabi (LLMlar), modelni multimodal maqsadga erishishga olib kelishi mumkin. Modelga yangi rasm yoki video bilan savol berish va keyin Flamingo taklifida tuzilgan vizual kirishlar va kutilgan matn javoblarining bir nechta misollarini hisobga olgan holda javob yaratish mumkin.

Flamingo - bu katta til modellarini kuchli vizual tasvirlar bilan birlashtirgan vizual til modeli bo'lib, mashinani o'rganish maqsadlari uchun izohli ma'lumotlardan foydalanmasdan faqat internetdan keladigan qo'shimcha keng ko'lamli multimodal ma'lumotlar aralashmasiga o'rgatiladi. Har bir topshiriq uchun toʻrtta misol keltirilsa, u avvalgi barcha bir necha marta oʻrganish yondashuvlaridan ustun turadi va har bir vazifa uchun mustaqil ravishda nozik sozlangan va optimallashtirilgan usullardan ustun turadi va bir nechta kattalikdagi koʻproq vazifaga oid maʼlumotlardan foydalanadi. Shuningdek, u modelning hozirgi mezonlaridan tashqari sifat imkoniyatlarini ham sinovdan o‘tkazdi, masalan, jins va teri rangiga oid tasvirlarga taglavhalar qo‘yish va matnning zaharliligini baholovchi Google Perspective API orqali yaratilgan taglavhalarni ishga tushirish. Flamingo ushbu misollar va boshqa vazifalarga modelni o'zgartirmasdan tez moslashishga imkon beradi va multimodal dialogning tayyor imkoniyatlarini namoyish etadi.

Flamingo - bu umumiy maqsadli modellar oilasi bo'lib, ular minimal vazifaga xos misollar bilan tasvir va videoni tushunish vazifalariga qo'llanilishi mumkin. Bu samarali va samarali umumiy maqsadli modellar oilasi boʻlib, ular minimal vazifaga xos misollar bilan tasvir va videoni tushunish vazifalariga qoʻllanilishi mumkin. Flamingoning qobiliyatlari o'rganilgan vizual til modellari bilan boy o'zaro ta'sirga yo'l ochadi, ular yanada yaxshi talqin qilinishi va vizual yordamchi kabi qiziqarli yangi ilovalarni ta'minlaydi.

AI haqida ko'proq o'qing:

Masʼuliyatdan voz kechish

Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.

Muallif haqida

Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi. 

Boshqa maqolalar
Damir Yalolov
Damir Yalolov

Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi. 

Institutsional ishtaha o'zgaruvchanlik sharoitida Bitcoin ETFlariga nisbatan o'sib bormoqda

13F arizalari orqali oshkor qilish Bitcoin ETFs bilan shug'ullanadigan taniqli institutsional investorlarni ochib beradi, bu esa tobora ortib borayotgan qabul qilinishini ta'kidlaydi ...

Ko'proq ma'lumot oling

Hukm chiqarish kuni keldi: AQSh sudi DOJning iltimosini ko'rib chiqayotgani sababli CZ taqdiri muvozanatda.

Changpeng Chjao bugun AQShning Sietldagi sudida hukm chiqarilishiga tayyor.

Ko'proq ma'lumot oling
Innovatsion texnologiyalar hamjamiyatimizga qo'shiling
Ko'proq o'qing
Ko'proq o'qing
Injective inEVM-ga qayta tiklash xavfsizligini olib kelish uchun AltLayer bilan kuchlarni birlashtiradi
ish Yangiliklar hisoboti texnologiya
Injective inEVM-ga qayta tiklash xavfsizligini olib kelish uchun AltLayer bilan kuchlarni birlashtiradi
, 3 2024 mumkin
Masa, MASA kreditlash pulini joriy qilish uchun kassa bilan hamkorlik qiladi, USDC asosida qarz olishga imkon beradi
Birja Yangiliklar hisoboti texnologiya
Masa, MASA kreditlash pulini joriy qilish uchun kassa bilan hamkorlik qiladi, USDC asosida qarz olishga imkon beradi
, 3 2024 mumkin
Velodrome kelgusi haftalarda Superchain beta-versiyasini ishga tushiradi va OP Stack Layer 2 blokcheynlarida kengayadi
Birja Yangiliklar hisoboti texnologiya
Velodrome kelgusi haftalarda Superchain beta-versiyasini ishga tushiradi va OP Stack Layer 2 blokcheynlarida kengayadi
, 3 2024 mumkin
CARV o'zining ma'lumotlar qatlamini markazsizlashtirish va mukofotlarni tarqatish uchun Aethir bilan hamkorlikni e'lon qiladi
ish Yangiliklar hisoboti texnologiya
CARV o'zining ma'lumotlar qatlamini markazsizlashtirish va mukofotlarni tarqatish uchun Aethir bilan hamkorlikni e'lon qiladi
, 3 2024 mumkin
CRYPTOMERIA LABS PTE. LTD.