Google Flamingo AI modeliga YouTube videolari uchun tavsif yozishni o‘rgatdi
Qisqacha
Flamingo qisqa videolarni qidirish orqali topish qiyin bo'lgan muammoni avtomatik ravishda tavsiflarni yaratish orqali hal qiladi.
Google DeepMind, AI tadqiqot laboratoriyasi mavjud rivojlangan Flamingo deb nomlangan vizual til modeli YouTube'da qisqa videolar uchun tavsif yozishga qodir. Flamingo hal qiladigan muammo shundaki, tavsifda kerakli ma'lumotlar yo'qligi sababli qisqa videolarni qidirish orqali topish odatda qiyin. Flamingo modeli ushbu muammoni videoxosting saytlarida millionlab qisqa videokliplar uchun matnlarni avtomatik ravishda yaratish orqali hal qiladi, ular oson qidiruvni ta'minlash uchun "sahna ortida" qo'llaniladi. Video mualliflari metama’lumotlarni ko‘rmasalar-da, bu tomoshabinlarga shortiklarni topish va navigatsiya qilishga yordam beradi. Hozirda Flamingo uzoq vaqtdan beri yangi kliplar ustida ishlamoqda va YouTube’ga yuklangan eski videolarni qayta ishlamoqda.
Ilgari, Google qidiruv paneli yordamida odamlarga videolar ichida ma'lumot qidirish imkonini beruvchi algoritmni taqdim etdi. Yaqinda TwelveLabs shunga o'xshash rivojlanish uchun investorlardan 12 million dollar to'pladi. Ushbu vositalar video uchun yangi imkoniyatlar yaratadi kontent yaratuvchilari ularning ta'sir doirasini va ko'rinishini oshirish. Qidiruv jarayonini yaxshilash va soddalashtirish uchun sun'iy intellektdan foydalanib, DeepMind va shunga o'xshash startaplar videoni inqilob qilmoqda. Oqimli xizmatlar. Ular yanada aqlli va samarali qidiruv texnologiyalarini ishlab chiqishga hissa qo'shmoqda, bu esa tomoshabinlar uchun haqiqatan ham ularni qiziqtiradigan kontentni topishni yanada soddalashtirmoqda.
Sun'iy intellekt qidiruv texnologiyalarini yangilashda muhim rol o'ynaydi. Sun'iy intellektdan foydalangan holda, Flamingo modeli kontentni skanerlashi va seriyalashtirishi va foydalanuvchilarga navigatsiya qilishda yordam berish uchun tarkibni umumlashtiradigan matnlarni yaratishi mumkin. Flamingo modeli videoning audio va vizual mazmuni asosida videoklipning matnli tavsiflarini yaratish uchun chuqur neyron tarmoqlardan foydalanadi. U qisqa shakldagi kontentning eshitish va vizual komponentlarini qamrab olishi va ularni foydalanuvchilar uchun izlash va kirish uchun qulay bo'lgan xulosaga aylantirishi mumkin.
Sun'iy intellektdan foydalanish foydalanuvchilar uchun muhim ma'lumotlarni aniqlashga yordam beradi, bu esa ta'riflarni qo'shishda ijodkorlarning qo'l harakatlarida o'tkazib yuborilishi mumkin. Har bir tafsilotni qo'lda suratga olish uchun ko'p vaqt talab qiladigan harakatlar har doim ham amaliy emas, ayniqsa YouTube kabi platformalarga yuklangan qisqa shakldagi video kontentning doimiy oqimi bilan. Bu aniq qisqa shakldagi kontentni qidirishda foydalanuvchining chalkashishi va umidsizlikka olib kelishi mumkin. Biroq, Flamingo kabi vizual til modellaridan foydalangan holda, metama'lumotlar oson kirish uchun qisqacha ma'lumot berish uchun avtomatik tarzda yaratilishi mumkin, bu esa vaqtni tejaydi va qidiruv jarayonini yanada samarali va aniqroq qiladi.
Flamingo ochiq topshiriqlar uchun yangi zamonaviy vizual til modellarini o'rnatdi
Eng muhim tafsilotlar - Flamingoning yagona vizual til modeli (VLM) keng ko'lamli ochiq multimodal vazifalarni bir necha marta o'rganishda yangi san'at darajasini belgilaydi. Flamingo - bu yagona vizual til modeli (VLM).defikeng ko'lamli ochiq multimodal faoliyat bo'yicha bir necha marta o'rganish. a oladi so'rovi qo'shilgan tasvirlar, videolar va matnlardan iborat bo'lgan kirish va tegishli tilni chiqaradi. Flamingoning vizual va matnli interfeysi, katta til modellari kabi (LLMlar), modelni multimodal maqsadga erishishga olib kelishi mumkin. Modelga yangi rasm yoki video bilan savol berish va keyin Flamingo taklifida tuzilgan vizual kirishlar va kutilgan matn javoblarining bir nechta misollarini hisobga olgan holda javob yaratish mumkin.
Flamingo - bu katta til modellarini kuchli vizual tasvirlar bilan birlashtirgan vizual til modeli bo'lib, mashinani o'rganish maqsadlari uchun izohli ma'lumotlardan foydalanmasdan faqat internetdan keladigan qo'shimcha keng ko'lamli multimodal ma'lumotlar aralashmasiga o'rgatiladi. Har bir topshiriq uchun toʻrtta misol keltirilsa, u avvalgi barcha bir necha marta oʻrganish yondashuvlaridan ustun turadi va har bir vazifa uchun mustaqil ravishda nozik sozlangan va optimallashtirilgan usullardan ustun turadi va bir nechta kattalikdagi koʻproq vazifaga oid maʼlumotlardan foydalanadi. Shuningdek, u modelning hozirgi mezonlaridan tashqari sifat imkoniyatlarini ham sinovdan o‘tkazdi, masalan, jins va teri rangiga oid tasvirlarga taglavhalar qo‘yish va matnning zaharliligini baholovchi Google Perspective API orqali yaratilgan taglavhalarni ishga tushirish. Flamingo ushbu misollar va boshqa vazifalarga modelni o'zgartirmasdan tez moslashishga imkon beradi va multimodal dialogning tayyor imkoniyatlarini namoyish etadi.
Flamingo - bu umumiy maqsadli modellar oilasi bo'lib, ular minimal vazifaga xos misollar bilan tasvir va videoni tushunish vazifalariga qo'llanilishi mumkin. Bu samarali va samarali umumiy maqsadli modellar oilasi boʻlib, ular minimal vazifaga xos misollar bilan tasvir va videoni tushunish vazifalariga qoʻllanilishi mumkin. Flamingoning qobiliyatlari o'rganilgan vizual til modellari bilan boy o'zaro ta'sirga yo'l ochadi, ular yanada yaxshi talqin qilinishi va vizual yordamchi kabi qiziqarli yangi ilovalarni ta'minlaydi.
AI haqida ko'proq o'qing:
Masʼuliyatdan voz kechish
Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.
Muallif haqida
Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi.
Boshqa maqolalarDamir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi.