Yangiliklar hisoboti texnologiya
Mart 15, 2023

Facebook sun'iy intellekt transformatorlarining samaradorligini ikki baravar oshirishning yangi usulini ishlab chiqdi

Qisqacha

Facebook kompaniyasi transformator arxitekturasi asosida sun`iy intellekt transformatorlarining ishlashini ikki barobar oshirishning yangi usulini ishlab chiqdi.

Yangi usul turli bloklarni qayta ishlash orasidagi bo'shliqlarda eng o'xshash yamoqlarni topadi va hisoblash murakkabligini kamaytirish uchun ularni birlashtiradi.

Facebook ishlab chiqdi yangi usul AI transformatorlarining ishlashini ikki baravar oshirish uchun. Usul shunday transformator arxitekturasiga asoslangan va maxsus kitoblar, maqolalar va bloglar kabi uzun shakldagi matnlar uchun mo'ljallangan. Yangi AI transformatorining maqsadi ish faoliyatini yaxshilashdir transformatorga asoslangan modellar uzun shaklli matnda ularni uzoq ketma-ketliklarni boshqarishda samaraliroq va samaraliroq qilish orqali. AI transformatorining natijalari juda istiqbolli va bu yangi usul turli xil vazifalarda transformatorga asoslangan modellarning ishlashini yaxshilashga yordam berish imkoniyatiga ega.

Ushbu yangi usul tilni tarjima qilish, umumlashtirish va savol-javob tizimlari kabi tabiiy tilni qayta ishlash vazifalariga sezilarli ta'sir ko'rsatishi kutilmoqda. Bundan tashqari, uzoqroq va murakkabroq matnlarni boshqarishga qodir bo'lgan yanada murakkab AI modellarini ishlab chiqishga olib kelishi kutilmoqda.

Facebook AI transformatorlarining ishlashini ikki baravar oshirishning yangi usulini ishlab chiqdi
Ko'proq o'qing: 10+ eng yaxshi AI foto muharrirlari 2023: Onlayn va bepul

Tasvirni qayta ishlash uchun zamonaviy transformatorlar uni yamoqlarga (odatda kvadratchalar: quyidagi gifga qarang) kesib tashlaydi va keyin har biri "token" bilan ifodalangan ushbu zarrachalarning tasvirlari ustida ishlaydi. Transformatorlar, biz bilganimizdek, bu token qismlari qancha ko'p bo'lsa, sekinroq ishlaydi (bu matnlarga ham, tasvirlarga ham tegishli) va eng keng tarqalgan transformator kvadratik munosabatlarga ega. Ya'ni, ko'proq tokenlar qo'shilsa, ishlov berish sekinlashadi. Ushbu muammoni hal qilish uchun tadqiqotchilar tasvirni qayta ishlash uchun zarur bo'lgan tokenlar sonini kamaytirish uchun turli usullarni taklif qilishdi, masalan, ierarxik va moslashuvchan birlashma. Ushbu usullar ishlab chiqarish sifatini saqlab qolish va hisoblash xarajatlarini minimallashtirishga qaratilgan.

Yangi usul turli bloklarni qayta ishlash orasidagi bo'shliqlarda eng o'xshash yamoqlarni topadi va hisoblash murakkabligini kamaytirish uchun ularni birlashtiradi. Birlashtirilgan tokenlarning ulushi giperparametrdir; qanchalik baland bo'lsa, sifat shunchalik past bo'ladi, lekin tezlashuv ham shunchalik yuqori bo'ladi. Tajribalar shuni ko'rsatadiki, 40-0.1% sifat yo'qotilishi bilan tokenlarning taxminan 0.4% ni birlashtirish va ikki marta tezlashtirishga erishish mumkin (shunday qilib, kamroq xotira sarflanadi). Ushbu yangi usul tasvirni qayta ishlashning hisoblash murakkabligini kamaytirish uchun istiqbolli yechim bo'lib, yakuniy mahsulot sifatiga putur etkazmasdan tezroq va samaraliroq ishlov berishga imkon beradi.

Qaysi yamoqlarni birlashtirganimizni tasavvur qilsak, ular 1) bir-biriga yaqin ekanligini va 2) bir xil ob'ektni tasvirlashini ko'rishimiz mumkin (GIF-dagi bir xil rangdagi joylarga qarang). Ya'ni, muhim ma'lumotlar yo'qolmaydi; ob'ekt modelning "ko'rish maydonida" qoladi. Bu transformatorda qanchalik kech qo'llanilsa, shuncha ko'p tokenlar birlashtiriladi (chunki bu yuqori darajadagi tasvirlar bo'lib, ular tasvirning mazmunini yaxshi tasvirlaydi).

Aqllilik va biror narsaning qanday ishlashini tushunishga asoslangan bunday muhandislik yondashuvlari juda jozibali ko'rinadi. Bundan tashqari, Meta-ning ishlab chiquvchilari StableDiffusion-ga ko'proq narsalarni olib kelishga va'da berishadi, bu erda ham ishlarni tezlashtirish. Ajoyib, chunki transformatorlar hamma joyda mavjud, shuning uchun bunday fokuslar tezda keng turdagi modellarda amalga oshirilishi mumkin. Bu muhandislik yechimlarining turli sohalarda keng ta'sir ko'rsatishi potentsialini ko'rsatadi. Ushbu yutuqlar qanday bo'lishini ko'rish qiziq transformator modellari vaqt o'tishi bilan rivojlanishda va takomillashishda davom etadi.

  • Meta AI va Paperswithcode Ilmiy matnlar bo'yicha o'qitilgan Galactica birinchi 120B modelini chiqardi, bu esa aniqroq va tezroq bashorat qilish imkonini beradi. Galactica-ning maqsadi tadqiqotchilarga muhimni ahamiyatsizdan ajratishga yordam berishdir.

Batafsil tegishli yangiliklarni o'qing:

Masʼuliyatdan voz kechish

Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.

Muallif haqida

Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi. 

Boshqa maqolalar
Damir Yalolov
Damir Yalolov

Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi. 

Institutsional ishtaha o'zgaruvchanlik sharoitida Bitcoin ETFlariga nisbatan o'sib bormoqda

13F arizalari orqali oshkor qilish Bitcoin ETFs bilan shug'ullanadigan taniqli institutsional investorlarni ochib beradi, bu esa tobora ortib borayotgan qabul qilinishini ta'kidlaydi ...

Ko'proq ma'lumot oling

Hukm chiqarish kuni keldi: AQSh sudi DOJning iltimosini ko'rib chiqayotgani sababli CZ taqdiri muvozanatda.

Changpeng Chjao bugun AQShning Sietldagi sudida hukm chiqarilishiga tayyor.

Ko'proq ma'lumot oling
Innovatsion texnologiyalar hamjamiyatimizga qo'shiling
Ko'proq o'qing
Ko'proq o'qing
Injective inEVM-ga qayta tiklash xavfsizligini olib kelish uchun AltLayer bilan kuchlarni birlashtiradi
ish Yangiliklar hisoboti texnologiya
Injective inEVM-ga qayta tiklash xavfsizligini olib kelish uchun AltLayer bilan kuchlarni birlashtiradi
, 3 2024 mumkin
Masa, MASA kreditlash pulini joriy qilish uchun kassa bilan hamkorlik qiladi, USDC asosida qarz olishga imkon beradi
Birja Yangiliklar hisoboti texnologiya
Masa, MASA kreditlash pulini joriy qilish uchun kassa bilan hamkorlik qiladi, USDC asosida qarz olishga imkon beradi
, 3 2024 mumkin
Velodrome kelgusi haftalarda Superchain beta-versiyasini ishga tushiradi va OP Stack Layer 2 blokcheynlarida kengayadi
Birja Yangiliklar hisoboti texnologiya
Velodrome kelgusi haftalarda Superchain beta-versiyasini ishga tushiradi va OP Stack Layer 2 blokcheynlarida kengayadi
, 3 2024 mumkin
CARV o'zining ma'lumotlar qatlamini markazsizlashtirish va mukofotlarni tarqatish uchun Aethir bilan hamkorlikni e'lon qiladi
ish Yangiliklar hisoboti texnologiya
CARV o'zining ma'lumotlar qatlamini markazsizlashtirish va mukofotlarni tarqatish uchun Aethir bilan hamkorlikni e'lon qiladi
, 3 2024 mumkin
CRYPTOMERIA LABS PTE. LTD.