گزارش خبری پیشرفته
مارس 15، 2023

فیس بوک روش جدیدی برای دو برابر کردن عملکرد ترانسفورماتورهای هوش مصنوعی توسعه می دهد

به طور خلاصه

فیسبوک روش جدیدی را برای دو برابر کردن عملکرد ترانسفورماتورهای هوش مصنوعی بر اساس معماری ترانسفورماتور توسعه داده است.

روش جدید مشابه ترین وصله ها را در شکاف بین پردازش بلوک های مختلف پیدا می کند و آنها را برای کاهش پیچیدگی محاسباتی ترکیب می کند.

فیس بوک یک روش جدید برای دو برابر کردن عملکرد ترانسفورماتورهای هوش مصنوعی. روش این است بر اساس معماری ترانسفورماتور و به طور خاص برای متون طولانی مانند کتاب، مقاله و وبلاگ طراحی شده است. هدف از ترانسفورماتور جدید هوش مصنوعی بهبود عملکرد است مدل های مبتنی بر ترانسفورماتور بر روی متن های طولانی با کارآمدتر و موثرتر کردن آنها در مدیریت دنباله های طولانی. نتایج ترانسفورماتور هوش مصنوعی بسیار امیدوارکننده است و این روش جدید این شانس را دارد که به بهبود عملکرد مدل‌های مبتنی بر ترانسفورماتور در کارهای مختلف کمک کند.

انتظار می رود این روش جدید تأثیر قابل توجهی بر وظایف پردازش زبان طبیعی مانند ترجمه زبان، خلاصه سازی و سیستم های پاسخگویی به پرسش داشته باشد. همچنین انتظار می‌رود که منجر به توسعه مدل‌های پیشرفته‌تر هوش مصنوعی شود که می‌توانند متون طولانی‌تر و پیچیده‌تر را مدیریت کنند.

فیسبوک روش جدیدی را برای دو برابر کردن عملکرد ترانسفورماتورهای هوش مصنوعی توسعه داد
ادامه مطلب: 10+ بهترین ویرایشگر عکس هوش مصنوعی 2023: آنلاین و رایگان

برای پردازش تصویر، ترانسفورماتورهای مدرن آن را به تکه‌هایی برش می‌دهند (معمولاً مربع‌ها: گیف زیر را ببینید) و سپس بر روی نمایش‌هایی از این ذرات عمل می‌کنند، که هر کدام با یک «توکن» نشان داده می‌شوند. همانطور که می دانیم، ترانسفورماتورها، هر چه تعداد این قطعات نشانه وجود داشته باشد، کندتر کار می کنند (این برای متون و تصاویر صدق می کند)، و رایج ترین ترانسفورماتور یک رابطه درجه دوم دارد. یعنی با اضافه شدن توکن های بیشتر، پردازش کندتر می شود. برای رفع این مشکل، محققان تکنیک‌های مختلفی را برای کاهش تعداد توکن‌های مورد نیاز برای پردازش تصویر پیشنهاد کرده‌اند، مانند ادغام سلسله مراتبی و تطبیقی. هدف این روش ها حفظ کیفیت خروجی در عین به حداقل رساندن هزینه محاسباتی است.

روش جدید مشابه ترین وصله ها را در شکاف بین پردازش بلوک های مختلف پیدا می کند و آنها را برای کاهش پیچیدگی محاسباتی ترکیب می کند. سهم توکن های ادغام شده یک فراپارامتر است. هرچه بالاتر باشد، کیفیت پایین‌تر و همچنین شتاب بالاتر است. آزمایش‌ها نشان می‌دهند که می‌توان تقریباً 40 درصد توکن‌ها را با افت کیفیت 0.1-0.4 درصد ادغام کرد و شتاب دو برابری گرفت (در نتیجه حافظه کمتری مصرف می‌شود). این روش جدید یک راه حل امیدوارکننده برای کاهش پیچیدگی محاسباتی پردازش تصویر است و می تواند امکان پردازش سریعتر و کارآمدتر را بدون به خطر انداختن کیفیت خروجی نهایی فراهم کند.

وقتی تجسم می‌کنیم که کدام وصله‌ها را ادغام می‌کنیم، می‌توانیم ببینیم که آنها 1) نزدیک یکدیگر هستند و 2) یک شی را توصیف می‌کنند (به قسمت‌های همرنگ در GIF مراجعه کنید). یعنی هیچ اطلاعات مهمی از دست نمی رود. شی "در میدان دید" مدل باقی می ماند. هر چه دیرتر در ترانسفورماتور اعمال شود، نشانه های بیشتری با هم ادغام می شوند (زیرا اینها نمایش های سطح بالاتری هستند که خود محتوای تصویر را به خوبی توصیف می کنند).

چنین رویکردهای مهندسی مبتنی بر نبوغ و درک نحوه عملکرد یک چیز بسیار جذاب به نظر می رسند. همچنین، توسعه‌دهندگان متا قول داده‌اند که موارد بیشتری را به StableDiffusion بیاورند تا در آنجا نیز سرعت بیشتری داشته باشند. بسیار عالی است که، چون ترانسفورماتورها همه جا هستند، چنین ترفندهایی را می توان به سرعت در طیف گسترده ای از مدل ها اجرا کرد. این نشان دهنده پتانسیل راه حل های مهندسی برای تأثیر گسترده در صنایع مختلف است. جالب خواهد بود که ببینیم این پیشرفت‌ها چگونه است مدل های ترانسفورماتور در طول زمان به تکامل و بهبود ادامه خواهد داد.

  • Meta AI و Paperswithcode اولین مدل 120B Galactica را منتشر کرده اند که بر روی متون علمی آموزش دیده است و امکان پیش بینی دقیق تر و سریع تر را فراهم می کند. هدف Galactica این است که به محققان کمک کند تا چیزهای مهم را از موارد نامربوط جدا کنند.

ادامه خبر مرتبط را بخوانید:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

در میان نوسانات، اشتهای سازمانی به سمت ETF های بیت کوین رشد می کند

افشاگری از طریق پرونده های 13F نشان می دهد که سرمایه گذاران نهادی قابل توجهی در ETF های بیت کوین مشغول هستند و بر پذیرش فزاینده ...

بیشتر بدانید

روز صدور حکم فرا می رسد: با بررسی دادگاه ایالات متحده به درخواست وزارت دادگستری، سرنوشت CZ در تعادل است

چانگ پنگ ژائو امروز در دادگاهی در سیاتل آمریکا محکوم خواهد شد.

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
Injective با AltLayer نیروها را به هم می پیوندد تا امنیت مجدد را به inEVM بیاورد
کسب و کار گزارش خبری پیشرفته
Injective با AltLayer نیروها را به هم می پیوندد تا امنیت مجدد را به inEVM بیاورد
ممکن است 3، 2024
Masa با Teller همکاری می کند تا استخر وام MASA را معرفی کند، وام USDC را بر اساس امکان پذیر می کند
بازارها گزارش خبری پیشرفته
Masa با Teller همکاری می کند تا استخر وام MASA را معرفی کند، وام USDC را بر اساس امکان پذیر می کند
ممکن است 3، 2024
Velodrome نسخه بتا سوپرچین را در هفته‌های آینده عرضه می‌کند و در سراسر بلاک‌چین‌های OP Stack Layer 2 گسترش می‌یابد
بازارها گزارش خبری پیشرفته
Velodrome نسخه بتا سوپرچین را در هفته‌های آینده عرضه می‌کند و در سراسر بلاک‌چین‌های OP Stack Layer 2 گسترش می‌یابد
ممکن است 3، 2024
CARV شراکت با Aethir را برای تمرکززدایی لایه داده خود و توزیع جوایز اعلام می کند.
کسب و کار گزارش خبری پیشرفته
CARV شراکت با Aethir را برای تمرکززدایی لایه داده خود و توزیع جوایز اعلام می کند.
ممکن است 3، 2024
CRYPTOMERIA LABS PTE. محدود