نظر پیشرفته
اوت 23، 2023

محققان مفهوم "توانایی های در حال ظهور" مدل های زبانی بزرگ را به چالش می کشند

به طور خلاصه

آخرالزمان AGI به دلیل پدیده مدل های زبان بزرگ به طور ناگهانی نگران کننده است نشان دادن توانایی ها که مدل های کوچکتر به نظر نمی رسد.

این پدیده "توانایی های در حال ظهور مدل های زبان بزرگ" نامیده می شود.

نویسندگان مقاله "آیا توانایی های اضطراری مدل های زبان بزرگ سراب هستند؟" استدلال می کنند که تأثیر توانایی های در حال ظهور یک سراب نیست، بلکه رشد قابل پیش بینی در توانایی انجام وظایف است.

آنها نشان می دهند که حداقل 92٪ از مشکلات Big Bench برای مدل های بزرگ پیشرفت ناگهانی ندارند و کیفیت مدل های آنها با افزایش اندازه مدل ها به آرامی و قابل پیش بینی رشد می کند.

در بررسی اخیر قابلیت‌های بالقوه مدل‌های زبان بزرگ، محققان مفهوم «توانایی‌های در حال ظهور» را به چالش می‌کشند و جنبه قابل پیش‌بینی‌تری از عملکرد آنها را روشن می‌کنند. مقاله با عنوان "پرده برداری از واقعیت های مدل های زبان بزرگ توانایی های اضطراری” تفسیر نادرست معیارها را مورد توجه قرار می دهد که منجر به این تصور غلط شده است که این مدل ها به طور خود به خود مهارت های پیشرفته ای را کسب می کنند.

محققان مفهوم "توانایی های در حال ظهور" مدل های زبانی بزرگ را به چالش می کشند
اعتبار: Metaverse Post / Stable Diffusion

مفهومی از "توانایی های در حال ظهور” در زمینه مدل های زبان بزرگ، مانند GPT سری، نگرانی‌هایی را در مورد پتانسیل این مدل‌ها برای توسعه قابلیت‌های پیش‌بینی‌نشده مشابه آگاهی انسان دامن زده است. این مقاله ادعا می‌کند که این مفروضات مبتنی بر درک ناقصی از رفتار و قابلیت‌های واقعی مدل‌ها بوده‌اند.

پدیده رایج مشاهده شده، که در آن مدل‌های بزرگ‌تر ظاهراً توانایی‌های جدیدی مانند استدلال انتزاعی، حل مسئله و حتی شوخ طبعی را به دست می‌آورند، «توانایی‌های نوظهور مدل‌های زبانی بزرگ» ابداع شده است. نویسندگان مقاله ادعا می کنند که این توانایی ها آنقدر که به نظر می رسد خود به خود نیستند، بلکه نتیجه معیارهای ارزیابی گمراه کننده هستند.

برای نشان دادن نظر خود، محققان وظیفه "حدس زدن معما" را در نظر می گیرند، مشکلی که در آن مدل زبان برای درک معمای زبان طبیعی و پاسخ صحیح به زبان طبیعی مورد نیاز است. به طور سنتی، کیفیت پاسخ‌ها با استفاده از یک متریک باینری ارزیابی می‌شود: به یک پاسخ در صورتی که دقیقاً با پاسخ صحیح مطابقت داشته باشد، نمره 1 و در غیر این صورت نمره 0 به آن اختصاص می‌یابد.

نکته اصلی در حساسیت متریک به پیچیدگی کار و تعداد پارامترهای مدل نهفته است. محققان نشان می دهند که این متریک باینری منجر به الف ادراک فریبنده از "توانایی های در حال ظهور." مدل‌های کوچک‌تر اغلب دقت ناچیز (eps) را در این معیار نشان می‌دهند، در حالی که مدل‌های بزرگ‌تر، به‌ویژه آنهایی که تعداد پارامترهای بالایی دارند، به نظر می‌رسد که به سطوح دقت قابل‌توجهی دست می‌یابند (acc > 0.5).

این مقاله مدعی است که این تغییر ظاهری در توانایی نشان دهنده این نیست که مدل ها به طور خود به خود مهارت های پیچیده را به دست می آورند. در عوض، ظرفیت مدل‌ها برای درک و تولید پاسخ‌های ظریف‌تر از ارزیابی دقیق‌تر خروجی‌های آن‌ها ناشی می‌شود. محققان با تمرکز بر تطابق احتمالی و انسجام معنایی به جای تطابق رشته های دقیق، نشان می دهند که پیشرفت مدل ها در عملکرد، بدون توجه به اندازه آنها، مسیر منطقی تری را دنبال می کند.

مربوط: تکامل چت ربات ها از T9-Era و GPT-1 به ChatGPT

بررسی تحول عملکرد مدل با تغییر پارامترها

بررسی تحول عملکرد مدل با تغییر پارامترها
اعتبار: Metaverse Post / Stable Diffusion

در یک تحقیق تحلیلی، محققان مکانیک های ظریف پشت "توانایی های در حال ظهور" درک شده را کشف می کنند. مدل های زبان بزرگ. این مطالعه تأثیر معیارهای فوق گسسته را در ارزیابی عملکرد مدل مورد سؤال قرار می‌دهد و درک پیش‌بینی‌کننده‌تری از قابلیت‌های آنها را با گسترش پارامترهای مدل روشن می‌کند.

مفهوم رایج «توانایی‌های در حال ظهور» در مدل‌های زبانی گسترده، بحث‌ها را مجذوب خود کرده و نگرانی‌هایی را درباره پیشرفت‌های بالقوه ایجاد کرده است. این مطالعه به دنبال تفکیک مکانیک‌های نهفته در این پدیده و رمزگشایی این است که آیا این مدل‌ها واقعاً قابلیت‌های ناگهانی و بی‌سابقه‌ای را نشان می‌دهند یا این پیشرفت‌های درک شده را می‌توان به علت دیگری نسبت داد.

در قلب مطالعه، ارزیابی دقیق معیارهای به کار گرفته شده برای سنجش عملکرد مدل نهفته است. محققان معتقدند که استفاده از معیارهای فوق گسسته، به ویژه متریک باینری معمولی که مطابقت دقیق رشته ها را تعیین می کند، ممکن است تفسیر بزرگ را مخدوش کند. توانایی های مدل زبان. این مطالعه با دقت تجزیه و تحلیل می کند که چگونه توزیع احتمال پاسخ های تولید شده توسط مدل به عنوان مقیاس پارامترهای مدل تکامل می یابد.

برخلاف مفهوم "توانایی های در حال ظهور"، این مطالعه روند سیستماتیک تری را نشان می دهد. با افزایش اندازه مدل، توانایی آن در تخصیص احتمالات بالاتر به پاسخ های مناسب و احتمالات کمتر به پاسخ های نادرست بهبود می یابد. این نشان دهنده افزایش مداوم در ظرفیت مدل برای حل ماهرانه مشکلات در طیف گسترده ای از اندازه ها است. در اصل، این تحقیق نشان می‌دهد که فرآیند یادگیری مدل‌ها به خوبی ازdefiبه جای یک جهش ناگهانی، مسیر پیشرفت را دنبال کرد.

نویسندگان با پیشنهاد جایگزینی معیارهای گسسته با معیارهای پیوسته، یک تغییر پارادایم را معرفی می کنند. این تغییر تصویر واضح تری از تکامل عملکرد ارائه می دهد. از طریق تجزیه و تحلیل خود، محققان مشخص می کنند که تقریبا 92٪ از مشکلات نیمکت بزرگ با افزایش اندازه مدل، رشد نرم و قابل پیش بینی کیفیت را نشان می دهند. این یافته این تصور را به چالش می کشد که مدل های بزرگتر پیشرفت های ناگهانی را تجربه می کنند و در عوض پیشرفت تدریجی و پیش بینی شده را برجسته می کند.

این مطالعه بینش خود را برای تأیید ادعاهای خود گسترش می دهد. این نشان می دهد که همان اثر "توانایی در حال ظهور" را می توان به طور مصنوعی با استفاده از رمزگذارهای خودکار معمولی شبیه سازی کرد، که نشان می دهد انتخاب معیارها به طور قابل توجهی بر نتایج درک شده تأثیر می گذارد. این مکاشفه دامنه پیامدهای مطالعه را گسترش می‌دهد و ارتباط آن را فراتر از مدل‌های زبانی به تنهایی نشان می‌دهد.

محققان تاکید می کنند که نتایج آنها اینطور نیست defiپتانسیل "توانایی های نوظهور" یا هوشیاری را در مدل های زبانی بزرگ به طور جدی نفی کنید. با این حال، یافته‌های آنها محققان را تشویق می‌کند تا با دیدگاهی متفاوت به چنین ادعاهایی نزدیک شوند. این مطالعه به جای برون یابی عجولانه و نتیجه گیری افراطی، بر اهمیت بررسی دقیق و تجزیه و تحلیل جامع تأکید می کند.

درباره هوش مصنوعی بیشتر بخوانید:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

در میان نوسانات، اشتهای سازمانی به سمت ETF های بیت کوین رشد می کند

افشاگری از طریق پرونده های 13F نشان می دهد که سرمایه گذاران نهادی قابل توجهی در ETF های بیت کوین مشغول هستند و بر پذیرش فزاینده ...

بیشتر بدانید

روز صدور حکم فرا می رسد: با بررسی دادگاه ایالات متحده به درخواست وزارت دادگستری، سرنوشت CZ در تعادل است

چانگ پنگ ژائو امروز در دادگاهی در سیاتل آمریکا محکوم خواهد شد.

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
Nexo "شکار" را آغاز می کند تا به کاربران با 12 میلیون دلار توکن NEXO برای تعامل با اکوسیستم خود پاداش دهد.
بازارها گزارش خبری پیشرفته
Nexo "شکار" را آغاز می کند تا به کاربران با 12 میلیون دلار توکن NEXO برای تعامل با اکوسیستم خود پاداش دهد.
ممکن است 8، 2024
صرافی Revolut X Revolut، معامله‌گران رمزارز را با هزینه‌های سازنده صفر و تجزیه‌وتحلیل پیشرفته وام می‌کند.
بازارها نرم افزار داستان ها و نقدها پیشرفته
صرافی Revolut X Revolut، معامله‌گران رمزارز را با هزینه‌های سازنده صفر و تجزیه‌وتحلیل پیشرفته وام می‌کند.
ممکن است 8، 2024
Lisk رسما به لایه 2 اتریوم منتقل می شود و Core نسخه 4.0.6 را معرفی می کند
گزارش خبری پیشرفته
Lisk رسما به لایه 2 اتریوم منتقل می شود و Core نسخه 4.0.6 را معرفی می کند
ممکن است 8، 2024
میم کوین های جدید می 2024: 7 انتخاب برای طرفداران کریپتو
هضم بازارها پیشرفته
میم کوین های جدید می 2024: 7 انتخاب برای طرفداران کریپتو
ممکن است 8، 2024
CRYPTOMERIA LABS PTE. محدود