محققان مفهوم "توانایی های در حال ظهور" مدل های زبانی بزرگ را به چالش می کشند
به طور خلاصه
آخرالزمان AGI به دلیل پدیده مدل های زبان بزرگ به طور ناگهانی نگران کننده است نشان دادن توانایی ها که مدل های کوچکتر به نظر نمی رسد.
این پدیده "توانایی های در حال ظهور مدل های زبان بزرگ" نامیده می شود.
نویسندگان مقاله "آیا توانایی های اضطراری مدل های زبان بزرگ سراب هستند؟" استدلال می کنند که تأثیر توانایی های در حال ظهور یک سراب نیست، بلکه رشد قابل پیش بینی در توانایی انجام وظایف است.
آنها نشان می دهند که حداقل 92٪ از مشکلات Big Bench برای مدل های بزرگ پیشرفت ناگهانی ندارند و کیفیت مدل های آنها با افزایش اندازه مدل ها به آرامی و قابل پیش بینی رشد می کند.
در بررسی اخیر قابلیتهای بالقوه مدلهای زبان بزرگ، محققان مفهوم «تواناییهای در حال ظهور» را به چالش میکشند و جنبه قابل پیشبینیتری از عملکرد آنها را روشن میکنند. مقاله با عنوان "پرده برداری از واقعیت های مدل های زبان بزرگ توانایی های اضطراری” تفسیر نادرست معیارها را مورد توجه قرار می دهد که منجر به این تصور غلط شده است که این مدل ها به طور خود به خود مهارت های پیشرفته ای را کسب می کنند.
مفهومی از "توانایی های در حال ظهور” در زمینه مدل های زبان بزرگ، مانند GPT سری، نگرانیهایی را در مورد پتانسیل این مدلها برای توسعه قابلیتهای پیشبینینشده مشابه آگاهی انسان دامن زده است. این مقاله ادعا میکند که این مفروضات مبتنی بر درک ناقصی از رفتار و قابلیتهای واقعی مدلها بودهاند.
پدیده رایج مشاهده شده، که در آن مدلهای بزرگتر ظاهراً تواناییهای جدیدی مانند استدلال انتزاعی، حل مسئله و حتی شوخ طبعی را به دست میآورند، «تواناییهای نوظهور مدلهای زبانی بزرگ» ابداع شده است. نویسندگان مقاله ادعا می کنند که این توانایی ها آنقدر که به نظر می رسد خود به خود نیستند، بلکه نتیجه معیارهای ارزیابی گمراه کننده هستند.
برای نشان دادن نظر خود، محققان وظیفه "حدس زدن معما" را در نظر می گیرند، مشکلی که در آن مدل زبان برای درک معمای زبان طبیعی و پاسخ صحیح به زبان طبیعی مورد نیاز است. به طور سنتی، کیفیت پاسخها با استفاده از یک متریک باینری ارزیابی میشود: به یک پاسخ در صورتی که دقیقاً با پاسخ صحیح مطابقت داشته باشد، نمره 1 و در غیر این صورت نمره 0 به آن اختصاص مییابد.
نکته اصلی در حساسیت متریک به پیچیدگی کار و تعداد پارامترهای مدل نهفته است. محققان نشان می دهند که این متریک باینری منجر به الف ادراک فریبنده از "توانایی های در حال ظهور." مدلهای کوچکتر اغلب دقت ناچیز (eps) را در این معیار نشان میدهند، در حالی که مدلهای بزرگتر، بهویژه آنهایی که تعداد پارامترهای بالایی دارند، به نظر میرسد که به سطوح دقت قابلتوجهی دست مییابند (acc > 0.5).
این مقاله مدعی است که این تغییر ظاهری در توانایی نشان دهنده این نیست که مدل ها به طور خود به خود مهارت های پیچیده را به دست می آورند. در عوض، ظرفیت مدلها برای درک و تولید پاسخهای ظریفتر از ارزیابی دقیقتر خروجیهای آنها ناشی میشود. محققان با تمرکز بر تطابق احتمالی و انسجام معنایی به جای تطابق رشته های دقیق، نشان می دهند که پیشرفت مدل ها در عملکرد، بدون توجه به اندازه آنها، مسیر منطقی تری را دنبال می کند.
بررسی تحول عملکرد مدل با تغییر پارامترها
در یک تحقیق تحلیلی، محققان مکانیک های ظریف پشت "توانایی های در حال ظهور" درک شده را کشف می کنند. مدل های زبان بزرگ. این مطالعه تأثیر معیارهای فوق گسسته را در ارزیابی عملکرد مدل مورد سؤال قرار میدهد و درک پیشبینیکنندهتری از قابلیتهای آنها را با گسترش پارامترهای مدل روشن میکند.
مفهوم رایج «تواناییهای در حال ظهور» در مدلهای زبانی گسترده، بحثها را مجذوب خود کرده و نگرانیهایی را درباره پیشرفتهای بالقوه ایجاد کرده است. این مطالعه به دنبال تفکیک مکانیکهای نهفته در این پدیده و رمزگشایی این است که آیا این مدلها واقعاً قابلیتهای ناگهانی و بیسابقهای را نشان میدهند یا این پیشرفتهای درک شده را میتوان به علت دیگری نسبت داد.
در قلب مطالعه، ارزیابی دقیق معیارهای به کار گرفته شده برای سنجش عملکرد مدل نهفته است. محققان معتقدند که استفاده از معیارهای فوق گسسته، به ویژه متریک باینری معمولی که مطابقت دقیق رشته ها را تعیین می کند، ممکن است تفسیر بزرگ را مخدوش کند. توانایی های مدل زبان. این مطالعه با دقت تجزیه و تحلیل می کند که چگونه توزیع احتمال پاسخ های تولید شده توسط مدل به عنوان مقیاس پارامترهای مدل تکامل می یابد.
برخلاف مفهوم "توانایی های در حال ظهور"، این مطالعه روند سیستماتیک تری را نشان می دهد. با افزایش اندازه مدل، توانایی آن در تخصیص احتمالات بالاتر به پاسخ های مناسب و احتمالات کمتر به پاسخ های نادرست بهبود می یابد. این نشان دهنده افزایش مداوم در ظرفیت مدل برای حل ماهرانه مشکلات در طیف گسترده ای از اندازه ها است. در اصل، این تحقیق نشان میدهد که فرآیند یادگیری مدلها به خوبی ازdefiبه جای یک جهش ناگهانی، مسیر پیشرفت را دنبال کرد.
نویسندگان با پیشنهاد جایگزینی معیارهای گسسته با معیارهای پیوسته، یک تغییر پارادایم را معرفی می کنند. این تغییر تصویر واضح تری از تکامل عملکرد ارائه می دهد. از طریق تجزیه و تحلیل خود، محققان مشخص می کنند که تقریبا 92٪ از مشکلات نیمکت بزرگ با افزایش اندازه مدل، رشد نرم و قابل پیش بینی کیفیت را نشان می دهند. این یافته این تصور را به چالش می کشد که مدل های بزرگتر پیشرفت های ناگهانی را تجربه می کنند و در عوض پیشرفت تدریجی و پیش بینی شده را برجسته می کند.
این مطالعه بینش خود را برای تأیید ادعاهای خود گسترش می دهد. این نشان می دهد که همان اثر "توانایی در حال ظهور" را می توان به طور مصنوعی با استفاده از رمزگذارهای خودکار معمولی شبیه سازی کرد، که نشان می دهد انتخاب معیارها به طور قابل توجهی بر نتایج درک شده تأثیر می گذارد. این مکاشفه دامنه پیامدهای مطالعه را گسترش میدهد و ارتباط آن را فراتر از مدلهای زبانی به تنهایی نشان میدهد.
محققان تاکید می کنند که نتایج آنها اینطور نیست defiپتانسیل "توانایی های نوظهور" یا هوشیاری را در مدل های زبانی بزرگ به طور جدی نفی کنید. با این حال، یافتههای آنها محققان را تشویق میکند تا با دیدگاهی متفاوت به چنین ادعاهایی نزدیک شوند. این مطالعه به جای برون یابی عجولانه و نتیجه گیری افراطی، بر اهمیت بررسی دقیق و تجزیه و تحلیل جامع تأکید می کند.
درباره هوش مصنوعی بیشتر بخوانید:
سلب مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.
مقالات بیشترDamir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.