Stack Overflow به Reddit در شارژ غول های فناوری برای داده های آموزشی هوش مصنوعی می پیوندد
به طور خلاصه
Stack Overflow می خواهد غول های فناوری را که از داده های آن برای توسعه LLM برای اهداف تجاری استفاده می کنند، شارژ کند.
هم Stack Overflow و هم Reddit به داده های مجوز به صورت رایگان برای برخی شرکت ها ادامه می دهند.
سرریز پشته در حال حاضر در حال توسعه خدمات هوش مصنوعی مولد خود است.
Stack Overflow، یک انجمن پرسش و پاسخ برای برنامه نویسان، تصمیم گرفته است که از غول های فناوری برای استفاده از داده های خود برای آموزش هوش مصنوعی و مدل های زبان بزرگ (LLM) هزینه بگیرد. سیمی اولین گزارش
این به دنبال اعلام Reddit در روز سهشنبه است که این کار را انجام خواهد داد شروع به شارژ برای دسترسی به API داده آن می کند. در پاسخ به گوگل، OpenAIاستیو هافمن، مدیر عامل و یکی از بنیانگذاران Reddit، به نیویورک تایمز گفت که چنین شرکتهایی اکنون باید برای استفاده از دادههای Reddit هزینه پرداخت کنند. مدل های هوش مصنوعی خود را از ژوئن آموزش دهید.
هافمن به تایمز گفت: «خزیدن در Reddit، ایجاد ارزش، و عدم بازگرداندن هیچ یک از آن ارزش به کاربران، چیزی است که ما با آن مشکل داریم. توسعهدهندگانی که مایل به ایجاد برنامهها و رباتهایی هستند که استفاده از Reddit را تسهیل میکنند، و همچنین محققانی که میخواهند Reddit را صرفاً برای اهداف آکادمیک یا غیرتجاری مطالعه کنند، به دسترسی رایگان به API Reddit ادامه خواهند داد.
ناشران رسانه های دیجیتال و چاپی نیز غول های هوش مصنوعی را رها نمی کنند. اتحاد خبر/رسانه خود را منتشر کرد اصول هوش مصنوعی روز پنجشنبه، اعلام کرد که استفاده بدون مجوز از محتوای آن توسط سیستمهای هوش مصنوعی مولد (GAI) نقض حقوق مالکیت معنوی است. این دستورالعمل همچنین تصریح میکند که سیستمهای GAI باید قبل از استفاده از محتوای خود از ناشران مجوز بگیرند و ناشران باید این حق را داشته باشند که برای جبران منصفانه استفاده از IP خود توسط این توسعهدهندگان مذاکره کنند.
بیش از 50 میلیون پرسش و پاسخ در Stack Overflow ارسال شده است. متا دارد آموزش داشته است مدل زبان بزرگ آن LLaMA با استفاده از داده های خراشیده شده از Stack Exchange، سازنده Stack Overflow.
پراشانت چاندراسکار، مدیرعامل Stack Overflow، در مورد حمایت خود از رویکرد Reddit به The Wired گفت:
پلتفرمهای اجتماعی که به LLMها کمک میکنند باید کاملاً برای مشارکتهایشان جبران شود تا شرکتهایی مانند ما بتوانند مجدداً در جوامع ما سرمایهگذاری کنند تا به پیشرفت آنها ادامه دهند.»
چاندراسکار افزود که توسعه دهندگان LLM که از داده های Stack Overflow استفاده می کنند، اطلاعات سایت را نقض می کنند شرایط استفاده از خدمات از آنجایی که کاربران مالک محتوایی هستند که پست میکنند، که تحت یک مجوز Creative Commons قرار میگیرد که از هر کسی که بعداً از محتوا استفاده میکند، باید منبع را ذکر کند. او توضیح داد که شرکتهای هوش مصنوعی «نمیتوانند تک تک اعضای جامعه را که از پرسشها و پاسخهایشان برای آموزش مدل استفاده شده است نسبت دهند و در نتیجه مجوز Creative Commons را نقض میکنند».
او همچنین تصریح کرد که Stack Overflow فقط از شرکت هایی که LLM های بزرگ را برای اهداف تجاری توسعه می دهند، هزینه دریافت می کند. علاوه بر این، Stack Overflow به عنوان بخشی از استراتژی گسترده تر هوش مصنوعی خود، روی برنامه های هوش مصنوعی مولد خود کار می کند. Chandrasekar در یک پست وبلاگ قبلی اظهار داشت که او یک تیم اختصاصی را مأمور کرده است تا "تمام وقت بر روی برنامه های GenAI کار کند" که می تواند در پلت فرم عمومی Stack Overflow ادغام شود.
هم Reddit و هم Stack Overflow در حال حاضر روی اطلاعات قیمت گذاری API داده خود کار می کنند که در ماه های آینده فاش خواهد شد.
ادامه مطلب:
سلب مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
سیندی یک روزنامه نگار در Metaverse Post، پوشش موضوعات مرتبط با web3, NFT، متاورس و هوش مصنوعی، با تمرکز بر مصاحبه با Web3 بازیگران صنعت او با بیش از 30 مدیر اجرایی در سطح C صحبت کرده است و بینش ارزشمند آنها را برای خوانندگان به ارمغان آورده است. سیندی که اصالتاً اهل سنگاپور است، اکنون در تفلیس، گرجستان مستقر است. او دارای مدرک لیسانس در مطالعات ارتباطات و رسانه از دانشگاه استرالیای جنوبی است و یک دهه تجربه در روزنامه نگاری و نویسندگی دارد. از طریق با او در تماس باشید [ایمیل محافظت شده] با میزهای مطبوعاتی، اطلاعیه ها و فرصت های مصاحبه.
مقالات بیشترسیندی یک روزنامه نگار در Metaverse Post، پوشش موضوعات مرتبط با web3, NFT، متاورس و هوش مصنوعی، با تمرکز بر مصاحبه با Web3 بازیگران صنعت او با بیش از 30 مدیر اجرایی در سطح C صحبت کرده است و بینش ارزشمند آنها را برای خوانندگان به ارمغان آورده است. سیندی که اصالتاً اهل سنگاپور است، اکنون در تفلیس، گرجستان مستقر است. او دارای مدرک لیسانس در مطالعات ارتباطات و رسانه از دانشگاه استرالیای جنوبی است و یک دهه تجربه در روزنامه نگاری و نویسندگی دارد. از طریق با او در تماس باشید [ایمیل محافظت شده] با میزهای مطبوعاتی، اطلاعیه ها و فرصت های مصاحبه.