Stack Overflow се присъединява към Reddit в таксуването на технологични гиганти за данни за обучение на AI
Накратко
Stack Overflow иска да таксува технологични гиганти, които използват неговите данни за разработване на LLM за търговски цели.
Както Stack Overflow, така и Reddit ще продължат да лицензират данни безплатно на определени компании.
Преливане на стека в момента разработва свои собствени генеративни AI услуги.
Stack Overflow, форум за въпроси и отговори за програмисти, реши да таксува технологични гиганти за използването на неговите данни за обучение на AI и големи езикови модели (LLM), The Wired за първи път.
Това следва съобщението на Reddit във вторник, че ще го направи започне да таксува за достъп до неговия API за данни. В отговор на Google, OpenAI, Meta и други компании, които използват огромното генерирано от потребителите съдържание на Reddit за комерсиални AI проекти без плащане, главният изпълнителен директор и съосновател на Reddit, Стив Хъфман, каза пред The New York Times, че такива компании сега ще трябва да плащат за използването на данните на Reddit за обучават своите AI модели, започвайки от юни.
„Обхождането на Reddit, генерирането на стойност и невръщането на нищо от тази стойност на нашите потребители е нещо, с което имаме проблем“, каза Хъфман пред The Times. Разработчиците, които желаят да създават приложения и ботове, които улесняват използването на Reddit, както и изследователите, които искат да изучават Reddit само за академични или некомерсиални цели, ще продължат да имат безплатен достъп до API на Reddit.
Издателите на дигитални и печатни медии също не пускат AI гигантите от куката. News/Media Alliance публикува своя Принципи на ИИ в четвъртък, декларирайки, че нелицензираната употреба на съдържанието му от системи за генеративен изкуствен интелект (GAI) представлява нарушение на правата върху интелектуалната собственост. Насоките също така уточняват, че GAI системите трябва да търсят разрешение от издателите, преди да използват тяхното съдържание и че издателите трябва да имат право да преговарят за справедливо обезщетение за използването на техния IP от тези разработчици.
Над 50 милиона въпроса и отговора са публикувани в Stack Overflow. Мета има е тренирал неговия голям езиков модел LLaMA използвайки данни, извлечени от Stack Exchange, създателя на Stack Overflow.
Говорейки за подкрепата си за подхода на Reddit, изпълнителният директор на Stack Overflow Прашант Чандрасекар каза пред The Wired:
„Платформите на общността, които подхранват LLM, трябва абсолютно да бъдат компенсирани за техния принос, така че компании като нас да могат да реинвестират обратно в нашите общности, за да продължат да ги карат да процъфтяват.“
Чандрасекар добави, че LLM разработчиците, използващи данните на Stack Overflow, нарушават тези на сайта условията за ползване тъй като потребителите притежават съдържанието, което публикуват, което попада под лиценз Creative Commons, който изисква всеки, който използва съдържанието по-късно, да посочи източника. Той обясни, че компаниите за изкуствен интелект „не са в състояние да припишат всеки един от членовете на общността, чиито въпроси и отговори са били използвани за обучение на модела, като по този начин нарушават лиценза Creative Commons“.
Той също така изясни, че Stack Overflow ще таксува само компании, разработващи големи LLM за търговски цели. Освен това Stack Overflow работи върху свои собствени генеративни AI приложения като част от по-широката си стратегия за AI. В предишна публикация в блога Чандрасекар заяви, че е възложил на специален екип да „работи на пълен работен ден върху GenAI приложения“, които могат да бъдат интегрирани в публичната платформа на Stack Overflow.
Както Reddit, така и Stack Overflow в момента работят върху информация за цените за техния API за данни, който ще бъде разкрит през следващите месеци.
Чети повече:
Отказ от отговорност
В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.
За автора
Синди е журналист в Metaverse Post, обхващащи теми, свързани с web3, NFT, metaverse и AI, с акцент върху интервюта с Web3 играчи в индустрията. Тя е разговаряла с над 30 ръководители на ниво С и нараства, като е разказала ценните им прозрения на читателите. Първоначално от Сингапур, Синди сега е базирана в Тбилиси, Грузия. Тя има бакалавърска степен по комуникации и медийни изследвания от Университета на Южна Австралия и има десетилетие опит в журналистиката и писането. Свържете се с нея чрез [имейл защитен] с представяния за пресата, съобщения и възможности за интервю.
Още статииСинди е журналист в Metaverse Post, обхващащи теми, свързани с web3, NFT, metaverse и AI, с акцент върху интервюта с Web3 играчи в индустрията. Тя е разговаряла с над 30 ръководители на ниво С и нараства, като е разказала ценните им прозрения на читателите. Първоначално от Сингапур, Синди сега е базирана в Тбилиси, Грузия. Тя има бакалавърска степен по комуникации и медийни изследвания от Университета на Южна Австралия и има десетилетие опит в журналистиката и писането. Свържете се с нея чрез [имейл защитен] с представяния за пресата, съобщения и възможности за интервю.