Företag Nyhetsrapport
21 april 2023

Stack Overflow går med Reddit i Charging Tech Giants för AI Training Data

I korthet

Stack Overflow vill ta betalt av teknikjättar som använder deras data för att utveckla LLM:er för kommersiella ändamål.

Både Stack Overflow och Reddit kommer att fortsätta att licensiera data gratis till vissa företag.

stack Overflow håller för närvarande på att utveckla sina egna generativa AI-tjänster.

Stack Overflow går med Reddit i Charging Tech Giants för AI Training Data

Stack Overflow, ett fråge-och-svar-forum för programmerare, har beslutat att debitera teknikjättar för att använda sina data för att träna AI och stora språkmodeller (LLM), The Wired först rapporterade.

Detta efter Reddits tillkännagivande på tisdagen att det kommer börja ta betalt för åtkomst till dess data-API. Som svar till Google, OpenAI, Meta och andra företag som använder Reddits enorma användargenererade innehåll för kommersiella AI-projekt utan betalning, sa Reddits vd och medgrundare, Steve Huffman, till The New York Times att sådana företag nu kommer att behöva betala för att använda Reddits data för att träna sina AI-modeller, från och med juni.

"Att genomsöka Reddit, skapa värde och inte returnera något av det värdet till våra användare är något vi har ett problem med", sa Huffman till The Times. Utvecklare som vill skapa applikationer och botar som underlättar användningen av Reddit, såväl som forskare som vill studera Reddit rent för akademiska eller icke-kommersiella syften, kommer även i fortsättningen att ha fri tillgång till Reddits API.

Utgivare av digitala och tryckta medier släpper inte heller AI-jättarna från kroken. News/Media Alliance släppte sin AI-principer på torsdag och förklarade att den olicensierade användningen av dess innehåll av generativa artificiella intelligenssystem (GAI) utgör ett intrång i immateriella rättigheter. Riktlinjerna anger också att GAI-system måste söka tillstånd från utgivare innan de använder deras innehåll och att utgivare ska ha rätt att förhandla om skälig kompensation för användningen av deras IP av dessa utvecklare.

Över 50 miljoner frågor och svar har lagts ut på Stack Overflow. Meta har tränat dess stora språkmodell LLaMA använder data skrapad från Stack Exchange, tillverkaren av Stack Overflow.

Stack Overflows vd Prashanth Chandrasekar berättade om sitt stöd för Reddits tillvägagångssätt till The Wired:

"Communityplattformar som driver LLM:er bör absolut kompenseras för sina bidrag så att företag som vi kan återinvestera tillbaka i våra samhällen för att fortsätta få dem att blomstra."

Chandrasekar tillade att LLM-utvecklare som använder Stack Overflows data bryter mot sajtens villkor för tjänsten eftersom användare äger innehållet de lägger upp, vilket faller under en Creative Commons-licens som kräver att alla som använder innehållet senare krediterar källan. Han förklarade att AI-företag "inte kan tillskriva var och en av de communitymedlemmar vars frågor och svar användes för att träna modellen, och därmed bryter mot Creative Commons-licensen."

Han klargjorde också att Stack Overflow endast skulle debitera företag som utvecklar stora LLM:er för kommersiella ändamål. Dessutom arbetar Stack Overflow med sina egna generativa AI-applikationer som en del av sin bredare AI-strategi. I ett tidigare blogginlägg uppgav Chandrasekar att han hade gett ett dedikerat team i uppdrag att "arbeta heltid med GenAI-applikationer" som kan integreras i Stack Overflows offentliga plattform.

Både Reddit och Stack Overflow arbetar för närvarande med prisinformation för deras data-API, som kommer att avslöjas under de kommande månaderna.

Läs mer:

Villkor

I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.

Om författaren

Cindy är journalist på Metaverse Post, som täcker ämnen relaterade till web3, NFT, metaverse och AI, med fokus på intervjuer med Web3 branschaktörer. Hon har pratat med över 30 chefer på C-nivå och har gett sina värdefulla insikter till läsarna. Cindy kommer ursprungligen från Singapore och är nu baserad i Tbilisi, Georgia. Hon har en kandidatexamen i kommunikations- och mediestudier från University of South Australia och har ett decenniums erfarenhet av journalistik och skrivande. Ta kontakt med henne via [e-postskyddad] med presstitlar, tillkännagivanden och intervjutillfällen.

fler artiklar
Cindy Tan
Cindy Tan

Cindy är journalist på Metaverse Post, som täcker ämnen relaterade till web3, NFT, metaverse och AI, med fokus på intervjuer med Web3 branschaktörer. Hon har pratat med över 30 chefer på C-nivå och har gett sina värdefulla insikter till läsarna. Cindy kommer ursprungligen från Singapore och är nu baserad i Tbilisi, Georgia. Hon har en kandidatexamen i kommunikations- och mediestudier från University of South Australia och har ett decenniums erfarenhet av journalistik och skrivande. Ta kontakt med henne via [e-postskyddad] med presstitlar, tillkännagivanden och intervjutillfällen.

Institutionell aptit växer mot Bitcoin ETFs mitt i volatilitet

Avslöjande genom 13F-anmälningar avslöjar anmärkningsvärda institutionella investerare som sysslar med Bitcoin ETF:er, vilket understryker en växande acceptans av ...

Lär dig mer

Straffdagen anländer: CZ:s öde hänger i balans när den amerikanska domstolen överväger DOJ:s vädjande

Changpeng Zhao är redo att dömas i en amerikansk domstol i Seattle i dag.

Lär dig mer
Gå med i vår innovativa teknikgemenskap
Läs mer
Läs mer
Inside Wall Street Memes (WSM): Avslöjar rubrikerna
Företag Marknader Berättelser och recensioner Teknologi
Inside Wall Street Memes (WSM): Avslöjar rubrikerna
Maj 7, 2024
Upptäck Crypto Whales: Who's Who in the Market
Företag Marknader Berättelser och recensioner Teknologi
Upptäck Crypto Whales: Who's Who in the Market
Maj 7, 2024
Orbiter Finance samarbetar med Bitcoin Layer 2 Zulu Network och distribueras på är Lwazi Testnet
Företag Nyhetsrapport Teknologi
Orbiter Finance samarbetar med Bitcoin Layer 2 Zulu Network och distribueras på är Lwazi Testnet 
Maj 7, 2024
Crypto Exchange Bybit integrerar Ethena Labs USDe som säkerhetstillgång, möjliggör BTC-USDe- och ETH-USDe-handelspar
Marknader Nyhetsrapport Teknologi
Crypto Exchange Bybit integrerar Ethena Labs USDe som säkerhetstillgång, möjliggör BTC-USDe- och ETH-USDe-handelspar
Maj 7, 2024