Forretning Nyheds rapport
April 21, 2023

Stack Overflow slutter sig til Reddit i Charging Tech Giants til AI-træningsdata

Kort sagt

Stack Overflow ønsker at opkræve tech-giganter, der bruger deres data til at udvikle LLM'er til kommercielle formål.

Både Stack Overflow og Reddit vil fortsætte med at licensere data gratis til visse virksomheder.

Stack Overflow er i øjeblikket ved at udvikle sine egne generative AI-tjenester.

Stack Overflow slutter sig til Reddit i Charging Tech Giants til AI-træningsdata

Stack Overflow, et spørgsmål-og-svar-forum for programmører, har besluttet at opkræve tech-giganter for at bruge deres data til at træne AI og store sprogmodeller (LLM), The Wired først rapporteret.

Dette følger Reddits meddelelse tirsdag om, at det vil begynde at opkræve betaling for adgang til dets data-API. Som svar til Google, OpenAI, Meta og andre virksomheder, der bruger Reddits enorme brugergenererede indhold til kommercielle AI-projekter uden betaling, fortalte Reddits administrerende direktør og medstifter, Steve Huffman, til The New York Times, at sådanne virksomheder nu skal betale for at bruge Reddits data for at træne deres AI-modeller fra juni.

"At crawle Reddit, skabe værdi og ikke returnere nogen af ​​denne værdi til vores brugere er noget, vi har et problem med," sagde Huffman til The Times. Udviklere, der ønsker at skabe applikationer og bots, der letter brugen af ​​Reddit, såvel som forskere, der ønsker at studere Reddit udelukkende til akademiske eller ikke-kommercielle formål, vil fortsat have fri adgang til Reddits API.

Udgivere af digitale og trykte medier lader heller ikke AI-giganter komme ud af krogen. News/Media Alliance udgav sin AI principper torsdag og erklærede, at den ulicenserede brug af dets indhold af generativ kunstig intelligens (GAI)-systemer udgør en krænkelse af intellektuelle ejendomsrettigheder. Retningslinjerne specificerer også, at GAI-systemer skal søge tilladelse fra udgivere, før de bruger deres indhold, og at udgivere skal have ret til at forhandle om rimelig kompensation for disse udvikleres brug af deres IP.

Over 50 millioner spørgsmål og svar er blevet postet på Stack Overflow. Meta har trænet sin store sprogmodel LLaMA ved hjælp af data skrabet fra Stack Exchange, producenten af ​​Stack Overflow.

Da han talte om sin støtte til Reddits tilgang, fortalte Stack Overflows administrerende direktør Prashanth Chandrasekar til The Wired:

"Fællesskabsplatforme, der driver LLM'er, bør absolut kompenseres for deres bidrag, så virksomheder som os kan geninvestere tilbage i vores samfund for at fortsætte med at få dem til at trives."

Chandrasekar tilføjede, at LLM-udviklere, der bruger Stack Overflows data, krænker webstedets terms of service da brugere ejer det indhold, de poster, hvilket falder ind under en Creative Commons-licens, der kræver, at enhver, der bruger indholdet senere, krediterer kilden. Han forklarede, at AI-virksomheder "ikke er i stand til at tilskrive hver eneste af de fællesskabsmedlemmer, hvis spørgsmål og svar blev brugt til at træne modellen, og derved bryder Creative Commons-licensen."

Han præciserede også, at Stack Overflow kun ville opkræve virksomheder, der udvikler store LLM'er til kommercielle formål. Derudover arbejder Stack Overflow på sine egne generative AI-applikationer som en del af sin bredere AI-strategi. I et tidligere blogindlæg udtalte Chandrasekar, at han havde givet et dedikeret team til opgave at "arbejde fuld tid på GenAI-applikationer", der kan integreres i Stack Overflows offentlige platform.

Både Reddit og Stack Overflow arbejder i øjeblikket på prisoplysninger for deres data API, som vil blive afsløret i de kommende måneder.

Læs mere:

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Cindy er journalist på Metaverse Post, der dækker emner relateret til web3, NFT, metaverse og AI, med fokus på interviews med Web3 industriens aktører. Hun har talt med over 30 ledere på C-niveau, og hun har bragt deres værdifulde indsigt til læserne. Oprindeligt fra Singapore, Cindy er nu baseret i Tbilisi, Georgia. Hun har en bachelorgrad i kommunikations- og mediestudier fra University of South Australia og har ti års erfaring med journalistik og forfatterskab. Kontakt hende via [e-mail beskyttet] med pressepitches, annonceringer og interviewmuligheder.

Flere artikler
Cindy Tan
Cindy Tan

Cindy er journalist på Metaverse Post, der dækker emner relateret til web3, NFT, metaverse og AI, med fokus på interviews med Web3 industriens aktører. Hun har talt med over 30 ledere på C-niveau, og hun har bragt deres værdifulde indsigt til læserne. Oprindeligt fra Singapore, Cindy er nu baseret i Tbilisi, Georgia. Hun har en bachelorgrad i kommunikations- og mediestudier fra University of South Australia og har ti års erfaring med journalistik og forfatterskab. Kontakt hende via [e-mail beskyttet] med pressepitches, annonceringer og interviewmuligheder.

Hot Stories

Oplev Crypto Whales: Who's Who på markedet

by Viktoria Palchik
Maj 07, 2024
Tilmeld dig vores nyhedsbrev.
Seneste Nyheder

Institutionel appetit vokser mod Bitcoin ETF'er midt i volatilitet

Afsløringer gennem 13F-arkivering afslører bemærkelsesværdige institutionelle investorer, der dytter i Bitcoin ETF'er, hvilket understreger en voksende accept af ...

Vide mere

Straffeudmålingsdagen ankommer: CZ's skæbne hænger i balance, da amerikansk domstol overvejer DOJ's anbringende

Changpeng Zhao står klar til at blive dømt ved en amerikansk domstol i Seattle i dag.

Vide mere
Tilmeld dig vores innovative teknologifællesskab
Læs mere
Læs mere
Inside Wall Street Memes (WSM): Afsløring af overskrifterne
Forretning Markeder Historier og anmeldelser Teknologier
Inside Wall Street Memes (WSM): Afsløring af overskrifterne
Maj 7, 2024
Oplev Crypto Whales: Who's Who på markedet
Forretning Markeder Historier og anmeldelser Teknologier
Oplev Crypto Whales: Who's Who på markedet
Maj 7, 2024
Orbiter Finance partnere med Bitcoin Layer 2 Zulu Network og implementeres på er Lwazi Testnet
Forretning Nyheds rapport Teknologier
Orbiter Finance partnere med Bitcoin Layer 2 Zulu Network og implementeres på er Lwazi Testnet 
Maj 7, 2024
Crypto Exchange Bybit integrerer Ethena Labs' USDe som sikkerhedsstillelse, muliggør BTC-USDe og ETH-USDe handelspar
Markeder Nyheds rapport Teknologier
Crypto Exchange Bybit integrerer Ethena Labs' USDe som sikkerhedsstillelse, muliggør BTC-USDe og ETH-USDe handelspar
Maj 7, 2024