Stack Overflow si unisce a Reddit nel caricare i giganti della tecnologia per i dati di addestramento dell'IA
In Breve
Stack Overflow vuole addebitare ai giganti della tecnologia che utilizzano i suoi dati per sviluppare LLM per scopi commerciali.
Sia Stack Overflow che Reddit continueranno a concedere in licenza i dati gratuitamente a determinate aziende.
Stack Overflow sta attualmente sviluppando i propri servizi di IA generativa.
Stack Overflow, un forum di domande e risposte per programmatori, ha deciso di addebitare ai giganti della tecnologia l'utilizzo dei suoi dati per addestrare AI e modelli di linguaggio di grandi dimensioni (LLM), Il cablato prima segnalato
Ciò segue l'annuncio di Reddit martedì che lo farà iniziare ad addebitare l'accesso alla sua API di dati. In risposta a Google, OpenAI, Meta e altre società che utilizzano i vasti contenuti generati dagli utenti di Reddit per progetti commerciali di intelligenza artificiale senza pagamento, il CEO e co-fondatore di Reddit, Steve Huffman, ha dichiarato al New York Times che tali società dovranno ora pagare per utilizzare i dati di Reddit per addestrare i propri modelli di intelligenza artificiale, a partire da giugno.
"Scansionare Reddit, generare valore e non restituire nulla di quel valore ai nostri utenti è qualcosa con cui abbiamo un problema", ha detto Huffman a The Times. Gli sviluppatori che desiderano creare applicazioni e bot che facilitino l'uso di Reddit, così come i ricercatori che desiderano studiare Reddit esclusivamente per scopi accademici o non commerciali, continueranno ad avere accesso gratuito all'API di Reddit.
Anche gli editori di supporti digitali e cartacei non lasciano i giganti dell'intelligenza artificiale fuori dai guai. La News/Media Alliance ha pubblicato il suo Principi dell'IA giovedì, dichiarando che l'uso senza licenza del suo contenuto da parte di sistemi di intelligenza artificiale generativa (GAI) costituisce una violazione dei diritti di proprietà intellettuale. Le linee guida specificano inoltre che i sistemi GAI devono chiedere il permesso agli editori prima di utilizzare il loro contenuto e che gli editori dovrebbero avere il diritto di negoziare un equo compenso per l'uso della loro PI da parte di questi sviluppatori.
Oltre 50 milioni di domande e risposte sono state pubblicate su Stack Overflow. Meta ha stato di formazione il suo grande modello linguistico LLaMA utilizzando i dati raccolti da Stack Exchange, il creatore di Stack Overflow.
Parlando del suo sostegno all'approccio di Reddit, il CEO di Stack Overflow, Prashanth Chandrasekar, ha dichiarato a The Wired:
"Le piattaforme comunitarie che alimentano gli LLM dovrebbero assolutamente essere ricompensate per i loro contributi in modo che aziende come noi possano reinvestire nelle nostre comunità per continuare a farle prosperare".
Chandrasekar ha aggiunto che gli sviluppatori LLM che utilizzano i dati di Stack Overflow stanno violando quelli del sito termini di servizio poiché gli utenti possiedono il contenuto che pubblicano, che rientra in una licenza Creative Commons che richiede a chiunque utilizzi il contenuto in un secondo momento di citare la fonte. Ha spiegato che le società di intelligenza artificiale "non sono in grado di attribuire a ciascuno dei membri della comunità le cui domande e risposte sono state utilizzate per addestrare il modello, violando così la licenza Creative Commons".
Ha anche chiarito che Stack Overflow addebiterà solo alle aziende che sviluppano grandi LLM per scopi commerciali. Inoltre, Stack Overflow sta lavorando alle proprie applicazioni di intelligenza artificiale generativa come parte della sua più ampia strategia di intelligenza artificiale. In un precedente post sul blog, Chandrasekar ha dichiarato di aver incaricato un team dedicato di "lavorare a tempo pieno sulle applicazioni GenAI" che possono essere integrate nella piattaforma pubblica di Stack Overflow.
Sia Reddit che Stack Overflow stanno attualmente lavorando alle informazioni sui prezzi per la loro API di dati, che saranno rivelate nei prossimi mesi.
Leggi di più:
Negazione di responsabilità
In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.
Circa l'autore
Cindy è una giornalista di Metaverse Post, che copre argomenti relativi a web3, NFT, metaverso e intelligenza artificiale, con particolare attenzione alle interviste con Web3 attori del settore. Ha parlato con oltre 30 dirigenti di livello C e oltre, portando ai lettori le loro preziose intuizioni. Originaria di Singapore, Cindy ora vive a Tbilisi, in Georgia. Ha conseguito una laurea in comunicazioni e studi sui media presso l'Università dell'Australia Meridionale e ha dieci anni di esperienza nel giornalismo e nella scrittura. Mettiti in contatto con lei tramite [email protected] con presentazioni per la stampa, annunci e opportunità di interviste.
Altri articoliCindy è una giornalista di Metaverse Post, che copre argomenti relativi a web3, NFT, metaverso e intelligenza artificiale, con particolare attenzione alle interviste con Web3 attori del settore. Ha parlato con oltre 30 dirigenti di livello C e oltre, portando ai lettori le loro preziose intuizioni. Originaria di Singapore, Cindy ora vive a Tbilisi, in Georgia. Ha conseguito una laurea in comunicazioni e studi sui media presso l'Università dell'Australia Meridionale e ha dieci anni di esperienza nel giornalismo e nella scrittura. Mettiti in contatto con lei tramite [email protected] con presentazioni per la stampa, annunci e opportunità di interviste.