Stack Overflow schließt sich Reddit an, um Tech-Giganten für KI-Trainingsdaten zu belasten
In Kürze
Stack Overflow möchte Technologiegiganten beschuldigen, die seine Daten verwenden, um LLMs für kommerzielle Zwecke zu entwickeln.
Sowohl Stack Overflow als auch Reddit werden Daten weiterhin kostenlos an bestimmte Unternehmen lizenzieren.
Stapelüberlauf entwickelt derzeit eigene generative KI-Dienste.
Stack Overflow, ein Frage-und-Antwort-Forum für Programmierer, hat beschlossen, Technologiegiganten für die Verwendung seiner Daten zum Trainieren von KI und großen Sprachmodellen (LLM) zu belasten. Die kabelgebundene zuerst berichtet.
Dies folgt auf die Ankündigung von Reddit am Dienstag, dass dies der Fall sein wird Gebühren für den Zugriff auf seine Daten-API zu erheben. Als Antwort auf Google: OpenAI, Meta und andere Unternehmen, die die umfangreichen benutzergenerierten Inhalte von Reddit ohne Bezahlung für kommerzielle KI-Projekte nutzen, sagte Steve Huffman, CEO und Mitbegründer von Reddit, gegenüber der New York Times, dass solche Unternehmen nun für die Nutzung der Daten von Reddit bezahlen müssen ab Juni ihre KI-Modelle trainieren.
„Reddit zu crawlen, Werte zu generieren und keinen dieser Werte an unsere Benutzer zurückzugeben, ist etwas, womit wir ein Problem haben“, sagte Huffman gegenüber The Times. Entwickler, die Anwendungen und Bots erstellen möchten, die die Nutzung von Reddit erleichtern, sowie Forscher, die Reddit zu rein akademischen oder nichtkommerziellen Zwecken studieren möchten, haben weiterhin freien Zugriff auf die API von Reddit.
Auch Digital- und Printmedienverlage lassen die KI-Giganten nicht vom Haken. Die News/Media Alliance hat ihre veröffentlicht KI-Prinzipien am Donnerstag und erklärte, dass die nicht lizenzierte Nutzung seiner Inhalte durch Systeme der generativen künstlichen Intelligenz (GAI) eine Verletzung der Rechte an geistigem Eigentum darstellt. Die Richtlinien legen auch fest, dass GAI-Systeme die Erlaubnis von Herausgebern einholen müssen, bevor sie ihre Inhalte verwenden, und dass Herausgeber berechtigt sein sollten, eine faire Vergütung für die Nutzung ihres geistigen Eigentums durch diese Entwickler auszuhandeln.
Über 50 Millionen Fragen und Antworten wurden auf Stack Overflow gepostet. Meta hat trainiert worden sein großes Sprachmodell LLaMA unter Verwendung von Daten, die von Stack Exchange, dem Hersteller von Stack Overflow, stammen.
Prashanth Chandrasekar, CEO von Stack Overflow, äußerte sich zu seiner Unterstützung des Ansatzes von Reddit gegenüber The Wired:
„Gemeinschaftsplattformen, die LLMs vorantreiben, sollten unbedingt für ihre Beiträge entschädigt werden, damit Unternehmen wie wir wieder in unsere Gemeinschaften investieren können, um sie weiterhin zum Erfolg zu führen.“
Chandrasekar fügte hinzu, dass LLM-Entwickler, die die Daten von Stack Overflow verwenden, die Daten der Website verletzen Nutzungsbedingungen da Benutzer die von ihnen geposteten Inhalte besitzen, die unter eine Creative Commons-Lizenz fallen, die von jedem, der die Inhalte später verwendet, verlangt, die Quelle anzugeben. Er erklärte, dass KI-Unternehmen „nicht in der Lage sind, jedes einzelne Community-Mitglied zuzuordnen, dessen Fragen und Antworten zum Trainieren des Modells verwendet wurden, wodurch die Creative-Commons-Lizenz verletzt wird“.
Er stellte auch klar, dass Stack Overflow nur Unternehmen in Rechnung stellen würde, die große LLMs für kommerzielle Zwecke entwickeln. Darüber hinaus arbeitet Stack Overflow im Rahmen seiner breiteren KI-Strategie an eigenen generativen KI-Anwendungen. In einem früheren Blogbeitrag erklärte Chandrasekar, er habe ein engagiertes Team damit beauftragt, „Vollzeit an GenAI-Anwendungen zu arbeiten“, die in die öffentliche Plattform von Stack Overflow integriert werden können.
Sowohl Reddit als auch Stack Overflow arbeiten derzeit an Preisinformationen für ihre Daten-API, die in den kommenden Monaten bekannt gegeben werden.
Mehr lesen:
Haftungsausschluss
Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.
Über den Autor
Cindy ist Journalistin bei Metaverse Post, behandelt Themen im Zusammenhang mit web3, NFT, Metaverse und KI, mit Schwerpunkt auf Interviews mit Web3 Akteure der Branche. Sie hat mit über 30 C-Level-Führungskräften gesprochen, Tendenz steigend, und ihre wertvollen Erkenntnisse an die Leser weitergegeben. Cindy stammt ursprünglich aus Singapur und lebt heute in Tiflis, Georgien. Sie hat einen Bachelor-Abschluss in Kommunikations- und Medienwissenschaften von der University of South Australia und verfügt über ein Jahrzehnt Erfahrung im Journalismus und Schreiben. Kontaktieren Sie sie über [E-Mail geschützt] mit Pressegesprächen, Ankündigungen und Interviewmöglichkeiten.
Weitere ArtikelCindy ist Journalistin bei Metaverse Post, behandelt Themen im Zusammenhang mit web3, NFT, Metaverse und KI, mit Schwerpunkt auf Interviews mit Web3 Akteure der Branche. Sie hat mit über 30 C-Level-Führungskräften gesprochen, Tendenz steigend, und ihre wertvollen Erkenntnisse an die Leser weitergegeben. Cindy stammt ursprünglich aus Singapur und lebt heute in Tiflis, Georgien. Sie hat einen Bachelor-Abschluss in Kommunikations- und Medienwissenschaften von der University of South Australia und verfügt über ein Jahrzehnt Erfahrung im Journalismus und Schreiben. Kontaktieren Sie sie über [E-Mail geschützt] mit Pressegesprächen, Ankündigungen und Interviewmöglichkeiten.