La Brochure Rapport de nouvelles
21 avril 2023

Stack Overflow rejoint Reddit pour charger les géants de la technologie pour les données d'entraînement à l'IA

En bref

Stack Overflow veut facturer les géants de la technologie qui utilisent ses données pour développer des LLM à des fins commerciales.

Stack Overflow et Reddit continueront de concéder gratuitement des données à certaines entreprises.

Stack Overflow développe actuellement ses propres services d'IA générative.

Stack Overflow rejoint Reddit pour charger les géants de la technologie pour les données d'entraînement à l'IA

Stack Overflow, un forum de questions-réponses pour les programmeurs, a décidé de facturer les géants de la technologie pour l'utilisation de ses données pour former l'IA et les grands modèles de langage (LLM), Le filaire premier rapporté.

Cela fait suite à l'annonce de Reddit mardi qu'il commencer à facturer l'accès à son API de données. En réponse à Google, OpenAI, Meta et d'autres entreprises qui utilisent le vaste contenu généré par les utilisateurs de Reddit pour des projets commerciaux d'IA sans paiement, le PDG et co-fondateur de Reddit, Steve Huffman, a déclaré au New York Times que ces entreprises devront désormais payer pour utiliser les données de Reddit pour former leurs modèles d'IA, à partir de juin.

"Crawler Reddit, générer de la valeur et ne rien restituer à nos utilisateurs est quelque chose qui nous pose problème", a déclaré Huffman au Times. Les développeurs qui souhaitent créer des applications et des robots facilitant l'utilisation de Reddit, ainsi que les chercheurs qui souhaitent étudier Reddit à des fins purement académiques ou non commerciales, continueront d'avoir un accès gratuit à l'API de Reddit.

Les éditeurs de médias numériques et imprimés ne laissent pas non plus les géants de l'IA s'en tirer. L'Alliance Nouvelles/Médias a publié son Principes de l'IA Jeudi, déclarant que l'utilisation sans licence de son contenu par des systèmes d'intelligence artificielle générative (GAI) constitue une violation des droits de propriété intellectuelle. Les lignes directrices précisent également que les systèmes GAI doivent demander l'autorisation des éditeurs avant d'utiliser leur contenu et que les éditeurs doivent être autorisés à négocier une compensation équitable pour l'utilisation de leur propriété intellectuelle par ces développeurs.

Plus de 50 millions de questions et réponses ont été publiées sur Stack Overflow. Méta a s'entraînait son grand modèle de langage LLaMA en utilisant des données récupérées sur Stack Exchange, le créateur de Stack Overflow.

S'exprimant sur son soutien à l'approche de Reddit, le PDG de Stack Overflow, Prashanth Chandrasekar, a déclaré à The Wired :

"Les plateformes communautaires qui alimentent les LLM doivent absolument être rémunérées pour leurs contributions afin que des entreprises comme la nôtre puissent réinvestir dans nos communautés pour continuer à les faire prospérer."

Chandrasekar a ajouté que les développeurs LLM utilisant les données de Stack Overflow violent le site conditions de service car les utilisateurs sont propriétaires du contenu qu'ils publient, qui relève d'une licence Creative Commons qui oblige toute personne qui utilise le contenu ultérieurement à créditer la source. Il a expliqué que les entreprises d'IA "ne sont pas en mesure d'attribuer chacun des membres de la communauté dont les questions et les réponses ont été utilisées pour former le modèle, violant ainsi la licence Creative Commons".

Il a également précisé que Stack Overflow ne facturerait que les entreprises développant de gros LLM à des fins commerciales. De plus, Stack Overflow travaille sur ses propres applications d'IA génératives dans le cadre de sa stratégie d'IA plus large. Dans un article de blog précédent, Chandrasekar a déclaré qu'il avait chargé une équipe dédiée de "travailler à plein temps sur les applications GenAI" qui peuvent être intégrées à la plate-forme publique de Stack Overflow.

Reddit et Stack Overflow travaillent actuellement sur les informations de tarification de leur API de données, qui seront révélées dans les mois à venir.

Lire la suite:

Mots clés:

Clause de non-responsabilité 

En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.

A propos de l'auteur

Cindy est journaliste à Metaverse Post, traitant de sujets liés à web3, NFT, métavers et IA, avec un focus sur des entretiens avec Web3 acteurs du secteur. Elle a parlé à plus de 30 cadres supérieurs et ce n'est pas fini, apportant leurs précieuses informations aux lecteurs. Originaire de Singapour, Cindy est désormais basée à Tbilissi, en Géorgie. Elle est titulaire d'un baccalauréat en communications et études médiatiques de l'Université d'Australie du Sud et possède une décennie d'expérience dans le journalisme et l'écriture. Contactez-la via [email protected] avec des pitchs de presse, des annonces et des opportunités d'interview.

Plus d'articles
Cindy Tan
Cindy Tan

Cindy est journaliste à Metaverse Post, traitant de sujets liés à web3, NFT, métavers et IA, avec un focus sur des entretiens avec Web3 acteurs du secteur. Elle a parlé à plus de 30 cadres supérieurs et ce n'est pas fini, apportant leurs précieuses informations aux lecteurs. Originaire de Singapour, Cindy est désormais basée à Tbilissi, en Géorgie. Elle est titulaire d'un baccalauréat en communications et études médiatiques de l'Université d'Australie du Sud et possède une décennie d'expérience dans le journalisme et l'écriture. Contactez-la via [email protected] avec des pitchs de presse, des annonces et des opportunités d'interview.

L’appétit institutionnel augmente pour les ETF Bitcoin dans un contexte de volatilité

Les divulgations via les dépôts 13F révèlent que des investisseurs institutionnels notables se sont lancés dans les ETF Bitcoin, soulignant une acceptation croissante de...

En savoir plus

Le jour de la détermination de la peine arrive : le sort de CZ est en jeu alors que le tribunal américain examine le plaidoyer du DOJ

Changpeng Zhao est sur le point d'être condamné aujourd'hui par un tribunal américain à Seattle.

En savoir plus
Rejoignez notre communauté technologique innovante
En savoir plus
En savoir plus
Inside Wall Street Memes (WSM) : dévoiler les gros titres
La Brochure Marchés Histoires et critiques Technologie
Inside Wall Street Memes (WSM) : dévoiler les gros titres
7 mai 2024
Découvrez les crypto-baleines : qui fait quoi sur le marché
La Brochure Marchés Histoires et critiques Technologie
Découvrez les crypto-baleines : qui fait quoi sur le marché
7 mai 2024
Orbiter Finance s'associe au réseau Bitcoin Layer 2 Zulu et se déploie sur Lwazi Testnet
La Brochure Rapport de nouvelles Technologie
Orbiter Finance s'associe au réseau Bitcoin Layer 2 Zulu et se déploie sur Lwazi Testnet 
7 mai 2024
Crypto Exchange Bybit intègre l'USDe d'Ethena Labs comme actif collatéral, permettant les paires de trading BTC-USDe et ETH-USDe
Marchés Rapport de nouvelles Technologie
Crypto Exchange Bybit intègre l'USDe d'Ethena Labs comme actif collatéral, permettant les paires de trading BTC-USDe et ETH-USDe
7 mai 2024
CRYPTOMERIA LABS PTE. LTD.