Stack Overflow se junta ao Reddit para cobrar gigantes da tecnologia por dados de treinamento de IA
Em Breve
Stack Overflow quer cobrar gigantes da tecnologia que estão usando seus dados para desenvolver LLMs para fins comerciais.
Tanto o Stack Overflow quanto o Reddit continuarão licenciando dados gratuitamente para determinadas empresas.
Stack Overflow está atualmente desenvolvendo seus próprios serviços de IA generativa.
Stack Overflow, um fórum de perguntas e respostas para programadores, decidiu cobrar gigantes da tecnologia pelo uso de seus dados para treinar IA e modelos de linguagem grandes (LLM), o fio relatado pela primeira vez.
Isso segue o anúncio do Reddit na terça-feira de que começar a cobrar pelo acesso à sua API de dados. Em resposta ao Google, OpenAI, Meta e outras empresas que estão usando o vasto conteúdo gerado pelo usuário do Reddit para projetos comerciais de IA sem pagamento, o CEO e cofundador do Reddit, Steve Huffman, disse ao The New York Times que essas empresas agora terão que pagar pelo uso dos dados do Reddit para treinar seus modelos de IA, a partir de junho.
“Rastrear o Reddit, gerar valor e não retornar nada desse valor para nossos usuários é algo com o qual temos problemas”, disse Huffman ao The Times. Os desenvolvedores que desejam criar aplicativos e bots que facilitem o uso do Reddit, bem como os pesquisadores que desejam estudar o Reddit apenas para fins acadêmicos ou não comerciais, continuarão tendo acesso gratuito à API do Reddit.
Os editores de mídia digital e impressa também não estão deixando os gigantes da IA escaparem. A News/Media Alliance lançou seu princípios de IA na quinta-feira, declarando que o uso não licenciado de seu conteúdo por sistemas de inteligência artificial generativa (GAI) constitui uma violação dos direitos de propriedade intelectual. As diretrizes também especificam que os sistemas GAI devem obter permissão dos editores antes de usar seu conteúdo e que os editores devem ter o direito de negociar uma compensação justa pelo uso de seu IP por esses desenvolvedores.
Mais de 50 milhões de perguntas e respostas foram postadas no Stack Overflow. Meta tem vem treinando seu grande modelo de linguagem LLaMA usando dados extraídos do Stack Exchange, criador do Stack Overflow.
Falando sobre seu apoio à abordagem do Reddit, o CEO da Stack Overflow, Prashanth Chandrasekar, disse ao The Wired:
“As plataformas comunitárias que alimentam os LLMs devem ser absolutamente compensadas por suas contribuições, para que empresas como a nossa possam reinvestir em nossas comunidades para continuar a fazê-las prosperar.”
Chandrasekar acrescentou que os desenvolvedores do LLM que usam os dados do Stack Overflow estão violando as regras do site. termos de serviço pois os usuários possuem o conteúdo que publicam, que se enquadra em uma licença Creative Commons que exige que qualquer pessoa que use o conteúdo posteriormente dê crédito à fonte. Ele explicou que as empresas de IA “não podem atribuir a cada um dos membros da comunidade cujas perguntas e respostas foram usadas para treinar o modelo, violando assim a licença Creative Commons”.
Ele também esclareceu que o Stack Overflow cobraria apenas das empresas que desenvolvessem grandes LLMs para fins comerciais. Além disso, o Stack Overflow está trabalhando em seus próprios aplicativos de IA generativos como parte de sua estratégia de IA mais ampla. Em uma postagem de blog anterior, Chandrasekar afirmou que havia encarregado uma equipe dedicada de “trabalhar em tempo integral em aplicativos GenAI” que podem ser integrados à plataforma pública do Stack Overflow.
Tanto o Reddit quanto o Stack Overflow estão trabalhando atualmente em informações de preços para sua API de dados, que serão reveladas nos próximos meses.
Leia mais:
Aviso Legal
Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.
Sobre o autor
Cindy é jornalista da Metaverse Post, abordando temas relacionados web3, NFT, metaverso e IA, com foco em entrevistas com Web3 players da indústria. Ela conversou com mais de 30 executivos de nível C e continua aumentando, trazendo seus valiosos insights aos leitores. Originária de Cingapura, Cindy agora mora em Tbilisi, na Geórgia. Ela é bacharel em Estudos de Comunicação e Mídia pela University of South Australia e tem uma década de experiência em jornalismo e redação. Entre em contato com ela através [email protegido] com arremessos de imprensa, anúncios e oportunidades de entrevista.
Mais artigosCindy é jornalista da Metaverse Post, abordando temas relacionados web3, NFT, metaverso e IA, com foco em entrevistas com Web3 players da indústria. Ela conversou com mais de 30 executivos de nível C e continua aumentando, trazendo seus valiosos insights aos leitores. Originária de Cingapura, Cindy agora mora em Tbilisi, na Geórgia. Ela é bacharel em Estudos de Comunicação e Mídia pela University of South Australia e tem uma década de experiência em jornalismo e redação. Entre em contato com ela através [email protegido] com arremessos de imprensa, anúncios e oportunidades de entrevista.