Negosyo Ulat sa Balita
Abril 21, 2023

Sumama ang Stack Overflow sa Reddit sa Pag-charge ng Tech Giants para sa Data ng Pagsasanay ng AI

Sa madaling sabi

Gusto ng Stack Overflow na singilin ang mga tech giant na gumagamit ng data nito upang bumuo ng mga LLM para sa mga komersyal na layunin.

Parehong Stack Overflow at Reddit ay magpapatuloy sa paglilisensya ng data nang libre sa ilang partikular na kumpanya.

stack overflow ay kasalukuyang bumubuo ng sarili nitong generative na mga serbisyo ng AI.

Sumama ang Stack Overflow sa Reddit sa Pag-charge ng Tech Giants para sa Data ng Pagsasanay ng AI

Ang Stack Overflow, isang question-and-answer forum para sa mga programmer, ay nagpasya na singilin ang mga tech giant para sa paggamit ng data nito upang sanayin ang AI at large language models (LLM), Ang Wired unang naiulat.

Kasunod ito ng anunsyo ng Reddit noong Martes na gagawin nito simulan ang pagsingil para sa access sa data API nito. Bilang tugon sa Google, OpenAI, Meta, at iba pang mga kumpanya na gumagamit ng malawak na nilalamang binuo ng user ng Reddit para sa mga komersyal na proyekto ng AI nang walang bayad, sinabi ng CEO at co-founder ng Reddit, Steve Huffman, sa The New York Times na ang mga naturang kumpanya ay kailangan na ngayong magbayad para sa paggamit ng data ng Reddit upang sanayin ang kanilang mga modelo ng AI, simula Hunyo.

"Ang pag-crawl sa Reddit, pagbuo ng halaga, at hindi pagbabalik ng alinman sa halagang iyon sa aming mga user ay isang bagay na mayroon kaming problema," sinabi ni Huffman sa The Times. Ang mga developer na gustong gumawa ng mga application at bot na nagpapadali sa paggamit ng Reddit, gayundin ang mga mananaliksik na gustong mag-aral ng Reddit para lang sa akademiko o hindi pangkomersyal na layunin, ay patuloy na magkakaroon ng libreng access sa Reddit's API.

Hindi rin pinababayaan ng mga digital at print media publisher ang mga higanteng AI. Inilabas ng News/Media Alliance ang Mga prinsipyo ng AI noong Huwebes, na nagdedeklara na ang walang lisensyang paggamit ng nilalaman nito ng mga generative artificial intelligence (GAI) system ay bumubuo ng isang paglabag sa mga karapatan sa intelektwal na ari-arian. Tinukoy din ng mga alituntunin na ang mga GAI system ay dapat humingi ng pahintulot mula sa mga publisher bago gamitin ang kanilang nilalaman at ang mga publisher ay dapat na may karapatan na makipag-ayos para sa patas na kabayaran para sa paggamit ng kanilang IP ng mga developer na ito.

Mahigit 50 milyong tanong at sagot ang nai-post sa Stack Overflow. Ang Meta ay mayroon nagsasanay malaking modelo ng wika nito LLaMA gamit ang data na na-scrap mula sa Stack Exchange, ang gumawa ng Stack Overflow.

Sa pagsasalita sa kanyang suporta sa diskarte ng Reddit, sinabi ng CEO ng Stack Overflow na si Prashanth Chandrasekar sa The Wired:

"Ang mga platform ng komunidad na lubos na nagpapagana sa mga LLM ay dapat na mabayaran para sa kanilang mga kontribusyon upang ang mga kumpanyang tulad namin ay muling mamuhunan sa aming mga komunidad upang patuloy na mapaunlad ang mga ito."

Idinagdag ni Chandrasekar na ang mga developer ng LLM na gumagamit ng data ng Stack Overflow ay lumalabag sa site ng site mga tuntunin ng serbisyo bilang pagmamay-ari ng mga user ang nilalamang kanilang pino-post, na napapailalim sa lisensya ng Creative Commons na nangangailangan ng sinumang gagamit ng nilalaman sa ibang pagkakataon upang i-credit ang pinagmulan. Ipinaliwanag niya na ang mga kumpanya ng AI ay "hindi maiugnay ang bawat isa sa mga miyembro ng komunidad na ang mga tanong at sagot ay ginamit upang sanayin ang modelo, sa gayon ay nilalabag ang lisensya ng Creative Commons."

Nilinaw din niya na sisingilin lamang ng Stack Overflow ang mga kumpanyang bumubuo ng malalaking LLM para sa komersyal na layunin. Bukod pa rito, gumagana ang Stack Overflow sa sarili nitong mga generative AI application bilang bahagi ng mas malawak nitong diskarte sa AI. Sa isang nakaraang post sa blog, sinabi ni Chandrasekar na inatasan niya ang isang dedikadong koponan na "magtrabaho nang buong oras sa mga aplikasyon ng GenAI" na maaaring isama sa pampublikong platform ng Stack Overflow.

Parehong ang Reddit at Stack Overflow ay kasalukuyang nagtatrabaho sa impormasyon sa pagpepresyo para sa kanilang data API, na ihahayag sa mga darating na buwan.

Magbasa nang higit pa:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Cindy ay isang mamamahayag sa Metaverse Post, sumasaklaw sa mga paksang nauugnay sa web3, NFT, metaverse at AI, na may pagtuon sa mga panayam kay Web3 mga manlalaro sa industriya. Nakipag-usap siya sa higit sa 30 C-level na mga executive at nadaragdagan pa, na nagdadala ng kanilang mahahalagang insight sa mga mambabasa. Originally from Singapore, Cindy is now based in Tbilisi, Georgia. Siya ay may hawak na Bachelor's degree sa Communications & Media Studies mula sa University of South Australia at may isang dekada ng karanasan sa pamamahayag at pagsusulat. Makipag-ugnayan sa kanya sa pamamagitan ng [protektado ng email] na may mga press pitch, mga anunsyo at mga pagkakataon sa pakikipanayam.

Mas marami pang artikulo
Cindy Tan
Cindy Tan

Si Cindy ay isang mamamahayag sa Metaverse Post, sumasaklaw sa mga paksang nauugnay sa web3, NFT, metaverse at AI, na may pagtuon sa mga panayam kay Web3 mga manlalaro sa industriya. Nakipag-usap siya sa higit sa 30 C-level na mga executive at nadaragdagan pa, na nagdadala ng kanilang mahahalagang insight sa mga mambabasa. Originally from Singapore, Cindy is now based in Tbilisi, Georgia. Siya ay may hawak na Bachelor's degree sa Communications & Media Studies mula sa University of South Australia at may isang dekada ng karanasan sa pamamahayag at pagsusulat. Makipag-ugnayan sa kanya sa pamamagitan ng [protektado ng email] na may mga press pitch, mga anunsyo at mga pagkakataon sa pakikipanayam.

Ang Institutional Appetite ay Lumalaki Patungo sa Bitcoin ETFs Sa gitna ng Volatility

Ang mga pagsisiwalat sa pamamagitan ng 13F filing ay nagpapakita ng mga kilalang institusyonal na mamumuhunan na nakikipag-ugnayan sa mga Bitcoin ETF, na binibigyang-diin ang lumalaking pagtanggap ng ...

Malaman Higit Pa

Dumating na ang Araw ng Pagsentensiya: Ang Kapalaran ni CZ ay Nagbabalanse habang Isinasaalang-alang ng Korte ng US ang Panawagan ng DOJ

Si Changpeng Zhao ay handang harapin ang sentensiya sa korte ng US sa Seattle ngayon.

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Inside Wall Street Memes (WSM): Unveiling the Headlines
Negosyo markets Mga Kuwento at Pagsusuri Teknolohiya
Inside Wall Street Memes (WSM): Unveiling the Headlines
Mayo 7, 2024
Tuklasin ang Crypto Whales: Sino ang Sino sa Market
Negosyo markets Mga Kuwento at Pagsusuri Teknolohiya
Tuklasin ang Crypto Whales: Sino ang Sino sa Market
Mayo 7, 2024
Ang Orbiter Finance ay Nakipagsosyo Sa Bitcoin Layer 2 Zulu Network At Nag-deploy Sa Is Lwazi Testnet
Negosyo Ulat sa Balita Teknolohiya
Ang Orbiter Finance ay Nakipagsosyo Sa Bitcoin Layer 2 Zulu Network At Nag-deploy Sa Is Lwazi Testnet 
Mayo 7, 2024
Isinasama ng Crypto Exchange Bybit ang USDe ng Ethena Labs Bilang Collateral Asset, Pinapagana ang BTC-USDe At ETH-USDe Trading Pairs
markets Ulat sa Balita Teknolohiya
Isinasama ng Crypto Exchange Bybit ang USDe ng Ethena Labs Bilang Collateral Asset, Pinapagana ang BTC-USDe At ETH-USDe Trading Pairs
Mayo 7, 2024
CRYPTOMERIA LABS PTE. LTD.