Uudiste reportaaž Tehnoloogia
Märtsil 16, 2023

OpenAI Teatab Evalsi, avatud lähtekoodiga tarkvararaamistiku AI mudelite hindamiseks

Põgusalt

OpenAI loodab koondada võrdlusaluseid selliste AI mudelite hindamiseks nagu GPT-4.

Maksetöötlusettevõte Stripe on juba kasutanud Evalsi oma maksete täpsuse mõõtmiseks GPT-toitega dokumenteerimistööriist.

OpenAI hakkab andma GPT-4 piiratud aja jooksul juurdepääs neile, kes panustavad kvaliteetsete eval.

OpenAI Teatab Evalsi, avatud lähtekoodiga tarkvararaamistiku AI mudelite hindamiseks

Koos väljakuulutamisega GPT-4, OpenAI on välja kuulutanud avatud lähtekoodiga tarkvararaamistiku OpenAI Evals. See tööriist on mõeldud selliste mudelite toimivust hindavate etalonide loomiseks ja käitamiseks GPT-4. Koos Evalsiga, OpenAI loodab koondada AI mudeli testimise võrdlusaluseid. 

"Kasutame Evalsi oma mudelite väljatöötamise suunamiseks (nii puuduste tuvastamiseks kui ka regressioonide ennetamiseks) ning meie kasutajad saavad seda rakendada mudeliversioonide (mis ilmuvad nüüd regulaarselt) jõudluse jälgimiseks ja tooteintegratsioonide arendamiseks," selgitab ettevõte. a blogi postitus.

Populaarne maksete töötlemise ettevõte Stripe on juba kasutanud Evalsi oma inimeste hinnangute täiendamiseks ja nende täpsuse mõõtmiseks. GPT-toitega dokumenteerimistööriist.

Arendajad saavad kasutada Evalsi hindamiste loomiseks ja käitamiseks, mis:

  • Kasutage viipade loomiseks andmekogumeid,
  • Mõõtke lõpetamiste kvaliteeti, mida pakub an OpenAI mudelja
  • Võrrelge erinevate andmekogumite ja mudelite toimivust.

Avatud lähtekoodiga saavad arendajad kirjutada ja lisada ka a kohandatud Eval sama hästi kui mitu malli mis võivad hõlmata erinevaid võrdlusaluseid. Ettevõte on lisanud malle, mis on olnud ettevõttesiseselt kõige kasulikumad, sealhulgas malli "mudelipõhise hindamise" jaoks, mis GPT-4 saab kasutada oma töö kontrollimiseks. Järgitava näitena on ettevõte loonud loogikamõistatuste eval, mis sisaldab kümmet viipa, kus GPT-4 ebaõnnestub.

Evals ühildub ka olemasolevate võrdlusnäitajate rakendamisega, sealhulgas mitmete sülearvutitega, mis rakendavad akadeemilisi võrdlusaluseid, ja mõne CoQA väikeste alamhulkade integreerimise variatsioonidega.

Kuigi arendajatele ei maksta Evalsi panuse eest, OpenAI hakkab andma GPT-4 piiratud aja jooksul juurdepääs neile, kes panustavad "kvaliteetse evali". 

Evalsi teade tuleb pärast OpenAI ütles hiljuti ta lõpetaks oma API kaudu klientide esitatud andmete kasutamise oma mudelite koolitamiseks või täiustamiseks, välja arvatud juhul, kui kliendid otsustavad osaleda. Ettevõte ühineb Metaga ühishanke võrdlusalustes, kuna viimane annab inimestele ülesandeks "leida vastuolulisi näiteid, mis lolliksid praegust olukorda. -kunstimudelid” selle eest DynaBench platvormi.

Loe rohkem:

Sildid:

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Cindy on ajakirjanik Metaverse Post, mis käsitleb seotud teemasid web3, NFT, metaverse ja AI, keskendudes intervjuudele kasutajaga Web3 tööstuse mängijad. Ta on vestelnud enam kui 30 C-taseme juhiga, tuues lugejateni nende väärtuslikke teadmisi. Algselt Singapurist pärit Cindy asub nüüd Gruusias Thbilisis. Tal on Lõuna-Austraalia ülikoolis bakalaureusekraad kommunikatsiooni- ja meediauuringute alal ning tal on kümneaastane kogemus ajakirjanduses ja kirjutamises. Võtke temaga ühendust kaudu [meiliga kaitstud] pressikõnede, teadaannete ja intervjuuvõimalustega.

Veel artikleid
Cindy Tan
Cindy Tan

Cindy on ajakirjanik Metaverse Post, mis käsitleb seotud teemasid web3, NFT, metaverse ja AI, keskendudes intervjuudele kasutajaga Web3 tööstuse mängijad. Ta on vestelnud enam kui 30 C-taseme juhiga, tuues lugejateni nende väärtuslikke teadmisi. Algselt Singapurist pärit Cindy asub nüüd Gruusias Thbilisis. Tal on Lõuna-Austraalia ülikoolis bakalaureusekraad kommunikatsiooni- ja meediauuringute alal ning tal on kümneaastane kogemus ajakirjanduses ja kirjutamises. Võtke temaga ühendust kaudu [meiliga kaitstud] pressikõnede, teadaannete ja intervjuuvõimalustega.

Hot Stories

BRICS Nations Eye Stablecoin Trade Solution

by Viktoriia Palchik
Võib 01 2024
Liituge meie uudiskirjaga.
Uudised

Karistuspäev saabub: CZ saatus on tasakaalus, kuna USA kohus võtab DOJ palvet arvesse

Changpeng Zhao ootab täna ees kohtuotsus USA Seattle'i kohtus.

Rohkem teada

Samourai rahakoti asutajaid süüdistatakse Darkneti tehingute 2 miljardi dollari suuruse hõlbustamises

Samourai Walleti asutajate kartus on tööstuse jaoks märkimisväärne tagasilöök, mis rõhutab püsivat ...

Rohkem teada
Liituge meie uuendusliku tehnikakogukonnaga
Loe rohkem
Loe edasi
Ankr teeb koostööd AI plokiahela platvormi Talus võrguga, et avada AI jaoks Bitcoini likviidsus
Äri Uudiste reportaaž Tehnoloogia
Ankr teeb koostööd AI plokiahela platvormi Talus võrguga, et avada AI jaoks Bitcoini likviidsus
Võib 1 2024
Binance Labs toetab liikumislaboreid, et hõlbustada Facebooki liikumise integreerimist plokiahelate vahel
Äri Uudiste reportaaž Tehnoloogia
Binance Labs toetab liikumislaboreid, et hõlbustada Facebooki liikumise integreerimist plokiahelate vahel
Võib 1 2024
BRICS Nations Eye Stablecoin Trade Solution
Äri turud Lood ja ülevaated Tehnoloogia
BRICS Nations Eye Stablecoin Trade Solution
Võib 1 2024
Bitcoin L2 Network BOB integreerub LayerZero-ga täiustatud funktsionaalsuse tagamiseks
Äri Uudiste reportaaž Tehnoloogia
Bitcoin L2 Network BOB integreerub LayerZero-ga täiustatud funktsionaalsuse tagamiseks
Võib 1 2024
CRYPTOMERIA LABS PTE. LTD.