Ziņojums Tehnoloģija
Marts 16, 2023

OpenAI Izsludina Evals — atvērtā pirmkoda programmatūras ietvaru AI modeļu novērtēšanai

Īsumā

OpenAI cer apkopot etalonus, lai novērtētu AI modeļus, piemēram, GPT-4.

Maksājumu apstrādes uzņēmums Stripe jau ir izmantojis Evals, lai izmērītu to precizitāti GPT- darbināms dokumentācijas rīks.

OpenAI piešķirs GPT-4 ierobežotu laiku piekļuve tiem, kas sniedz augstas kvalitātes evals.

OpenAI Izsludina Evals — atvērtā pirmkoda programmatūras ietvaru AI modeļu novērtēšanai

Līdzās paziņojumam par GPT-4, OpenAI ir paziņojis par atvērtā pirmkoda programmatūras ietvaru OpenAI Evals. Šis rīks ir paredzēts, lai izveidotu un palaistu etalonus, kas novērtē tādu modeļu veiktspēju kā GPT-4. Ar Evalsu, OpenAI cer piesaistīt etalonus AI modeļu testēšanai. 

"Mēs izmantojam Evals, lai vadītu mūsu modeļu izstrādi (gan identificējot trūkumus, gan novēršot regresijas), un mūsu lietotāji to var izmantot, lai izsekotu veiktspēju dažādās modeļu versijās (kas tagad iznāks regulāri) un attīstītu produktu integrāciju," uzņēmums skaidro. a blog post.

Stripe, populārs maksājumu apstrādes uzņēmums, jau ir izmantojis Evals, lai papildinātu savus cilvēku novērtējumus un mērītu viņu veikto maksājumu precizitāti. GPT- darbināms dokumentācijas rīks.

Izstrādātāji var izmantot Evals, lai izveidotu un palaistu novērtējumus, kas:

  • Izmantojiet datu kopas, lai ģenerētu uzvednes,
  • Novērtējiet pabeigšanas kvalitāti, ko nodrošina an OpenAI modelis, un
  • Salīdziniet veiktspēju dažādās datu kopās un modeļos.

Izmantojot atvērtā pirmkoda kodu, izstrādātāji var arī rakstīt un pievienot a pasūtījuma Eval kā arī vairākas veidnes kas var pielāgot dažādus etalonus. Uzņēmums ir iekļāvis veidnes, kas ir bijušas visnoderīgākās iekšēji, tostarp veidni “modeļa vērtēšanai”, kas GPT-4 var izmantot, lai pārbaudītu savu darbu. Kā piemēru, kas jāievēro, uzņēmums ir izveidojis loģikas mīklu eval, kas satur desmit uzvednes, kur GPT-4 neizdodas.

Evals ir saderīgs arī ar esošo etalonu ieviešanu, tostarp vairākiem piezīmjdatoriem, kas ievieš akadēmiskos etalonus, un dažus variantus, kas integrē nelielas CoQA apakškopas.

Lai gan izstrādātājiem netiks maksāts par Evals ieguldījumu, OpenAI piešķirs GPT-4 ierobežotu laiku piekļuve tiem, kas sniedz "augstas kvalitātes evals". 

Evals paziņojums nāk pēc tam OpenAI nesen teica tas pārtrauks izmantot datus, ko klienti ir iesnieguši, izmantojot API -mākslas modeļi” par to DynaBench platformas.

Lasīt vairāk:

Tags:

Atbildības noraidīšana

Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.

Par Autors

Sindija ir žurnāliste Metaverse Post, aptverot tēmas, kas saistītas ar web3, NFT, metaverse un AI, koncentrējoties uz intervijām ar Web3 nozares spēlētājiem. Viņa ir runājusi ar vairāk nekā 30 C līmeņa vadītājiem, sniedzot lasītājiem viņu vērtīgās atziņas. Sākotnēji no Singapūras, Sindija tagad atrodas Tbilisi, Džordžijas štatā. Viņai ir bakalaura grāds komunikāciju un mediju studijās Dienvidaustrālijas Universitātē, un viņai ir desmit gadu pieredze žurnālistikā un rakstniecībā. Sazinieties ar viņu, izmantojot [e-pasts aizsargāts] ar preses prezentācijām, paziņojumiem un interviju iespējām.

Vairāk rakstus
Sindija Tana
Sindija Tana

Sindija ir žurnāliste Metaverse Post, aptverot tēmas, kas saistītas ar web3, NFT, metaverse un AI, koncentrējoties uz intervijām ar Web3 nozares spēlētājiem. Viņa ir runājusi ar vairāk nekā 30 C līmeņa vadītājiem, sniedzot lasītājiem viņu vērtīgās atziņas. Sākotnēji no Singapūras, Sindija tagad atrodas Tbilisi, Džordžijas štatā. Viņai ir bakalaura grāds komunikāciju un mediju studijās Dienvidaustrālijas Universitātē, un viņai ir desmit gadu pieredze žurnālistikā un rakstniecībā. Sazinieties ar viņu, izmantojot [e-pasts aizsargāts] ar preses prezentācijām, paziņojumiem un interviju iespējām.

Hot Stories

BRICS Nāciju acs stabilu monētu tirdzniecības risinājums

by Viktorija Palčika
01. gada 2024. maijs
Pievienojieties mūsu informatīvajam izdevumam.
Jaunākās ziņas

Pienāk notiesāšanas diena: CZ liktenis ir līdzsvarā, jo ASV tiesa izskata DOJ lūgumu

Šodien ASV tiesā Sietlā Čanpens Džao ir gatavs notiesāt.

Uzziniet vairāk

Samourai Wallet dibinātāji tiek apsūdzēti par 2 miljardu dolāru atvieglošanu Darknet darījumos

Samourai Wallet dibinātāju bažas ir ievērojams neveiksme nozarei, uzsverot neatlaidīgo ...

Uzziniet vairāk
Pievienojieties mūsu novatoriskajai tehnoloģiju kopienai
Lasīt vairāk
Vairāk
Ankr sadarbojas ar AI Blockchain platformas Talus tīklu, lai atbloķētu Bitcoin likviditāti AI
bizness Ziņojums Tehnoloģija
Ankr sadarbojas ar AI Blockchain platformas Talus tīklu, lai atbloķētu Bitcoin likviditāti AI
1. gada 2024. maijs
Binance Labs atbalsta Movement Labs, lai atvieglotu Facebook Move integrāciju visās blokķēdes
bizness Ziņojums Tehnoloģija
Binance Labs atbalsta Movement Labs, lai atvieglotu Facebook Move integrāciju visās blokķēdes
1. gada 2024. maijs
BRICS Nāciju acs stabilu monētu tirdzniecības risinājums
bizness Markets Stāsti un atsauksmes Tehnoloģija
BRICS Nāciju acs stabilu monētu tirdzniecības risinājums
1. gada 2024. maijs
Bitcoin L2 tīkla BOB integrējas ar LayerZero, lai uzlabotu funkcionalitāti
bizness Ziņojums Tehnoloģija
Bitcoin L2 tīkla BOB integrējas ar LayerZero, lai uzlabotu funkcionalitāti
1. gada 2024. maijs
CRYPTOMERIA LABS PTE. LTD.