Naujienų ataskaita Technologija
Kovo 15, 2023

OpenAI Suburia daugiau nei 50 ekspertų komandą tobulinti GPT-4saugumas

Trumpai

OpenAI pasamdė daugiau nei 50 ekspertų komandą, kad užtikrintų naujausią kalbos modelis, GPT-4, yra saugus naudoti.

Komandą sudaro tyrėjai ir inžinieriai, besispecializuojantys dirbtinio intelekto saugos, etikos ir politikos srityse.

Tikslas yra užkirsti kelią GPT-4 kurti žalingą ar šališką turinį ir užtikrinti, kad jis atitiktų žmogiškąsias vertybes.

OpenAI Suburia daugiau nei 50 ekspertų komandą tobulinti GPT-4saugumas

OpenAI pasamdė daugiau nei 50 ekspertų iš įvairių sričių GPT-4 saugiau. Ekspertai, siekdami nustatyti galimą riziką ir pažeidžiamumą, išbandė modelio priešiškumą. Jie yra įvairių sričių ekspertai: ilgalaikės AI derinimo rizikos, kibernetinio saugumo, biologinės rizikos ir tarptautinio saugumo. Jų išvados padėjo OpenAI įvertinti modelio elgesį didelės rizikos srityse, kurioms reikalinga nišinė kompetencija. 

Nors naujausias kalbos modelis kelia panašią riziką kaip ir mažesni kalbų modeliai, papildomos galimybės GPT-4 sukelti naujų grėsmių. Taigi, buvo pasitelkti ekspertai itin svarbus užtikrinant technologijos saugumą.

OpenAI įdiegė papildomą saugai svarbaus mokymosi pagal žmogaus pageidavimus (RLHF) mokymo raginimus ir taisyklėmis pagrįstus atlygio modelius (RBRM), kad pagerintų GPT-4 modelis. RBRM yra nulinio kadro GPT-4 klasifikatoriai, kurie veikia kaip papildomas atlygio signalas GPT-4 politikos modelis RLHF koregavimo metu. Jų tikslas – skatinti tinkamą elgesį, pvz., atsisakyti kurti žalingą turinį arba neatmesti nekenksmingų užklausų.

Siekiant užtikrinti saugumą GPT-4 modeliai, OpenAI 2022 m. rugpjūčio mėn. pradėjo samdyti išorės ekspertus, kad jie atliktų „raudonosios komandos“ pratimus, įskaitant testavimą nepalankiausiomis sąlygomis, ribinį testavimą ir testavimą prieš varžybas. Jie turėjo prieigą prie ankstyvųjų versijų GPT-4 modelį ir nustatė pradines rizikas, kurios paskatino tolesnius saugos tyrimus.

Remiantis ekspertų atsiliepimais, buvo imtasi techninių sušvelninimo ir politikos įgyvendinimo priemonių rizikai sumažinti. Tačiau daug grėsmių išlieka, todėl reikia tolesnio vertinimo.

Kalbame apie darbuotojus adresu OpenAI, ChatGPT iš pradžių buvo išsivystęs padedant asmenims kai kuriuose skurdžiausiuose pasaulio regionuose per OpenAIpartnerystė su įmone Sama, kurioje dirba milijonai darbuotojų iš skurdžių vietovių. Kai kurie dirbtinio intelekto etikos ekspertai kritikavo OpenAIsprendimą perduoti savo mokymus iš išorės ChatGPT modelis Samai, kaltindamas įmonę pigios darbo jėgos išnaudojimu.

Plačiau paskaitykite čia:

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Agnė yra žurnalistė, kuri pasakoja apie naujausias tendencijas ir pokyčius metaverse, AI ir Web3 pramonės šakoms Metaverse Post. Jos aistra pasakojimui paskatino ją vesti daugybę interviu su šių sričių ekspertais, visada siekdama atskleisti įdomių ir įtraukiančių istorijų. Agnė yra įgijusi literatūros bakalauro laipsnį ir daug rašo įvairiomis temomis, įskaitant keliones, meną ir kultūrą. Ji taip pat savanoriavo gyvūnų teisių organizacijos redaktore, kur padėjo didinti informuotumą apie gyvūnų gerovės problemas. Susisiekite su ja [apsaugotas el. paštu].

Daugiau straipsnių
Agnė Cimerman
Agnė Cimerman

Agnė yra žurnalistė, kuri pasakoja apie naujausias tendencijas ir pokyčius metaverse, AI ir Web3 pramonės šakoms Metaverse Post. Jos aistra pasakojimui paskatino ją vesti daugybę interviu su šių sričių ekspertais, visada siekdama atskleisti įdomių ir įtraukiančių istorijų. Agnė yra įgijusi literatūros bakalauro laipsnį ir daug rašo įvairiomis temomis, įskaitant keliones, meną ir kultūrą. Ji taip pat savanoriavo gyvūnų teisių organizacijos redaktore, kur padėjo didinti informuotumą apie gyvūnų gerovės problemas. Susisiekite su ja [apsaugotas el. paštu].

Institucinis apetitas Bitcoin ETF atžvilgiu auga dėl nepastovumo

13F paraiškų atskleidimas atskleidžia žymius institucinius investuotojus, kurie naudojasi Bitcoin ETF, o tai rodo, kad vis labiau pritariama...

Žinoti daugiau

Ateina nuosprendžio paskelbimo diena: CZ likimas subalansuotas, nes JAV teismas svarsto DOJ prašymą

Changpeng Zhao šiandien laukia nuosprendžio JAV teisme Sietle.

Žinoti daugiau
Prisijunkite prie mūsų naujoviškų technologijų bendruomenės
Skaityti daugiau
Skaityti daugiau
Bitcoin pagrindu sukurtas amžinasis AI „Naka Launchpad“ paleidžia EAI žetonų generavimo įvykį
rinkos Naujienų ataskaita Technologija
Bitcoin pagrindu sukurtas amžinasis AI „Naka Launchpad“ paleidžia EAI žetonų generavimo įvykį
Gali 3, 2024
Nuo žaidėjo vaikino iki memų monetų sensacijos: kaip humoristinis Sealanos pasakojimas atsiliepia investuotojams
Naujienų ataskaita
Nuo žaidėjo vaikino iki memų monetų sensacijos: kaip humoristinis Sealanos pasakojimas atsiliepia investuotojams
Gali 3, 2024
Institucinis apetitas Bitcoin ETF atžvilgiu auga dėl nepastovumo
Analizė Atsakingas verslas rinkos Technologija
Institucinis apetitas Bitcoin ETF atžvilgiu auga dėl nepastovumo
Gali 3, 2024
XION ir TOKI praneša apie BNB grandinės ekosistemai sukurtos grandinės abstrakcijos paleidimą
Atsakingas verslas Naujienų ataskaita Technologija
XION ir TOKI praneša apie BNB grandinės ekosistemai sukurtos grandinės abstrakcijos paleidimą
Gali 3, 2024
CRYPTOMERIA LABS PTE. LTD.