Novinky Technika
15. března 2023

OpenAI Sestavuje tým více než 50 expertů za účelem vylepšení GPT-4Bezpečnost

Stručně

OpenAI najala tým více než 50 odborníků, aby zajistili, že je to nejnovější jazykový model, GPT-4, je bezpečný pro použití.

Tým zahrnuje výzkumníky a inženýry specializující se na bezpečnost, etiku a politiku AI.

Cílem je zabránit GPT-4 před generováním škodlivého nebo neobjektivního obsahu a zajistit, aby byl v souladu s lidskými hodnotami.

OpenAI Sestavuje tým více než 50 expertů za účelem vylepšení GPT-4Bezpečnost

OpenAI na výrobu najala přes 50 odborníků z různých oblastí GPT-4 bezpečnější. Odborníci pracovali s nepříznivým testováním modelu, aby identifikovali potenciální rizika a zranitelnosti. Jsou to odborníci z různých oblastí: dlouhodobá rizika přizpůsobení AI, kybernetická bezpečnost, biologická rizika a mezinárodní bezpečnost. Jejich zjištění pomohla OpenAI vyhodnotit chování modelu ve vysoce rizikových oblastech, které vyžadují specializované odborné znalosti. 

Zatímco nejnovější jazykový model představuje podobná rizika jako menší jazykové modely, další možnosti GPT-4 vést k novým hrozbám. Došlo tedy k zapojení odborníků zásadní pro zajištění bezpečnosti technologie.

OpenAI zavedla další sadu bezpečnostních výukových výukových výzev z lidských preferencí (RLHF) a modelů odměňování založených na pravidlech (RBRM), aby zlepšila bezpečnost GPT-4 Modelka. RBRM jsou zero-shot GPT-4 klasifikátory, které fungují jako další signál odměny pro GPT-4 model politiky během dolaďování RLHF. Jejich účelem je podněcovat vhodné chování, jako je odmítání generování škodlivého obsahu nebo neodmítání neškodných žádostí.

Pro zajištění bezpečnosti GPT-4 modely, OpenAI začala v srpnu 2022 nabírat externí odborníky, aby prováděli cvičení „červeného týmu“, včetně zátěžového testování, hraničního testování a testování protivníků. Měli přístup k raným verzím GPT-4 model a identifikoval počáteční rizika, která motivovala další bezpečnostní výzkum.

Zpětná vazba odborníků vedla k technickým zmírněním a opatřením k prosazování politik ke snížení rizik. Mnoho hrozeb však přetrvává a je zapotřebí další hodnocení.

Povídání o zaměstnancích na OpenAI, ChatGPT byl zpočátku rozvinutý s pomocí jednotlivců v některých z nejchudších regionů světa prostřednictvím OpenAIpartnerství se společností Sama, která zaměstnává miliony pracovníků z chudých oblastí. Někteří odborníci na etiku umělé inteligence kritizovali OpenAIrozhodnutí outsourcovat školení svého ChatGPT model Sama, obviňující společnost z vykořisťování levné pracovní síly.

Čtěte více:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Agne je novinářka, která se zabývá nejnovějšími trendy a vývojem v metaverse, AI a Web3 průmysl pro Metaverse Post. Její vášeň pro vyprávění ji přivedla k četným rozhovorům s odborníky v těchto oblastech, ve kterých se vždy snažila odhalit vzrušující a poutavé příběhy. Agne má bakalářský titul z literatury a má rozsáhlé zkušenosti s psaním o široké škále témat, včetně cestování, umění a kultury. Přihlásila se také jako redaktorka do organizace pro práva zvířat, kde pomáhala zvyšovat povědomí o otázkách dobrých životních podmínek zvířat. Kontaktujte ji [chráněno e-mailem].

Další články
Agne Cimermanová
Agne Cimermanová

Agne je novinářka, která se zabývá nejnovějšími trendy a vývojem v metaverse, AI a Web3 průmysl pro Metaverse Post. Její vášeň pro vyprávění ji přivedla k četným rozhovorům s odborníky v těchto oblastech, ve kterých se vždy snažila odhalit vzrušující a poutavé příběhy. Agne má bakalářský titul z literatury a má rozsáhlé zkušenosti s psaním o široké škále témat, včetně cestování, umění a kultury. Přihlásila se také jako redaktorka do organizace pro práva zvířat, kde pomáhala zvyšovat povědomí o otázkách dobrých životních podmínek zvířat. Kontaktujte ji [chráněno e-mailem].

Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility

Zveřejnění prostřednictvím podání 13F odhaluje, že pozoruhodní institucionální investoři fušují do bitcoinových ETF, což podtrhuje rostoucí akceptaci...

Vědět více

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Injective spojuje síly s AltLayer, aby přineslo zabezpečení při opětovném skládání do inEVM
Business Novinky Technika
Injective spojuje síly s AltLayer, aby přineslo zabezpečení při opětovném skládání do inEVM
3
Masa se spojila s Tellerem, aby zavedla MASA Půjčovací fond, umožní USDC půjčování na základně
Trhy Novinky Technika
Masa se spojila s Tellerem, aby zavedla MASA Půjčovací fond, umožní USDC půjčování na základně
3
Velodrome spouští v nadcházejících týdnech beta verzi Superchain a rozšiřuje se o blockchainy OP Stack Layer 2
Trhy Novinky Technika
Velodrome spouští v nadcházejících týdnech beta verzi Superchain a rozšiřuje se o blockchainy OP Stack Layer 2
3
CARV oznamuje partnerství se společností Aethir za účelem decentralizace její datové vrstvy a distribuce odměn
Business Novinky Technika
CARV oznamuje partnerství se společností Aethir za účelem decentralizace její datové vrstvy a distribuce odměn
3
CRYPTOMERIA LABS PTE. LTD.