Ulat sa Balita Teknolohiya
Marso 15, 2023

OpenAI Nagtitipon ng Koponan ng 50+ Eksperto para Pahusayin GPT-4Kaligtasan ni

Sa madaling sabi

OpenAI ay kumuha ng isang pangkat ng higit sa 50 mga eksperto upang matiyak na ang pinakabago nito modelo ng wika, GPT-4, ay ligtas para sa paggamit.

Kasama sa koponan ang mga mananaliksik at inhinyero na dalubhasa sa kaligtasan, etika, at patakaran ng AI.

Ang layunin ay upang maiwasan GPT-4 mula sa pagbuo ng mapaminsalang o may kinikilingan na nilalaman at upang matiyak na naaayon ito sa mga halaga ng tao.

OpenAI Nagtitipon ng Koponan ng 50+ Eksperto para Pahusayin GPT-4Kaligtasan ni

OpenAI ay kumuha ng mahigit 50 eksperto mula sa iba't ibang domain para gawin GPT-4 mas ligtas. Ang mga eksperto ay nagtatrabaho sa adversarial testing ng modelo upang matukoy ang mga potensyal na panganib at kahinaan. Mga eksperto sila mula sa iba't ibang lugar: pangmatagalang mga panganib sa pagkakahanay ng AI, cybersecurity, biorisk, at internasyonal na seguridad. Nakatulong ang kanilang mga natuklasan OpenAI suriin ang pag-uugali ng modelo sa mga lugar na may mataas na peligro na nangangailangan ng angkop na kadalubhasaan. 

Habang ang pinakabagong modelo ng wika ay nagdudulot ng mga katulad na panganib gaya ng mas maliliit na modelo ng wika, ang mga karagdagang kakayahan ng GPT-4 humantong sa mga bagong banta. Kaya, ang pakikipag-ugnayan ng mga eksperto ay naging mahalaga sa pagtiyak sa kaligtasan ng teknolohiya.

OpenAI ay nagpatupad ng karagdagang set ng safety-relevant reinforcement learning mula sa human preferences (RLHF) training prompts at rule-based reward models (RBRMs) upang mapabuti ang kaligtasan ng GPT-4 modelo. Ang mga RBRM ay zero-shot GPT-4 mga classifier na nagsisilbing karagdagang reward signal para sa GPT-4 modelo ng patakaran sa panahon ng fine-tuning ng RLHF. Ang kanilang layunin ay magbigay ng insentibo sa naaangkop na pag-uugali, tulad ng pagtanggi sa pagbuo ng mapaminsalang nilalaman o hindi pagtanggi sa mga hindi nakakapinsalang kahilingan.

Upang matiyak ang kaligtasan ng GPT-4 modelo, OpenAI nagsimulang mag-recruit ng mga external na eksperto noong Agosto 2022 para magsagawa ng "red teaming" exercises, kabilang ang stress testing, boundary testing, at adversarial testing. Nagkaroon sila ng access sa mga unang bersyon ng GPT-4 modelo at natukoy ang mga paunang panganib na nag-udyok sa karagdagang pananaliksik sa kaligtasan.

Ang feedback ng mga eksperto ay humantong sa mga teknikal na pagpapagaan at mga hakbang sa pagpapatupad ng patakaran upang mabawasan ang mga panganib. Gayunpaman, maraming banta ang nananatili, at kailangan ang karagdagang pagsusuri.

Ang pakikipag-usap tungkol sa mga empleyado sa OpenAI, ChatGPT ay una umunlad sa tulong mula sa mga indibidwal sa ilan sa mga pinakamahihirap na rehiyon sa mundo sa pamamagitan ng OpenAIpakikipagsosyo ni sa isang kumpanyang tinatawag na Sama, na gumagamit ng milyun-milyong manggagawa mula sa mahihirap na lugar. Pinuna ng ilang eksperto sa etika ng AI OpenAIang desisyon na i-outsource ang pagsasanay nito ChatGPT modelo kay Sama, na inaakusahan ang kumpanya ng pagsasamantala sa murang paggawa.

Magbasa nang higit pa:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Agne ay isang mamamahayag na sumasaklaw sa pinakabagong mga uso at pag-unlad sa metaverse, AI, at Web3 mga industriya para sa Metaverse Post. Ang kanyang hilig sa pagkukuwento ay nagbunsod sa kanya na magsagawa ng maraming panayam sa mga eksperto sa mga larangang ito, na laging naghahangad na tumuklas ng mga kapana-panabik at nakakaakit na mga kuwento. Si Agne ay mayroong Bachelor's degree sa panitikan at may malawak na background sa pagsulat tungkol sa malawak na hanay ng mga paksa kabilang ang paglalakbay, sining, at kultura. Nagboluntaryo din siya bilang isang editor para sa organisasyon ng mga karapatang panghayop, kung saan tumulong siya na itaas ang kamalayan tungkol sa mga isyu sa kapakanan ng hayop. Makipag-ugnayan sa kanya sa [protektado ng email].

Mas marami pang artikulo
Agne Cimerman
Agne Cimerman

Si Agne ay isang mamamahayag na sumasaklaw sa pinakabagong mga uso at pag-unlad sa metaverse, AI, at Web3 mga industriya para sa Metaverse Post. Ang kanyang hilig sa pagkukuwento ay nagbunsod sa kanya na magsagawa ng maraming panayam sa mga eksperto sa mga larangang ito, na laging naghahangad na tumuklas ng mga kapana-panabik at nakakaakit na mga kuwento. Si Agne ay mayroong Bachelor's degree sa panitikan at may malawak na background sa pagsulat tungkol sa malawak na hanay ng mga paksa kabilang ang paglalakbay, sining, at kultura. Nagboluntaryo din siya bilang isang editor para sa organisasyon ng mga karapatang panghayop, kung saan tumulong siya na itaas ang kamalayan tungkol sa mga isyu sa kapakanan ng hayop. Makipag-ugnayan sa kanya sa [protektado ng email].

Ang Institutional Appetite ay Lumalaki Patungo sa Bitcoin ETFs Sa gitna ng Volatility

Ang mga pagsisiwalat sa pamamagitan ng 13F filing ay nagpapakita ng mga kilalang institusyonal na mamumuhunan na nakikipag-ugnayan sa mga Bitcoin ETF, na binibigyang-diin ang lumalaking pagtanggap ng ...

Malaman Higit Pa

Dumating na ang Araw ng Pagsentensiya: Ang Kapalaran ni CZ ay Nagbabalanse habang Isinasaalang-alang ng Korte ng US ang Panawagan ng DOJ

Si Changpeng Zhao ay handang harapin ang sentensiya sa korte ng US sa Seattle ngayon.

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Pinagsama-sama ng Injective ang AltLayer Upang Magdala ng Restaking Security Sa inEVM
Negosyo Ulat sa Balita Teknolohiya
Pinagsama-sama ng Injective ang AltLayer Upang Magdala ng Restaking Security Sa inEVM
Mayo 3, 2024
Nakipagtulungan ang Masa Sa Teller Upang Ipakilala ang MASA Lending Pool, Pinapagana ang USDC Borrowing On Base
markets Ulat sa Balita Teknolohiya
Nakipagtulungan ang Masa Sa Teller Upang Ipakilala ang MASA Lending Pool, Pinapagana ang USDC Borrowing On Base
Mayo 3, 2024
Inilunsad ng Velodrome ang Superchain Beta na Bersyon Sa Mga Paparating na Linggo At Lumalawak sa OP Stack Layer 2 Blockchain
markets Ulat sa Balita Teknolohiya
Inilunsad ng Velodrome ang Superchain Beta na Bersyon Sa Mga Paparating na Linggo At Lumalawak sa OP Stack Layer 2 Blockchain
Mayo 3, 2024
Inanunsyo ng CARV ang Pakikipagsosyo Sa Aethir Upang I-desentralisa ang Layer ng Data Nito At Ipamahagi ang Mga Gantimpala
Negosyo Ulat sa Balita Teknolohiya
Inanunsyo ng CARV ang Pakikipagsosyo Sa Aethir Upang I-desentralisa ang Layer ng Data Nito At Ipamahagi ang Mga Gantimpala
Mayo 3, 2024
CRYPTOMERIA LABS PTE. LTD.