OpenAI Nagtitipon ng Koponan ng 50+ Eksperto para Pahusayin GPT-4Kaligtasan ni
Sa madaling sabi
OpenAI ay kumuha ng isang pangkat ng higit sa 50 mga eksperto upang matiyak na ang pinakabago nito modelo ng wika, GPT-4, ay ligtas para sa paggamit.
Kasama sa koponan ang mga mananaliksik at inhinyero na dalubhasa sa kaligtasan, etika, at patakaran ng AI.
Ang layunin ay upang maiwasan GPT-4 mula sa pagbuo ng mapaminsalang o may kinikilingan na nilalaman at upang matiyak na naaayon ito sa mga halaga ng tao.
OpenAI ay kumuha ng mahigit 50 eksperto mula sa iba't ibang domain para gawin GPT-4 mas ligtas. Ang mga eksperto ay nagtatrabaho sa adversarial testing ng modelo upang matukoy ang mga potensyal na panganib at kahinaan. Mga eksperto sila mula sa iba't ibang lugar: pangmatagalang mga panganib sa pagkakahanay ng AI, cybersecurity, biorisk, at internasyonal na seguridad. Nakatulong ang kanilang mga natuklasan OpenAI suriin ang pag-uugali ng modelo sa mga lugar na may mataas na peligro na nangangailangan ng angkop na kadalubhasaan.
Habang ang pinakabagong modelo ng wika ay nagdudulot ng mga katulad na panganib gaya ng mas maliliit na modelo ng wika, ang mga karagdagang kakayahan ng GPT-4 humantong sa mga bagong banta. Kaya, ang pakikipag-ugnayan ng mga eksperto ay naging mahalaga sa pagtiyak sa kaligtasan ng teknolohiya.
OpenAI ay nagpatupad ng karagdagang set ng safety-relevant reinforcement learning mula sa human preferences (RLHF) training prompts at rule-based reward models (RBRMs) upang mapabuti ang kaligtasan ng GPT-4 modelo. Ang mga RBRM ay zero-shot GPT-4 mga classifier na nagsisilbing karagdagang reward signal para sa GPT-4 modelo ng patakaran sa panahon ng fine-tuning ng RLHF. Ang kanilang layunin ay magbigay ng insentibo sa naaangkop na pag-uugali, tulad ng pagtanggi sa pagbuo ng mapaminsalang nilalaman o hindi pagtanggi sa mga hindi nakakapinsalang kahilingan.
Upang matiyak ang kaligtasan ng GPT-4 modelo, OpenAI nagsimulang mag-recruit ng mga external na eksperto noong Agosto 2022 para magsagawa ng "red teaming" exercises, kabilang ang stress testing, boundary testing, at adversarial testing. Nagkaroon sila ng access sa mga unang bersyon ng GPT-4 modelo at natukoy ang mga paunang panganib na nag-udyok sa karagdagang pananaliksik sa kaligtasan.
Ang feedback ng mga eksperto ay humantong sa mga teknikal na pagpapagaan at mga hakbang sa pagpapatupad ng patakaran upang mabawasan ang mga panganib. Gayunpaman, maraming banta ang nananatili, at kailangan ang karagdagang pagsusuri.
Ang pakikipag-usap tungkol sa mga empleyado sa OpenAI, ChatGPT ay una umunlad sa tulong mula sa mga indibidwal sa ilan sa mga pinakamahihirap na rehiyon sa mundo sa pamamagitan ng OpenAIpakikipagsosyo ni sa isang kumpanyang tinatawag na Sama, na gumagamit ng milyun-milyong manggagawa mula sa mahihirap na lugar. Pinuna ng ilang eksperto sa etika ng AI OpenAIang desisyon na i-outsource ang pagsasanay nito ChatGPT modelo kay Sama, na inaakusahan ang kumpanya ng pagsasamantala sa murang paggawa.
Magbasa nang higit pa:
Pagtanggi sa pananagutan
Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.
Tungkol sa Ang May-akda
Si Agne ay isang mamamahayag na sumasaklaw sa pinakabagong mga uso at pag-unlad sa metaverse, AI, at Web3 mga industriya para sa Metaverse Post. Ang kanyang hilig sa pagkukuwento ay nagbunsod sa kanya na magsagawa ng maraming panayam sa mga eksperto sa mga larangang ito, na laging naghahangad na tumuklas ng mga kapana-panabik at nakakaakit na mga kuwento. Si Agne ay mayroong Bachelor's degree sa panitikan at may malawak na background sa pagsulat tungkol sa malawak na hanay ng mga paksa kabilang ang paglalakbay, sining, at kultura. Nagboluntaryo din siya bilang isang editor para sa organisasyon ng mga karapatang panghayop, kung saan tumulong siya na itaas ang kamalayan tungkol sa mga isyu sa kapakanan ng hayop. Makipag-ugnayan sa kanya sa [protektado ng email].
Mas marami pang artikuloSi Agne ay isang mamamahayag na sumasaklaw sa pinakabagong mga uso at pag-unlad sa metaverse, AI, at Web3 mga industriya para sa Metaverse Post. Ang kanyang hilig sa pagkukuwento ay nagbunsod sa kanya na magsagawa ng maraming panayam sa mga eksperto sa mga larangang ito, na laging naghahangad na tumuklas ng mga kapana-panabik at nakakaakit na mga kuwento. Si Agne ay mayroong Bachelor's degree sa panitikan at may malawak na background sa pagsulat tungkol sa malawak na hanay ng mga paksa kabilang ang paglalakbay, sining, at kultura. Nagboluntaryo din siya bilang isang editor para sa organisasyon ng mga karapatang panghayop, kung saan tumulong siya na itaas ang kamalayan tungkol sa mga isyu sa kapakanan ng hayop. Makipag-ugnayan sa kanya sa [protektado ng email].