Nagmumungkahi ang Anthropic ng 'Contextual AI' para sa Mga Modelo ng Chat Batay sa 60 Prinsipyo
Sa madaling sabi
OpenAI gumagamit ng reinforcement learning mula sa human feedback (RLHF) upang ihanay mga modelo ng wika na may mga prinsipyo ng tao, kaligtasan, at pagiging kapaki-pakinabang.
Nagmungkahi si Anthropic ng alternatibong diskarte: contextual AI, na kinasasangkutan ng mga tao sa pagsusulat ng konstitusyon na dapat sundin ng modelo.
Nakabatay ang konstitusyong ito sa Deklarasyon ng Mga Karapatang Pantao ng United Nations, Mga Tuntunin ng Serbisyo ng Apple, Mga Prinsipyo na Naghihikayat sa Pagsasaalang-alang sa Mga Pananaw na Hindi Kanluranin.
Ang Anthropic ay nagmungkahi ng isang bagong diskarte sa pagsasanay ng mga modelo ng chat gamit ang 'Konstitusyonal AI'. Ang pamamaraang ito ay nabuo sa OpenAINi reinforcement learning mula sa feedback ng tao ngunit itinatayo ito sa pamamagitan ng pag-iwas sa pangangailangan na magsulat ng malalim na mga sample ng pagsasanay. Sa halip, ang modelo ay sinanay na tumugon sa input sa pamamagitan ng paggamit ng isang konstitusyon na nilalayong kumilos bilang isang hanay ng mga batas para sundin ng modelo.
Inirerekomenda: DatiOpenAI itinatag ng mga empleyado ang Anthropic, isang negosyo na umakit ng mahigit $700 milyon sa financing |
Sa pamamagitan ng pamamaraang ito, makakabuo ang AI ng sarili nitong mga sample ng pagsasanay sa pamamagitan ng pagsusuri kung ano ang sinabi nito kumpara sa hanay ng mga prinsipyong tinatanggap na legal. Ang pamamaraang ito sa pagtitipid ng oras ay makikita bilang Isaac Asimov's Mga Batas ng Robotics isabuhay.
Ang mga prinsipyo na bumubuo sa batayan ng modelo ay napakarami upang talakayin nang detalyado. Gayunpaman, saklaw nila ang maraming paksa, tulad ng moralidad, pag-iwas sa panganib, ekonomiya, at artificial intelligence. Ang bawat isa ay binuo upang makatulong na gabayan ang mga desisyon ng AI pagdating sa pagtugon sa mga senyas sa pakikipag-usap.
Nagawa ni Anthropic na epektibong sanayin ang isang modelo ng AI na pinangalanang Claude, na matagumpay na nakikipagkumpitensya sa OpenAINi ChatGPT. Gamit ang Paraan ng Konstitusyon-AI, maaaring tumugon si Claude sa mga senyas sa pakikipag-usap sa isang kahanga-hangang antas ng katumpakan, ngunit ang mga karagdagang pagpapabuti ay inaasahan habang ang Anthropic ay patuloy na bumubuo sa teknolohiyang ito na nagbabago ng laro.
Sa katunayan, ang bagong diskarte na ito ay may potensyal na makatipid ng oras at pera para sa mga kumpanyang hindi na kakailanganing gumawa ng sarili nilang mga sample ng pagsasanay. Sa halip, ang pamamaraang 'handa na' na ito ay maaaring gamitin bilang batayan para sa paglikha ng mga custom-fit na modelo- walang kinakailangang kaalaman sa programming. Mahalaga rin na tandaan kung paano nangangako rin ang teknolohiyang ito na pataasin ang kaligtasan pagdating sa mga bot sa pakikipag-usap. Paglikha ng isang hanay ng mga prinsipyong tinatanggap ng batas pinapagaan ang panganib ng AI going rogue.
Samakatuwid, ang Konstitusyon AI ay hindi lamang nangangako na gagawing mas madali at mas mabilis ang pagbuo ng modelo ng chat, ngunit gagawin din nitong mas ligtas. Isang win-win na sitwasyon para sa mundo ng Artificial Intelligence at ChatBots.
Isang Analytical Look sa "Contextual AI" ng Anthropic para sa Chatbots
Ang Contextual AI ng Anthropic ay nakabatay sa pagsasama ng higit sa 60 mga prinsipyo na nagmula sa United Nations Declaration of Human Rights, Mga Tuntunin ng Serbisyo ng Apple, Mga Prinsipyo na Naghihikayat sa Pagsasaalang-alang sa mga Non-Western na Pananaw, Deepmind's Mga Panuntunan ng Sparrow, at Anthropic Research Set 1 at Set 2.
Ang katotohanan na maaari na ngayong turuan ang AI na kumilos ayon sa mga prinsipyong nagmula sa napakalawak at magkakaibang hanay ng mga mapagkukunan ay talagang kapansin-pansin. Sa pamamagitan ng pagsasama ng mga prinsipyo mula sa United Nations Declaration of Human Rights, halimbawa, ang mga tugon sa chatbot ay sumasalamin na ngayon sa kahalagahan ng pangangalaga sa ideya ng kalayaan, pagkakapantay-pantay, at kapatiran. Ang ganitong mga prinsipyo ay isang mahalagang bahagi ng pagtiyak na iyon mga pag-uusap sa chatbot manatiling etikal at magalang. Gayundin, tinitiyak ng pagsasama ng Mga Tuntunin ng Serbisyo ng Apple ang chatbot isinasaalang-alang ang mga interes sa privacy ng mga gumagamit nito.
Ang Mga Prinsipyo na Naghihikayat sa Pagsasaalang-alang sa Mga Pananaw na Hindi Kanluranin ay may mahalagang papel din sa modelong "Contextual AI". Ang mga prinsipyong ito ay sumasalamin sa pangangailangan para sa AI na maging magalang sa ibang mga kultura at matiyak na ang mga tugon sa chatbot ay hindi itinuturing na nakakapinsala o nakakasakit. Katulad nito, ang Deepmind's Sparrow Rules ay nagdidikta na ang chatbot ay tumutugon sa mga tugon na nilayon upang bumuo ng isang relasyon sa user.
Ang pagsasama ng Anthropic Research Set 1 at Set 2 ay nagbibigay ng panghuling garantiya na ang mga pag-uusap sa AI ay mananatiling sibil at magalang. Ang AI ay sinanay upang matiyak na sinasagot nito ang mga tanong sa isang maalalahanin at magalang na paraan.
Sa kabuuan, ang modelong “Contextual AI” ng Anthropic ay isang hindi kapani-paniwalang mahalagang tagumpay sa larangan ng pananaliksik sa AI. Sa pamamagitan ng pagpayag sa AI na ituro ayon sa mga prinsipyong nagmula sa gayong magkakaibang hanay ng mga mapagkukunan, ang mga etikal na implikasyon ng mga awtomatikong pag-uusap ay lubos na napabuti.
Magbasa pa tungkol sa AI:
Pagtanggi sa pananagutan
Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.
Tungkol sa Ang May-akda
Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet.
Mas marami pang artikuloSi Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet.