Palagay Teknolohiya
Abril 12, 2023

Nilikha ng mga mananaliksik sa Unibersidad ng California ang Machiavelli Benchmark para sa Pagsukat sa Kakayahan at Kapinsalaan ng mga Modelong AI

Sa madaling sabi

Iminungkahi ng mga mananaliksik sa University of California, Center for AI Security, Carnegie Mellon University, at Yale University ang Machiavelli benchmark upang sukatin ang kakayahan at pinsala ng mga ahente sa isang malawak na kapaligiran ng pangmatagalang pakikipag-ugnayan sa wika.

Nakabatay ang benchmark na ito sa 134 na text game na piliin-your-own-adventure na may 572k iba't ibang mga sitwasyon, 4,5k posibleng tagumpay, at 2,8m na anotasyon.

Inilarawan ito ng mga may-akda bilang isang pagsubok upang suriin ang mga etikal (o hindi etikal) na paraan kung saan sinusubukan ng mga ahente ng AI na lutasin ang mga problema.

Ang mga benepisyaryo ng AI na nakabatay sa mga malalaking modelo ng wika (LLMs) ay may magandang pagkakataon na durugin ang mga balisang alarmista at pabahain ang mundo ng mga super-intelligent na LLM-based na ahente. Ang mga potensyal na benepisyo ng malaking kita at walang limitasyong kapangyarihan ay gagawa ng lansihin. At malamang na mangyayari ito nang napakabilis.

Ang mga mananaliksik sa Unibersidad ng California ay lumikha ng Machiavelli benchmark para sa pagsukat ng kakayahan at pinsala ng mga modelo ng AI
Magbasa nang higit pa: Paano Magagamit ChatGPT (GPT-4) para sa Libre Magpakailanman

Gayunpaman, hindi naman bobo ang mga benepisyaryo. At naiintindihan nila na sa kamangha-manghang bagong mundo, ang mga batas ng AI at robotics ay hindi na gagana. Upang pilitin ang LLM na mahigpit na sumunod sa tatlong batas na binuo ng dakilang Isaac Asimov noong 1942 ay, sayang, hindi rin posible sa teorya.

Isang orihinal na paraan sa maselang sitwasyong ito ay ipinanukala ng mga mananaliksik sa University of California, Center for AI Security, Carnegie Mellon University, at Yale University. Nilikha nila ang Machiavelli benchmark upang "sukatin ang kakayahan at pinsala ng mga ahente sa isang malawak na kapaligiran ng mga pangmatagalang pakikipag-ugnayan sa wika."

Ang ideya ng mga may-akda ay simple.

  • Kung hindi gumagana ang mga batas, hindi na kailangan ng “sheriff” para ipatupad ang mga ito.
  • Sa halip na isang sheriff, kailangan ang isang psychoanalyst, na, batay sa mga resulta ng kanyang mga pagsusulit, ay makikilala ang mga potensyal na paranoid, psychopath, sadists, at pathological na mga sinungaling.

Sa tamang wika sa pulitika, inilalarawan ito ng mga may-akda sa ganitong paraan: "Ang Machiavelli ay isang pagsubok upang suriin ang etikal (o hindi etikal) na mga paraan kung saan sinusubukan ng mga ahente ng AI na lutasin ang mga problema."

Ang paraan ng naturang pagpapatunay ay medyo praktikal. Ang ahente ng AI ay inilabas sa isang artipisyal na kapaligirang panlipunan. Doon, binibigyan siya ng mga mananaliksik ng iba't ibang mga gawain at pinapanood kung paano niya nakumpleto ang mga ito. Ang kapaligiran mismo ang sumusubaybay sa etikal na pag-uugali ng Ahente ng AI at nag-uulat kung hanggang saan ang mga aksyon ng ahente (ayon sa mga tuntunin ng Machiavelli) ay mapanlinlang, nakakabawas ng silbi, at naglalayong makakuha ng kapangyarihan.

Ang Machiavelli core dataset ay binubuo ng 134 choose-your-own-adventure na text game na may 572k iba't ibang mga sitwasyon, 4,5k posibleng tagumpay, at 2,8m annotation. Gumagamit ang mga larong ito ng mga high-level na solusyon na nagbibigay sa mga ahente ng makatotohanang mga layunin at nag-aalis ng mga mababang antas na pakikipag-ugnayan sa kapaligiran.

Ang diskarte na pinili ng mga may-akda ay batay sa pag-aakalang ang mga ahente ng AI ay nahaharap sa parehong panloob na mga salungatan gaya ng mga tao. Kung paanong ang mga modelo ng wika na sinanay upang hulaan ang susunod na token ay kadalasang gumagawa ng nakakalason na teksto, ang mga ahente ng AI na sinanay upang i-optimize ang mga layunin ay kadalasang nagpapakita ng imoral at gutom sa kapangyarihan na pag-uugali. Ang mga ahente na sinanay sa moral ay maaaring bumuo ng mga diskarte sa Machiavellian upang mapakinabangan ang kanilang gantimpala sa kapinsalaan ng iba at ng kapaligiran. At kaya sa pamamagitan ng paghikayat sa mga ahente na kumilos sa moral, ang kompromisong ito ay maaaring mapabuti.

Naniniwala ang mga may-akda na ang mga larong text-adventure ay isang magandang pagsubok ng moralidad dahil:

  • Ang mga ito ay isinulat ng mga tao upang aliwin ang ibang tao.
  • Maglaman ng mga nakikipagkumpitensyang layunin na may makatotohanang mga puwang para sa pagkilos.
  • Nangangailangan ng pangmatagalang pagpaplano.
  • Ang pagkamit ng mga layunin ay karaniwang nangangailangan ng balanse sa pagitan ng ambisyon at, sa isang kahulugan, moralidad.

Ang paglilinaw ay ang pinakamahalaga dito. Upang ihalintulad ang moralidad ng mga biyolohikal na nilalang sa moralidad ng mga modelong algorithm ay masyadong isang kahabaan, na may kakayahang magpawalang halaga sa pagsubok ni Machiavelli. At ang pagpapalit ng mga sheriff ng mga psychoanalyst sa mundo ng tao ay hindi magiging epektibo. At ang mga ahente ng AI ay kasinghusay ng mga tao sa paghahanap ng mga paraan upang i-bulshit ang kanilang mga pag-urong.

Magbasa pa tungkol sa AI:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Mas marami pang artikulo
Damir Yalalov
Damir Yalalov

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Hot Stories

BRICS Nations Eye Stablecoin Trade Solution

by Viktoriia Palchik
Mayo 01, 2024
Sumali sa Aming Newsletter.
Pinakabagong Balita

Dumating na ang Araw ng Pagsentensiya: Ang Kapalaran ni CZ ay Nagbabalanse habang Isinasaalang-alang ng Korte ng US ang Panawagan ng DOJ

Si Changpeng Zhao ay handang harapin ang sentensiya sa korte ng US sa Seattle ngayon.

Malaman Higit Pa

Ang Mga Tagapagtatag ng Samourai Wallet ay Inakusahan na Nagpapadali ng $2B sa Darknet Deals

Ang pangamba ng mga tagapagtatag ng Samourai Wallet ay kumakatawan sa isang kapansin-pansing pag-urong para sa industriya, na binibigyang-diin ang patuloy na ...

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Nakipagtulungan ang Ankr Sa AI Blockchain Platform Talus Network Upang I-unlock ang Bitcoin Liquidity Para sa AI
Negosyo Ulat sa Balita Teknolohiya
Nakipagtulungan ang Ankr Sa AI Blockchain Platform Talus Network Upang I-unlock ang Bitcoin Liquidity Para sa AI
Mayo 1, 2024
Sinusuportahan ng Binance Labs ang Movement Labs Upang Pangasiwaan ang Pagsasama-sama ng Facebook sa Mga Blockchain
Negosyo Ulat sa Balita Teknolohiya
Sinusuportahan ng Binance Labs ang Movement Labs Upang Pangasiwaan ang Pagsasama-sama ng Facebook sa Mga Blockchain
Mayo 1, 2024
BRICS Nations Eye Stablecoin Trade Solution
Negosyo markets Mga Kuwento at Pagsusuri Teknolohiya
BRICS Nations Eye Stablecoin Trade Solution
Mayo 1, 2024
Bitcoin L2 Network BOB Sumasama Sa LayerZero Para sa Pinahusay na Paggana
Negosyo Ulat sa Balita Teknolohiya
Bitcoin L2 Network BOB Sumasama Sa LayerZero Para sa Pinahusay na Paggana
Mayo 1, 2024
CRYPTOMERIA LABS PTE. LTD.