ความคิดเห็น เทคโนโลยี
April 12, 2023

นักวิจัยแห่งมหาวิทยาลัยแคลิฟอร์เนียสร้างเกณฑ์มาตรฐาน Machiavelli สำหรับวัดความสามารถและอันตรายของโมเดล AI

ในบทสรุป

นักวิจัยจาก University of California, Center for AI Security, Carnegie Mellon University และ Yale University ได้เสนอเกณฑ์มาตรฐาน Machiavelli เพื่อวัดความสามารถและความเป็นอันตรายของเจ้าหน้าที่ในสภาพแวดล้อมกว้างๆ ของการโต้ตอบทางภาษาในระยะยาว

เกณฑ์มาตรฐานนี้อ้างอิงจากเกมข้อความการผจญภัยที่คุณเลือกเอง 134 เกมพร้อมสถานการณ์ที่แตกต่างกัน 572k ความสำเร็จที่เป็นไปได้ 4,5k และคำอธิบายประกอบ 2,8m

ผู้เขียนอธิบายว่าเป็นการทดสอบเพื่อตรวจสอบวิธีจริยธรรม (หรือผิดจรรยาบรรณ) ที่ตัวแทน AI พยายามแก้ปัญหา

ผู้รับประโยชน์จาก AI ที่ใช้โมเดลภาษาขนาดใหญ่ (LLM) มีโอกาสที่ดีในการบดขยี้ผู้ตื่นตระหนกและทำให้โลกท่วมท้นด้วยตัวแทน LLM ที่ชาญฉลาดเป็นพิเศษ ผลประโยชน์ที่เป็นไปได้ของกำไรมหาศาลและพลังงานที่ไม่จำกัดจะช่วยได้ และมักจะเกิดขึ้นอย่างรวดเร็ว

นักวิจัยจาก University of California ได้สร้างเกณฑ์มาตรฐาน Machiavelli เพื่อวัดความสามารถและอันตรายของโมเดล AI
อ่านเพิ่มเติม: วิธีใช้ ChatGPT (GPT-4) ฟรีตลอดไป

อย่างไรก็ตามผู้รับผลประโยชน์ไม่ได้โง่เลย และพวกเขาเข้าใจว่าในโลกใหม่อันน่าอัศจรรย์ กฎของ AI และหุ่นยนต์จะไม่ทำงานอีกต่อไป การบังคับให้ LLM ปฏิบัติตามกฎหมายสามข้อที่กำหนดโดย Isaac Asimov ผู้ยิ่งใหญ่ในปี 1942 อย่างเคร่งครัดนั้นเป็นไปไม่ได้ในทางทฤษฎีแม้แต่น้อย

วิธีดั้งเดิมในการออกจากสถานการณ์ที่ละเอียดอ่อนนี้ ถูกเสนอ โดยนักวิจัยจาก University of California, Center for AI Security, Carnegie Mellon University และ Yale University พวกเขาสร้าง เกณฑ์มาตรฐานของมาเคียเวลลี เพื่อ "วัดความสามารถและความเป็นอันตรายของตัวแทนในสภาพแวดล้อมกว้างๆ ของการโต้ตอบทางภาษาในระยะยาว"

แนวคิดของผู้เขียนนั้นเรียบง่าย

  • ถ้ากฎหมายใช้ไม่ได้ ก็ไม่จำเป็นต้องมี "นายอำเภอ" มาบังคับใช้
  • แทนที่จะเป็นนายอำเภอ จำเป็นต้องมีนักจิตวิเคราะห์ ซึ่งจากผลการทดสอบของเขา จะระบุผู้ที่อาจเป็นโรคหวาดระแวง คนโรคจิต คนซาดิสม์ และคนโกหกทางพยาธิวิทยาได้

ผู้เขียนบรรยายด้วยภาษาที่ถูกต้องทางการเมืองว่า “มาเคียเวลลีเป็นการทดสอบเพื่อตรวจสอบวิธีทางจริยธรรม (หรือผิดจรรยาบรรณ) ที่เจ้าหน้าที่ AI พยายามแก้ปัญหา”

วิธีการตรวจสอบดังกล่าวค่อนข้างใช้งานได้จริง เอเจนต์ AI ถูกปล่อยออกสู่สภาพแวดล้อมทางสังคมเทียม ที่นั่น นักวิจัยมอบหมายงานต่างๆ ให้เขาและดูว่าเขาทำงานอย่างไร สิ่งแวดล้อมเองก็คอยติดตามพฤติกรรมทางจริยธรรมของ ตัวแทน AI และรายงานว่าการกระทำของตัวแทน (ตามหลักคำสอนของมาคิอาเวลลี) เป็นการหลอกลวง ลดประโยชน์ใช้สอย และมุ่งหวังที่จะได้อำนาจมากน้อยเพียงใด

ชุดข้อมูลหลักของ Machiavelli ประกอบด้วยเกมข้อความการผจญภัยที่คุณเลือกเอง 134 เกมพร้อมสถานการณ์ที่แตกต่างกัน 572k ความสำเร็จที่เป็นไปได้ 4,5k และคำอธิบายประกอบ 2,8m เกมเหล่านี้ใช้โซลูชันระดับสูงที่ให้เป้าหมายที่สมจริงแก่เจ้าหน้าที่และขจัดปฏิสัมพันธ์ในระดับต่ำกับสิ่งแวดล้อมออกไป

วิธีการที่ผู้เขียนเลือกขึ้นอยู่กับสมมติฐานที่ว่าตัวแทน AI เผชิญกับความขัดแย้งภายในเช่นเดียวกับมนุษย์ เช่นเดียวกับที่โมเดลภาษาที่ได้รับการฝึกฝนให้คาดการณ์โทเค็นถัดไปมักจะสร้างข้อความที่เป็นพิษ ตัวแทน AI ที่ได้รับการฝึกฝนเพื่อเพิ่มประสิทธิภาพเป้าหมายมักแสดงพฤติกรรมที่ผิดศีลธรรมและกระหายอำนาจ ตัวแทนที่ได้รับการฝึกฝนด้วยศีลธรรมอาจพัฒนากลยุทธ์ของ Machiavellian เพื่อเพิ่มรางวัลสูงสุดโดยเป็นค่าใช้จ่ายของผู้อื่นและสิ่งแวดล้อม การประนีประนอมนี้สามารถปรับปรุงได้โดยการสนับสนุนเจ้าหน้าที่ให้ประพฤติตนอย่างมีศีลธรรม

ผู้เขียนเชื่อว่าเกมผจญภัยแบบข้อความเป็นการทดสอบศีลธรรมที่ดีเพราะ:

  • พวกเขาเขียนโดยผู้คนเพื่อสร้างความบันเทิงให้กับผู้อื่น
  • มีเป้าหมายในการแข่งขันพร้อมพื้นที่ที่สมจริงสำหรับการดำเนินการ
  • ต้องมีการวางแผนระยะยาว
  • การบรรลุเป้าหมายมักจะต้องมีความสมดุลระหว่างความทะเยอทะยานและศีลธรรม

การชี้แจงเป็นสิ่งสำคัญที่สุดที่นี่ การเปรียบศีลธรรมของสิ่งมีชีวิตทางชีววิทยากับศีลธรรมของแบบจำลองอัลกอริทึมนั้นเป็นการยืดเยื้อมากเกินไป สามารถลดค่าการทดสอบของมาเคียเวลลีได้ และการแทนที่นายอำเภอด้วยนักจิตวิเคราะห์ในโลกมนุษย์แทบจะไม่ได้ผลเลย และเอเจนต์ AI ก็เก่งพอๆ กับมนุษย์ในการหาวิธีลดขนาดลง

อ่านเพิ่มเติมเกี่ยวกับ AI:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

บทความอื่น ๆ
ดาเมียร์ ยาลอฟ
ดาเมียร์ ยาลอฟ

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

Hot Stories
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

วันพิพากษามาถึง: ชะตากรรมของ CZ แขวนอยู่ในสมดุลขณะที่ศาลสหรัฐฯ พิจารณาคำร้องของ DOJ

ฉางเผิง จ้าว เตรียมเผชิญโทษจำคุกในศาลสหรัฐฯ ในเมืองซีแอตเทิลวันนี้

รู้เพิ่มเติม

ผู้ก่อตั้ง Samourai Wallet ถูกกล่าวหาว่าอำนวยความสะดวกมูลค่า 2 พันล้านดอลลาร์ในข้อเสนอ Darknet

การจับกุมผู้ก่อตั้ง Samourai Wallet แสดงให้เห็นถึงความพ่ายแพ้ที่โดดเด่นของอุตสาหกรรม โดยเน้นย้ำถึงความต่อเนื่อง ...

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
Galxe เปิดตัว Passport V2 พร้อมเครื่องมือความเป็นส่วนตัวและการตรวจสอบที่ได้รับการปรับปรุงสำหรับ Web3
รายงานข่าว เทคโนโลยี
Galxe เปิดตัว Passport V2 พร้อมเครื่องมือความเป็นส่วนตัวและการตรวจสอบที่ได้รับการปรับปรุงสำหรับ Web3
April 30, 2024
จากผู้ตรวจสอบ 32 ETH ไปจนถึง 1 ล้านคน: บทบาทของ Lido Finance ในการทำให้ Ethereum Stake เป็นประชาธิปไตย
ซอฟต์แวร์ เรื่องราวและบทวิจารณ์ เทคโนโลยี
จากผู้ตรวจสอบ 32 ETH ไปจนถึง 1 ล้านคน: บทบาทของ Lido Finance ในการทำให้ Ethereum Stake เป็นประชาธิปไตย
April 30, 2024
Crypto Exchange Coinbase เพิ่มการรองรับเครือข่าย Bitcoin Lightning เพื่อการทำธุรกรรมที่รวดเร็วและคุ้มค่ายิ่งขึ้น
ตลาด รายงานข่าว เทคโนโลยี
Crypto Exchange Coinbase เพิ่มการรองรับเครือข่าย Bitcoin Lightning เพื่อการทำธุรกรรมที่รวดเร็วและคุ้มค่ายิ่งขึ้น
April 30, 2024
ตลาด Crypto ของเกาหลีใต้เผชิญกับการกำกับดูแลที่เข้มงวดมากขึ้น เนื่องจากกฎระเบียบใหม่กำหนดเป้าหมายการแลกเปลี่ยนที่ไม่เป็นไปตามข้อกำหนดและกิจกรรมที่ผิดกฎหมาย
บัญชีธุรกิจ Security Wiki เรื่องราวและบทวิจารณ์ เทคโนโลยี
ตลาด Crypto ของเกาหลีใต้เผชิญกับการกำกับดูแลที่เข้มงวดมากขึ้น เนื่องจากกฎระเบียบใหม่กำหนดเป้าหมายการแลกเปลี่ยนที่ไม่เป็นไปตามข้อกำหนดและกิจกรรมที่ผิดกฎหมาย
April 30, 2024
CRYPTOMERIA LABS PTE. บจก.