แดน เฮนดริกส์: การเลือกระหว่าง AI กับมนุษย์ วิวัฒนาการจะไม่เลือกเรา
ในบทสรุป
งานวิจัยของ Dan Hendrycks “การคัดเลือกโดยธรรมชาติชอบปัญญาประดิษฐ์มากกว่าผู้คน” เป็นข้อสรุปที่น่ากลัว
เขาเป็นนักวิจัยที่มีประสบการณ์และเป็นที่รู้จักซึ่งได้ตีพิมพ์เอกสารทางวิทยาศาสตร์มากมายเกี่ยวกับการประเมินความปลอดภัยของระบบ AI
การวิจัยของ Dan Hendrycks ฟังดูเหมือนโทษประหารชีวิตสำหรับ Homo Sapiens สรุปผลการศึกษา “การคัดเลือกโดยธรรมชาติเอื้อประโยชน์ให้ AI มากกว่ามนุษย์“น่ากลัวจริงๆ ข้อความนี้ไม่ได้เขียนโดยผู้มีวิสัยทัศน์ยอดนิยมอย่าง Dan Brown แต่เขียนโดย Dan Hendrycks ผู้อำนวยการ California Center for AI Security (CAIS) ซึ่งเป็นองค์กรไม่แสวงหาผลกำไรที่เชี่ยวชาญด้านการวิจัยและงานภาคสนามด้านความปลอดภัยของ AI
Dan Hendrycks ไม่ใช่คนวิกลจริตที่ตื่นตระหนกกับความก้าวหน้าของ AI เขาเป็นนักวิจัยที่มีประสบการณ์และได้รับการยอมรับอย่างกว้างขวาง ซึ่งได้เผยแพร่เอกสารทางวิทยาศาสตร์มากมายเกี่ยวกับการประเมินความปลอดภัยของระบบ AI — ทดสอบว่าพวกเขาเก่งแค่ไหนในการเข้ารหัส การใช้เหตุผล การทำความเข้าใจกฎหมาย ฯลฯ เหนือสิ่งอื่นใด เขายังเป็นผู้ร่วมประดิษฐ์ Gaussian Linear Error Units (GELU)
แจ็ค คลาร์ก ผู้ร่วมก่อตั้ง ChatGPT Anthropic คู่แข่ง ประธานร่วมของดัชนี AI ของมหาวิทยาลัยสแตนฟอร์ด ประธานร่วมของส่วน AI และการคำนวณของ OECD และสมาชิกคณะกรรมการที่ปรึกษาแห่งชาติด้าน AI ของรัฐบาลสหรัฐฯ กล่าวถึงข้อสรุปของการศึกษาของ Hendrycks “ผู้คนต้องการหลีกเลี่ยงคำพูดที่ว่ามาจากคนบ้าตาป่าเถื่อนที่อาศัยอยู่ในกระท่อมกลางป่า ฉันขอหักล้างสิ่งนี้ล่วงหน้า เมื่อผู้เชี่ยวชาญที่มีประสบการณ์ไม่เพียงแค่การวิจัยด้าน AI เท่านั้น แต่ยังรวมถึงใน การประเมินความปลอดภัยของระบบ AI เขียนบทความโต้แย้งว่าระบบ AI ในอนาคตอาจทำตัวเห็นแก่ตัวและไม่สอดคล้องกับผลประโยชน์ของผู้คน เราควรดูแลมัน!
สรุปบทความของ Hendrycks:
- หากตัวแทนเอไอมีมากขึ้น ฉลาดเกินมนุษย์สิ่งนี้อาจทำให้มนุษยชาติสูญเสียการควบคุมอนาคต
- สิ่งนี้มีโอกาสดีที่จะเกิดขึ้นไม่ได้เป็นผลจากเจตนาร้ายพิเศษของคนหรือเครื่องจักร แต่เป็นผลมาจากการบังคับใช้หลักการวิวัฒนาการของการพัฒนากับ AI ตามตรรกะของดาร์วินเท่านั้น
- เพื่อลดความเสี่ยงนี้ แรงจูงใจภายในของตัวแทน AI จำเป็นต้องได้รับการออกแบบอย่างรอบคอบ ข้อจำกัดในการกระทำของพวกเขา และสถาบันที่สร้างขึ้นเพื่อส่งเสริมการทำงานร่วมกันของ AI
นั่นคือประเด็นที่สำคัญที่สุดที่ Hendrycks เขียนไว้ในเอกสารทางวิทยาศาสตร์ 43 หน้าของเขา:
1. เรากลัวการมาถึงของ Terminator แต่รากฐานของความกลัวเหล่านี้ผิด มีข้อผิดพลาดสองประการ:
ก. การแปรสภาพเป็นมนุษย์ของ AI โดยระบุถึงแรงจูงใจของเรา เป็นต้น—เช่น ChatGPT แสดงให้เห็นว่า AI เป็นความคิดที่แตกต่างโดยพื้นฐาน พร้อมผลที่ตามมาทั้งหมด
ข. แนวคิดที่ว่า AI เป็นองค์ประกอบเดียว: ฉลาดหรือไม่ฉลาดมาก ใจดีหรือไม่ใจดี แต่ในความเป็นจริง หน่วยงาน AI ที่แตกต่างกันมากเหล่านี้จะอยู่ในโลกมากที่สุดเท่าที่จะเป็นไปได้ในไม่ช้า
2. มีข้อบกพร่องพื้นฐานอีกประการหนึ่งในความคิดของเราเกี่ยวกับอนาคตของ AI เราลืมเกี่ยวกับกลไกการพัฒนาที่สำคัญที่สุด นั่นคือวิวัฒนาการ ซึ่งขับเคลื่อนการพัฒนาไม่เพียงแต่สารชีวภาพเท่านั้น แต่ยังรวมถึงแนวคิดและความหมาย เครื่องมือที่เป็นวัสดุ และสถาบันที่ไม่ใช่วัตถุด้วย
3. สภาพแวดล้อมได้เริ่มเป็นรูปเป็นร่างบนโลกแล้ว ซึ่ง AI จำนวนมากจะพัฒนาและวิวัฒนาการ วิวัฒนาการนี้จะเป็นไปตามตรรกะของดาร์วิน ผ่านการแข่งขัน AI กันเอง โดยคำนึงถึงผลประโยชน์ของสถาบัน "แม่" ของพวกเขา เช่น บริษัท กองทัพ ฯลฯ
4. ตรรกะของวิวัฒนาการการแข่งขันจะนำไปสู่เช่นเดียวกับในมนุษย์: ตัวแทน AI ที่ชาญฉลาดมากขึ้นเรื่อย ๆ จะเห็นแก่ตัวมากขึ้นเรื่อย ๆ และพร้อมที่จะบรรลุเป้าหมายด้วยการหลอกลวงและการบังคับ เป้าหมายหลักคืออำนาจ
5. การคัดเลือกโดยธรรมชาติของตัวแทน AI มักจะชอบเผ่าพันธุ์ที่เห็นแก่ตัวมากกว่าพวกที่เห็นแก่ผู้อื่นมากกว่า เจ้าหน้าที่เอไอจะทำตัวเห็นแก่ตัวและแสวงหาผลประโยชน์ของตนเองโดยไม่สนใจมนุษย์ ซึ่งอาจนำไปสู่ความเสี่ยงหายนะต่อมนุษยชาติ
- การยื่นคำร้อง เพื่อหยุดการพัฒนาระบบ AI ที่ก้าวหน้ากว่า GPT-4 มีการแบ่งแยกสังคม กลุ่มแรกเชื่อว่าความก้าวหน้าไม่สามารถหยุดได้ ในขณะที่อีกกลุ่มเชื่อว่าความก้าวหน้า และบางครั้งควรถูกหยุด กลุ่มที่สามไม่เข้าใจวิธีการ GPT-4 ดำเนินการเป็นอันดับแรก รายละเอียดที่สำคัญที่สุดในข้อความนี้คือ AI ไม่มีจิตสำนึก ความตั้งใจ หรือสิทธิ์เสรี และอาจเลวร้ายได้แม้จะไม่มีผู้ที่เป็นอันตรายก็ตาม
- เจฟฟรีย์ ฮินตันมักถูกเรียกว่า "เจ้าพ่อแห่ง AI" และถือเป็นผู้นำในชุมชนการเรียนรู้เชิงลึก บทสัมภาษณ์ 40 นาทีของเขา ChatGPT มีลักษณะเฉพาะที่เข้าใจง่ายและมีความเข้าใจเชิงลึกที่ผู้อื่นไม่กี่คนเข้าถึงได้ เขาเน้นย้ำถึงความสำคัญของ "การปฏิวัติทางปัญญา" ที่กำลังดำเนินอยู่และสติปัญญาที่ไร้มนุษยธรรมของ ChatGPTซึ่งใช้ตัวแทนอัจฉริยะเทียมที่มีความสามารถในการสื่อสารดิจิทัลขั้นสูง
อ่านบทความที่เกี่ยวข้องเพิ่มเติม:
ข้อจำกัดความรับผิดชอบ
สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า
เกี่ยวกับผู้เขียน
Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต
บทความอื่น ๆDamir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต