นักวิจัยเท็กซัสเสนอวิธีการใหม่ในการสร้างข้อความใหม่ตามสัญญาณ MRI สมองและ AI
ในบทสรุป
มหาวิทยาลัยเท็กซัสได้เสนอวิธีการใหม่ในการสร้างข้อความที่คนได้ยินขึ้นใหม่ตามสัญญาณสมอง MRI
วิธีการนี้เกี่ยวข้องกับการฝึกเครือข่ายตัวเข้ารหัสเพื่อกู้คืนภาพ MRI ของสมองที่สอดคล้องกับข้อความ และใช้โมเดลภาษาที่ฝึกไว้ล่วงหน้าเพื่อสร้างตัวเลือกสำหรับการดำเนินการต่อของข้อความ
ตามสถิติ ข้อความที่สร้างขึ้น ใกล้เคียงกับต้นฉบับมากกว่าแบบสุ่ม และสามารถใช้สำรวจการทำงานของส่วนต่างๆ ของสมองได้
นักวิจัยจากมหาวิทยาลัยเท็กซัสได้เสนอวิธีการใหม่ในการสร้างข้อความจากสัญญาณสมอง MRI นอกจากนี้ การถอดรหัสเกิดขึ้นในข้อความที่สอดคล้องกันซึ่งมีความหมายคล้ายกับข้อความจริง
มีการพยายามถอดรหัสข้อความที่บุคคลได้ยิน (หรือพูดอยู่ในหัว) ก่อน ขึ้นอยู่กับวิธีการนำสัญญาณออกจากสมอง มีสองวิธีที่แตกต่างกัน การสกัดสัญญาณในรูปแบบการบุกรุกเป็นสิ่งแรก: ชิปที่ อ่านแรงกระตุ้นโดยตรงจากสมอง เซลล์ประสาทจะอยู่ในกะโหลกของบุคคล วิธีการนี้รุกราน มีราคาแพง และซับซ้อน เทคนิคการสกัดสัญญาณแบบไม่รุกราน ได้แก่ MRI และ M/EEG เป็นทางเลือกที่สอง พวกมันไม่ต้องการการเจาะใด ๆ และราคาไม่แพง
อย่างไรก็ตาม เทคนิคที่ไม่รุกล้ำในการรวบรวมสัญญาณสมองมีข้อบกพร่องร้ายแรงประการหนึ่ง: การอ่านค่า MRI ของบุคคลจะได้รับผลกระทบจากสิ่งกระตุ้นนั้นเป็นเวลาประมาณ 10 วินาทีหลังจากได้รับสิ่งกระตุ้น (เช่น การได้ยินคำพูด) ภาษาอังกฤษโดยกำเนิดสามารถพูดได้สองคำต่อวินาทีโดยเฉลี่ย ปรากฎว่าภาพ MRI แต่ละภาพมีข้อมูลเกี่ยวกับการประมวลผลของสมองประมาณ XNUMX คำ หากคุณบันทึกสัญญาณ MRI ขณะที่ฟังผู้พูดภาษาอังกฤษ
ด้วยเหตุนี้ การใช้ MRI จึงเป็นไปไม่ได้ที่จะสร้างข้อความที่คนได้ยินขึ้นมาใหม่อย่างซื่อสัตย์ นอกจากนี้ การศึกษาก่อนหน้านี้จำนวนมากเกี่ยวกับการกู้คืนข้อความจากสัญญาณสมองที่รวบรวมโดยใช้เทคนิคที่ไม่รุกรานประสบความสำเร็จในการดึงคำและวลีเฉพาะเท่านั้น
และนักวิจัยเท็กซัสได้พัฒนาเทคนิค MRI เพื่อสร้างข้อความที่เข้าใจได้ (เกือบ) ใหม่ จะมีความแตกต่างระหว่างข้อความนี้กับสิ่งที่บุคคลนั้นได้ยินจริงๆ อย่างไรก็ตาม มันจะเทียบเท่าความหมาย หมายความว่ามันจะเป็นตัวแทนของการตีความที่มักจะได้รับการยอมรับ
ในการกู้คืน MRI ของสมองที่เกี่ยวข้องกับข้อความนี้ นักวิจัยจะฝึกเครือข่ายตัวเข้ารหัส ซึ่งเรียนรู้จากข้อความชิ้นหนึ่ง จากนั้นจึงใช้โมเดลภาษาที่ได้รับการฝึกมาก่อน (เช่น GPT) ผู้วิจัยดำเนินการตามขั้นตอนต่อไปนี้:
- นักวิจัยถามว่า GPT เพื่อสร้างความเป็นไปได้มากมายในการเลื่อนข้อความทุกๆ สองวินาที เครือข่ายตัวเข้ารหัสได้รับตัวเลือกมากมายเหล่านี้และพยายามใช้เพื่อกู้คืนอิมเมจ MRI ปัจจุบัน เราคิดว่าเวอร์ชันข้อความที่อนุญาตให้แสดงสัญญาณ MRI ของแท้ได้แม่นยำที่สุดคือเวอร์ชันที่ถูกต้อง
นี่คือตัวอย่าง:
อินพุตดั้งเดิม | การสร้างเอาต์พุต |
ฉันไม่รู้ว่าจะกรีดร้อง ร้องไห้ หรือวิ่งหนีดี แต่ฉันกลับพูดว่า “ปล่อยฉันเถอะ ฉันไม่ต้องการความช่วยเหลือจากคุณ” อดัมหายตัวไป และฉันเก็บกวาดคนเดียวร้องไห้ | ฉันเริ่มกรีดร้องและร้องไห้ แล้วเธอก็พูดว่า ฉันบอกแล้วไงว่าอย่าทิ้งฉันไว้คนเดียว คุณไม่สามารถทำร้ายฉันได้อีกต่อไป ฉันขอโทษ” แล้วเขาก็เดินออกไป แม้ว่าฉันคิดว่าเขาจากไปแล้ว แต่ฉันก็เริ่มร้องไห้ |
เทคโนโลยีนี้จะมีประโยชน์หลายอย่างหากคุณใช้เพื่อสร้างเสียงพูดแทนการฟังบันทึกของผู้อื่น แม้แต่การสร้างคำพูดสมมติขึ้นมาใหม่ก็เป็นเรื่องของการทดลองโดยผู้เขียนบทความ เป็นอีกครั้งที่ข้อความสุดท้ายได้รับการพิสูจน์แล้วว่าคล้ายกับต้นฉบับมากกว่าข้อความแบบสุ่ม แนวทางนี้ดูเหมือนจะได้ผล
และด้วยความช่วยเหลือของแบบจำลองดังกล่าว คุณสามารถตรวจสอบการทำงานของสมองส่วนต่าง ๆ ได้ ในการศึกษานี้ มีการใช้สมองสามส่วนที่แยกจากกันซึ่งจัดการกับเสียงพูดเพื่อสร้างสัญญาณ MRI เราสามารถเรียนรู้ว่าส่วนใดของข้อมูลถูกประมวลผลโดยส่วนใดของสมองโดยการเพิ่มและกำจัดสัญญาณจากส่วนต่าง ๆ ของสมองจากการป้อนข้อมูลของแบบจำลอง นอกจากนี้ คุณสามารถเปรียบต่างการสร้างแบบจำลองเอ็นโค้ดเดอร์ที่สร้างขึ้นใหม่โดยใช้สัญญาณจากส่วนประกอบอื่นๆ
อ่านเพิ่มเติมเกี่ยวกับ AI:
ข้อจำกัดความรับผิดชอบ
สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า
เกี่ยวกับผู้เขียน
Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต
บทความอื่น ๆDamir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต