รายงานข่าว เทคโนโลยี
March 15, 2023

Facebook พัฒนาวิธีการใหม่ในการเพิ่มประสิทธิภาพ AI Transformers เป็นสองเท่า

ในบทสรุป

Facebook ได้พัฒนาวิธีการใหม่เพื่อเพิ่มประสิทธิภาพสองเท่าของหม้อแปลง AI ตามสถาปัตยกรรมของหม้อแปลง

วิธีการใหม่จะค้นหาแพตช์ที่คล้ายกันมากที่สุดในช่องว่างระหว่างการประมวลผลบล็อกต่างๆ และรวมเข้าด้วยกันเพื่อลดความซับซ้อนในการคำนวณ

Facebook ได้พัฒนา วิธีการใหม่ เพื่อเพิ่มประสิทธิภาพเป็นสองเท่าของหม้อแปลง AI วิธีการคือ ตามสถาปัตยกรรมของหม้อแปลงไฟฟ้า และได้รับการออกแบบมาโดยเฉพาะสำหรับข้อความที่มีรูปแบบยาว เช่น หนังสือ บทความ และบล็อก เป้าหมายของหม้อแปลง AI ใหม่คือการปรับปรุงประสิทธิภาพของ โมเดลที่ใช้หม้อแปลงไฟฟ้า บนข้อความที่มีรูปแบบยาวโดยทำให้มีประสิทธิภาพและประสิทธิผลมากขึ้นในการจัดการลำดับที่ยาว ผลลัพธ์ของหม้อแปลง AI มีแนวโน้มดีมาก และวิธีการใหม่นี้มีโอกาสที่จะช่วยปรับปรุงประสิทธิภาพของโมเดลที่ใช้หม้อแปลงในงานต่างๆ

วิธีการใหม่นี้คาดว่าจะมีผลกระทบอย่างมากต่องานประมวลผลภาษาธรรมชาติ เช่น การแปลภาษา การสรุป และระบบคำถาม-คำตอบ นอกจากนี้ยังคาดว่าจะนำไปสู่การพัฒนาโมเดล AI ที่ซับซ้อนยิ่งขึ้น ซึ่งสามารถจัดการข้อความที่ยาวและซับซ้อนมากขึ้นได้

Facebook พัฒนาวิธีการใหม่เพื่อเพิ่มประสิทธิภาพสองเท่าของ AI Transformers
อ่านเพิ่มเติม: 10+ โปรแกรมแก้ไขภาพ AI ที่ดีที่สุด 2023: ออนไลน์และฟรี

ในการประมวลผลภาพ ทรานสฟอร์มเมอร์สมัยใหม่จะตัดมันออกเป็นแผ่นๆ (โดยปกติจะเป็นสี่เหลี่ยม: ดู gif ด้านล่าง) แล้วดำเนินการแทนอนุภาคเหล่านี้ ซึ่งแต่ละอนุภาคจะแสดงด้วย "โทเค็น" อย่างที่เราทราบ Transformers ทำงานช้าลงเมื่อมีชิ้นส่วนโทเค็นเหล่านี้มากขึ้น (ใช้กับทั้งข้อความและรูปภาพ) และ Transformer ที่พบมากที่สุดมีความสัมพันธ์แบบกำลังสอง นั่นคือ เมื่อมีการเพิ่มโทเค็นมากขึ้น การประมวลผลก็จะยิ่งช้าลง เพื่อแก้ไขปัญหานี้ นักวิจัยได้เสนอเทคนิคต่างๆ เพื่อลดจำนวนโทเค็นที่จำเป็นสำหรับการประมวลผลภาพ เช่น การรวมลำดับชั้นและแบบปรับตัว วิธีการเหล่านี้มีจุดมุ่งหมายเพื่อรักษาคุณภาพของผลลัพธ์ในขณะที่ลดต้นทุนการคำนวณให้น้อยที่สุด

วิธีการใหม่จะค้นหาแพตช์ที่คล้ายกันมากที่สุดในช่องว่างระหว่างการประมวลผลบล็อกต่างๆ และรวมเข้าด้วยกันเพื่อลดความซับซ้อนในการคำนวณ ส่วนแบ่งของโทเค็นที่ผสานเป็นไฮเปอร์พารามิเตอร์ ยิ่งสูงคุณภาพยิ่งต่ำแต่อัตราเร่งก็จะยิ่งสูงตามไปด้วย การทดลองแสดงให้เห็นว่าเป็นไปได้ที่จะรวมโทเค็นประมาณ 40% ด้วยการสูญเสียคุณภาพ 0.1-0.4% และได้รับการเร่งความเร็วเป็นสองเท่า (ซึ่งใช้หน่วยความจำน้อยลง) วิธีการใหม่นี้เป็นโซลูชันที่มีแนวโน้มดีในการลดความซับซ้อนในการคำนวณของการประมวลผลภาพ และช่วยให้สามารถประมวลผลได้เร็วขึ้นและมีประสิทธิภาพมากขึ้นโดยไม่ลดทอนคุณภาพของผลลัพธ์สุดท้าย

เมื่อเรานึกภาพแพตช์ที่เราผสาน เราจะเห็นว่าพวกมัน 1) อยู่ใกล้กัน และ 2) อธิบายวัตถุเดียวกัน (ดูพื้นที่ที่มีสีเดียวกันบน GIF) นั่นคือไม่มีข้อมูลสำคัญสูญหาย วัตถุยังคงอยู่ "ในมุมมอง" ของแบบจำลอง ยิ่งนำไปใช้กับหม้อแปลงในภายหลัง โทเค็นยิ่งถูกผสาน (เนื่องจากสิ่งเหล่านี้เป็นตัวแทนระดับสูงที่อธิบายเนื้อหาของภาพได้ดี)

วิธีการทางวิศวกรรมดังกล่าวขึ้นอยู่กับความเฉลียวฉลาดและการเข้าใจว่างานบางอย่างดูน่าสนใจมาก นอกจากนี้ นักพัฒนาของ Meta สัญญาว่าจะนำ StableDiffusion มาให้มากขึ้นเพื่อเร่งความเร็วให้เร็วขึ้นเช่นกัน เป็นเรื่องที่ยอดเยี่ยม เนื่องจากทรานส์ฟอร์มเมอร์มีอยู่ทุกที่ ทริคดังกล่าวสามารถนำไปใช้ได้อย่างรวดเร็วในหลากหลายรุ่น สิ่งนี้แสดงให้เห็นถึงศักยภาพของโซลูชันทางวิศวกรรมที่จะส่งผลกระทบในวงกว้างในอุตสาหกรรมต่างๆ มันน่าสนใจที่จะดูว่าความก้าวหน้าเหล่านี้เป็นอย่างไร รุ่นหม้อแปลง จะยังคงพัฒนาและปรับปรุงอยู่ตลอดเวลา

  • Meta AI และ Paperswithcode ได้เปิดตัว Galactica รุ่น 120B รุ่นแรกที่ได้รับการฝึกฝนตามตำราทางวิทยาศาสตร์ ทำให้สามารถคาดการณ์ได้แม่นยำและรวดเร็วยิ่งขึ้น เป้าหมายของ Galactica คือการช่วยนักวิจัยแยกสิ่งที่สำคัญออกจากสิ่งที่ไม่เกี่ยวข้อง

อ่านข่าวที่เกี่ยวข้องเพิ่มเติม:

คีย์เวิร์ด:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

บทความอื่น ๆ
ดาเมียร์ ยาลอฟ
ดาเมียร์ ยาลอฟ

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

Hot Stories
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

ความอยากอาหารของสถาบันเติบโตขึ้นสู่ Bitcoin ETFs ท่ามกลางความผันผวน

การเปิดเผยผ่านการยื่นเอกสาร 13F เผยให้เห็นนักลงทุนสถาบันที่มีชื่อเสียงกำลังเล่น Bitcoin ETFs ซึ่งตอกย้ำถึงการยอมรับที่เพิ่มขึ้นของ ...

รู้เพิ่มเติม

วันพิพากษามาถึง: ชะตากรรมของ CZ แขวนอยู่ในสมดุลขณะที่ศาลสหรัฐฯ พิจารณาคำร้องของ DOJ

ฉางเผิง จ้าว เตรียมเผชิญโทษจำคุกในศาลสหรัฐฯ ในเมืองซีแอตเทิลวันนี้

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
Injective ผนึกกำลัง AltLayer เพื่อนำการรักษาความปลอดภัยกลับมาสู่ inEVM
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
Injective ผนึกกำลัง AltLayer เพื่อนำการรักษาความปลอดภัยกลับมาสู่ inEVM
May 3, 2024
Masa ร่วมมือกับ Teller เพื่อแนะนำกลุ่มการให้ยืมของ MASA ซึ่งช่วยให้สามารถกู้ยืม USDC บนฐานได้
ตลาด รายงานข่าว เทคโนโลยี
Masa ร่วมมือกับ Teller เพื่อแนะนำกลุ่มการให้ยืมของ MASA ซึ่งช่วยให้สามารถกู้ยืม USDC บนฐานได้
May 3, 2024
Velodrome เปิดตัวเวอร์ชัน Superchain Beta ในอีกไม่กี่สัปดาห์ข้างหน้าและขยายข้ามบล็อคเชน OP Stack Layer 2
ตลาด รายงานข่าว เทคโนโลยี
Velodrome เปิดตัวเวอร์ชัน Superchain Beta ในอีกไม่กี่สัปดาห์ข้างหน้าและขยายข้ามบล็อคเชน OP Stack Layer 2
May 3, 2024
CARV ประกาศความร่วมมือกับ Aethir เพื่อกระจายอำนาจชั้นข้อมูลและแจกจ่ายรางวัล
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
CARV ประกาศความร่วมมือกับ Aethir เพื่อกระจายอำนาจชั้นข้อมูลและแจกจ่ายรางวัล
May 3, 2024
CRYPTOMERIA LABS PTE. บจก.