รายงานข่าว เทคโนโลยี
May 31, 2023

Guanaco กลายเป็นโอเพ่นซอร์สที่มีศักยภาพ ChatGPT คู่แข่ง

ในบทสรุป

Guanaco แชทบอทแบบโอเพ่นซอร์สที่พัฒนาโดยนักวิจัยของมหาวิทยาลัยวอชิงตัน มีเป้าหมายที่จะแข่งขันด้วย ChatGPT ในขณะที่ใช้เวลาและเงินน้อยลงในการฝึกอบรม

อย่างไรก็ตาม การศึกษาใหม่ได้ตั้งคำถามถึงประสิทธิภาพของแบบจำลองเช่น Alpaca

นักวิจัยจากมหาวิทยาลัยวอชิงตันได้เปิดเผย guanacoแชทบอทแบบโอเพ่นซอร์สที่มีจุดมุ่งหมายเพื่อแข่งขันกับประสิทธิภาพของ ChatGPT พร้อมทั้งลดเวลาและทรัพยากรที่จำเป็นสำหรับการฝึกอบรมลงอย่างมาก ตั้งชื่อตามญาติชาวอเมริกาใต้ของ llamas, Guanaco ถูกสร้างขึ้นบน LLaMA แบบจำลองภาษาและรวมเอาวิธีการปรับแต่งใหม่ที่เรียกว่า QLoRA

Guanaco กลายเป็นโอเพ่นซอร์สที่มีศักยภาพ ChatGPT คู่แข่ง
Metaverse Post (mpost.io)

ผู้สร้าง Guanaco อ้างว่ามีประสิทธิภาพเทียบเท่ากับ ChatGPT แต่สามารถฝึกได้ภายในวันเดียว ความสำเร็จที่โดดเด่นนี้เกิดขึ้นได้ด้วย QLoRA ซึ่งเป็นเทคนิคการปรับแต่งโมเดลภาษาที่ช่วยลดจำนวนหน่วยความจำ GPU ที่จำเป็นสำหรับการฝึกอบรมลงอย่างมาก ในขณะที่ ChatGPT ต้องการหน่วยความจำ GPU ขนาดมหึมา 780 GB สำหรับรุ่นที่มีพารามิเตอร์ 65 พันล้านพารามิเตอร์ รุ่นที่ง่ายที่สุดของ Guanaco ต้องการเพียง 5 GB

ด้วยการเพิ่มประสิทธิภาพที่น่าประทับใจ Guanaco และโมเดลโอเพ่นซอร์สที่คล้ายคลึงกันกำลังท้าทายความคิดที่ว่าการฝึกอบรมราคาแพงเป็นสิ่งจำเป็น โมเดลภาษาที่ล้ำสมัย. การเกิดขึ้นของ Guanaco, สัตว์ขนยาวในอเมริกาคล้ายแกะและ รุ่นอื่น ๆ รถไฟที่มีค่าใช้จ่ายเพียงเล็กน้อยทำให้เกิดการคาดเดาเกี่ยวกับอนาคตของโมเดลที่มีราคาแพงเช่น GPT.

อย่างไรก็ตาม ไม่ใช่ทุกคนที่เห็นด้วยกับมุมมองในแง่ดีของโมเดลโอเพ่นซอร์ส การศึกษาล่าสุดที่จัดทำโดยมหาวิทยาลัยแห่งแคลิฟอร์เนีย ได้ตั้งข้อสงสัย ถึงความสามารถของโมเดลอย่างอัลปาก้า และตั้งคำถามเกี่ยวกับศักยภาพที่แท้จริงของพวกมัน ในขั้นต้น นักวิจัยได้ข้อสรุปที่คล้ายกันกับผู้สร้าง Guanaco: เมื่อได้รับการฝึกอบรมอย่างเหมาะสม โมเดลโอเพ่นซอร์สก็สามารถแข่งขันได้ GPT ในความสามารถ การทดสอบเพิ่มเติมเผยให้เห็นข้อจำกัดที่สำคัญ โมเดล "ดอลลี่" เหล่านี้บางครั้งเรียกว่าเก่งในการเลียนแบบวิธีแก้ปัญหาที่พวกเขาพบระหว่างการฝึกอบรม อย่างไรก็ตาม พวกเขาพยายามดิ้นรนเพื่อให้ทำงานได้ดีในงานที่พวกเขาไม่ได้ถูกเปิดเผยอย่างชัดเจน โดยตามหลังโมเดลขั้นสูงกว่า

การเปิดเผยนี้ชี้ให้เห็นว่า ทุ่มงบฝึกอบรมเป็นล้าน GPT และรุ่นที่คล้ายกันอาจไม่ไร้ประโยชน์ แม้ว่า Guanaco และผลิตภัณฑ์อื่นๆ จะแสดงผลลัพธ์ที่น่าพึงพอใจ แต่ก็ยังมีบางพื้นที่ที่โมเดลที่ซับซ้อนกว่านั้นเหนือกว่า เป็นที่น่าสังเกตว่า การวิจัยที่จัดทำโดยมหาวิทยาลัยแห่งแคลิฟอร์เนีย ท้าทายแนวคิดที่มีอยู่ทั่วไปที่ว่าโมเดลโอเพ่นซอร์สสามารถแทนที่โมเดลราคาแพงได้อย่างสมบูรณ์ GPT.

เมื่อสาขาการประมวลผลภาษาธรรมชาติพัฒนาขึ้น มันน่าสนใจที่จะดูว่า Guanaco และโมเดลโอเพ่นซอร์สอื่นๆ เกณฑ์มาตรฐานเช่น ChatGPT. อัตราที่สูงของนวัตกรรมและการวิจัยอย่างต่อเนื่องจะส่งผลกระทบต่ออนาคตของโมเดลภาษาและเป็นตัวกำหนดว่าโมเดลใดจะกลายเป็นตัวเลือกหลักสำหรับแอปพลิเคชันเฉพาะ

  • Dolly 2.0 ซึ่งเป็น 12B Chat-LLM แบบโอเพ่นซอร์สตัวแรกที่วางจำหน่ายในเชิงพาณิชย์ ได้รับการประกาศ โดย Databricks นี่เป็นความก้าวหน้าครั้งสำคัญสำหรับอุตสาหกรรมแมชชีนเลิร์นนิง ช่วยให้ธุรกิจสามารถสร้างโมเดลภาษาที่มีประสิทธิภาพโดยไม่ต้องลงทุนในคลัสเตอร์ GPU ที่มีราคาแพง Databricks ให้พนักงาน 5,000 คนสร้างโมเดลภาษาโอเพ่นซอร์ส ซึ่งรวมถึงโมเดลภาษา Pythia-12B ของ EleutherAI ภายใต้ใบอนุญาต MIT Dolly 2.0 รวมถึงรหัสที่เกี่ยวข้องมีให้ใช้งานภายใต้ใบอนุญาต MIT Dolly 2.0 มีศักยภาพในการเปลี่ยนแปลงอุตสาหกรรมและเป็นก้าวสำคัญของแมชชีนเลิร์นนิง

อ่านเพิ่มเติมเกี่ยวกับ AI:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

บทความอื่น ๆ
ดาเมียร์ ยาลอฟ
ดาเมียร์ ยาลอฟ

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

Hot Stories

Inside Wall Street Memes (WSM): เปิดตัวหัวข้อข่าว

by วิคทอเรีย ปาลชิค
May 07, 2024

ค้นพบ Crypto Whales: ใครเป็นใครในตลาด

by วิคทอเรีย ปาลชิค
May 07, 2024
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

ความอยากอาหารของสถาบันเติบโตขึ้นสู่ Bitcoin ETFs ท่ามกลางความผันผวน

การเปิดเผยผ่านการยื่นเอกสาร 13F เผยให้เห็นนักลงทุนสถาบันที่มีชื่อเสียงกำลังเล่น Bitcoin ETFs ซึ่งตอกย้ำถึงการยอมรับที่เพิ่มขึ้นของ ...

รู้เพิ่มเติม

วันพิพากษามาถึง: ชะตากรรมของ CZ แขวนอยู่ในสมดุลขณะที่ศาลสหรัฐฯ พิจารณาคำร้องของ DOJ

ฉางเผิง จ้าว เตรียมเผชิญโทษจำคุกในศาลสหรัฐฯ ในเมืองซีแอตเทิลวันนี้

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
Inside Wall Street Memes (WSM): เปิดตัวหัวข้อข่าว
บัญชีธุรกิจ ตลาด เรื่องราวและบทวิจารณ์ เทคโนโลยี
Inside Wall Street Memes (WSM): เปิดตัวหัวข้อข่าว
May 7, 2024
ค้นพบ Crypto Whales: ใครเป็นใครในตลาด
บัญชีธุรกิจ ตลาด เรื่องราวและบทวิจารณ์ เทคโนโลยี
ค้นพบ Crypto Whales: ใครเป็นใครในตลาด
May 7, 2024
Orbiter Finance ร่วมมือกับเครือข่าย Bitcoin Layer 2 Zulu และใช้งานบน Lwazi Testnet
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
Orbiter Finance ร่วมมือกับเครือข่าย Bitcoin Layer 2 Zulu และใช้งานบน Lwazi Testnet 
May 7, 2024
Crypto Exchange Bybit รวม USDe ของ Ethena Labs เป็นสินทรัพย์หลักประกัน เปิดใช้งานคู่การซื้อขาย BTC-USDe และ ETH-USDe
ตลาด รายงานข่าว เทคโนโลยี
Crypto Exchange Bybit รวม USDe ของ Ethena Labs เป็นสินทรัพย์หลักประกัน เปิดใช้งานคู่การซื้อขาย BTC-USDe และ ETH-USDe
May 7, 2024
CRYPTOMERIA LABS PTE. บจก.