뉴스 보도 Technology
2023 년 5 월 31 일

Guanaco, 잠재적인 오픈 소스로 부상 ChatGPT 경쟁자

요컨대

워싱턴 대학 연구원들이 개발한 오픈 소스 챗봇인 Guanaco는 ChatGPT 교육에 소요되는 시간과 비용이 적습니다.

그러나 새로운 연구에서는 Alpaca와 같은 모델의 효능에 의문을 제기했습니다.

워싱턴 대학 연구진이 발표한 구아 나코, 성능 경쟁을 목표로하는 오픈 소스 챗봇 ChatGPT 교육에 필요한 시간과 자원을 크게 줄입니다. 남미 친척의 이름을 따서 명명되었습니다. llamas, Guanaco는 LLaMA 언어 모델을 사용하고 QLoRA라는 새로운 미세 조정 방법을 통합합니다.

Guanaco, 잠재적인 오픈 소스로 부상 ChatGPT 경쟁자
Metaverse Post (mpost.io)

Guanaco의 제작자는 Guanaco가 비슷한 성능을 달성한다고 주장합니다. ChatGPT 그러나 단 하루 만에 교육을 받을 수 있습니다. 이 놀라운 성과는 훈련에 필요한 GPU 메모리의 양을 크게 줄이는 언어 모델 미세 조정 기술인 QLoRA 덕분에 가능했습니다. 하는 동안 ChatGPT 무려 780GB의 GPU 메모리가 필요합니다. 65억 개의 매개변수가 있는 모델의 경우 Guanaco의 가장 간단한 버전은 5GB만 필요합니다.

이러한 인상적인 효율성 향상으로 Guanaco 및 유사한 오픈 소스 모델은 비용이 많이 드는 교육이 필요하다는 개념에 도전하고 있습니다. 최신 언어 모델. 과나코의 등장, 알파카다른 모델 비용의 일부만으로 훈련하는 것은 다음과 같은 값비싼 모델의 미래에 대한 추측으로 이어졌습니다. GPT.

그러나 모든 사람이 오픈 소스 모델에 대한 이러한 낙관적인 견해에 동의하는 것은 아닙니다. 캘리포니아 대학에서 최근에 실시한 연구 의심을 던졌다 알파카와 같은 모델의 능력에 대해 이야기하고 그들의 진정한 잠재력에 대한 의문을 제기했습니다. 처음에 연구원들은 Guanaco 창시자와 유사한 결론에 도달했습니다. 즉, 적절하게 훈련되면 오픈 소스 모델이 경쟁할 수 있다는 것입니다. GPT 능력에. 추가 테스트에서는 상당한 한계가 드러났습니다. 때때로 "돌리"라고 불리는 이러한 모델은 훈련 중에 직면한 문제에 대한 해결책을 모방하는 데 능숙합니다. 그러나 명시적으로 노출되지 않은 작업을 잘 수행하는 데 어려움을 겪으며 고급 모델보다 뒤처집니다.

이 계시는 훈련에 수백만 달러 투자 GPT 유사한 모델이 헛되지 않았을 수 있습니다. Guanaco와 그 대응 제품이 유망한 결과를 보여주지만 더 정교한 모델이 뛰어난 영역이 여전히 있습니다. 주목할 가치가 있는 것은 캘리포니아 대학에서 수행한 연구 오픈 소스 모델이 다음과 같은 값비싼 모델을 완전히 대체할 수 있다는 통념에 도전합니다. GPT.

자연어 처리 분야가 발전함에 따라 Guanaco 및 기타 오픈 소스 모델이 기존 모델에 비해 얼마나 공정한지 지켜보는 것은 흥미로울 것입니다. 다음과 같은 벤치마크 ChatGPT. 높은 수준의 혁신과 지속적인 연구는 의심할 여지 없이 언어 모델의 미래에 영향을 미치고 특정 응용 프로그램에 어떤 모델이 적합한지 결정할 것입니다.

  • 최초의 상용 오픈 소스 2.0B Chat-LLM인 Dolly 12, 발표되었다 데이터브릭스. 이것은 기업이 값비싼 GPU 클러스터에 투자하지 않고도 효과적인 언어 모델을 생성할 수 있도록 하는 기계 학습 산업의 중요한 발전입니다. Databricks는 MIT 라이선스에 따라 EleutherAI의 Pythia-5,000B 언어 모델을 포함하는 오픈 소스 언어 모델을 만들기 위해 12명의 직원을 참여시켰습니다. Dolly 2.0과 관련 코드는 MIT 라이선스에 따라 사용할 수 있습니다. Dolly 2.0은 업계를 변화시킬 잠재력이 있으며 기계 학습을 위한 중요한 단계입니다.

AI에 대해 자세히 알아보기:

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories

Inside Wall Street Memes(WSM): 헤드라인 공개

by 빅토리아 팔치크
2024 년 5 월 07 일
뉴스레터에 가입하세요.
최신 뉴스

변동성 속에서 비트코인 ​​ETF를 향한 기관의 선호도 증가

13F 서류를 통한 공개를 통해 주목할만한 기관 투자자들이 비트코인 ​​ETF에 손을 대고 있음이 드러났으며, 이는 비트코인 ​​ETF에 대한 수용이 증가하고 있음을 강조합니다.

현장 사진

선고일이 다가왔습니다: 미국 법원이 DOJ의 주장을 고려함에 따라 CZ의 운명이 균형을 이루고 있습니다.

자오창펑(Changpeng Zhao)은 오늘 시애틀의 미국 법원에서 선고를 받을 예정이다.

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
Inside Wall Street Memes(WSM): 헤드라인 공개
근무지에서 발생 시장 이야기와 리뷰 Technology
Inside Wall Street Memes(WSM): 헤드라인 공개
2024 년 5 월 7 일
암호화폐 고래를 발견하세요: 시장에 있는 사람은 누구인가요?
근무지에서 발생 시장 이야기와 리뷰 Technology
암호화폐 고래를 발견하세요: 시장에 있는 사람은 누구인가요?
2024 년 5 월 7 일
Orbiter Finance는 비트코인 ​​레이어 2 Zulu 네트워크와 파트너십을 맺고 Is Lwazi 테스트넷에 배포합니다.
근무지에서 발생 뉴스 보도 Technology
Orbiter Finance는 비트코인 ​​레이어 2 Zulu 네트워크와 파트너십을 맺고 Is Lwazi 테스트넷에 배포합니다. 
2024 년 5 월 7 일
암호화폐 거래소 Bybit는 Ethena Labs의 USDe를 담보 자산으로 통합하여 BTC-USDe 및 ETH-USDe 거래 쌍을 활성화합니다.
시장 뉴스 보도 Technology
암호화폐 거래소 Bybit는 Ethena Labs의 USDe를 담보 자산으로 통합하여 BTC-USDe 및 ETH-USDe 거래 쌍을 활성화합니다.
2024 년 5 월 7 일
CRYPTOMERIA LABS PTE. LTD.