시장 뉴스 보도
2023 년 8 월 08 일

Alibaba, 오픈 소스 Qwen-7B 언어 모델 도입

알리바바가 공개한 오픈소스 LLM(Large Language Model) 퀸-7B, 공개적으로 액세스할 수 있는 LLM 영역에 첫 진입을 표시합니다. 이 모델은 7억 개의 매개변수를 기반으로 구축되었습니다.

Alibaba, 오픈 소스 Qwen-7B 언어 모델 도입

맥락상 Qwen-7B는 2.2조 2048천억 개의 토큰을 사용하여 훈련을 받았습니다. 이 교육 단계에서 설정된 컨텍스트 크기는 8192이었지만 사용자는 테스트 중에 이를 최대 XNUMX까지 확장할 수 있습니다. 비교해 보면, Llama-2, 또 다른 LLM은 4096의 컨텍스트 크기를 제공합니다.

벤치마크는 이러한 모델의 성능을 측정하는 데 필수적이며, 이 영역에서 중국 개발자는 Qwen-7B가 능가했다고 주장합니다. Llama-2. 눈에 띄는 지표 중 하나는 Human-Eval 코딩 벤치마크로, Qwen-7B는 24.4점을 받았습니다. Llama-2의 12.8. 그러나 이 수치를 어느 정도 주의해서 보는 것이 좋습니다. 일부 벤치마크에서는 Qwen-7B가 기본 모델뿐만 아니라 성능도 뛰어남을 나타냅니다. LLama-2-7B 뿐만 아니라 LLaMA-2-13B 변형. 그러나 세련된 버전과 비교하면 Llama-2이면 차이의 폭이 좁아진다. Qwen-7B의 정확한 훈련 방법은 개발자가 명시적으로 자세히 설명하지 않았다는 점에 유의해야 합니다.

기능적으로 병행하여 LLaMa2-채팅, Qwen은 Qwen-7B-Chat이라는 채팅 중심 버전을 선보였습니다. 이 모델은 사용자와의 상호 작용에 최적화되어 있으며 다양한 도구와 API 응답성을 향상시키기 위해.

기술적 세부 사항에 관심이 있는 사람들은 Qwen-7B의 아키텍처 기반이 다음과 유사하다는 사실에 관심이 있을 것입니다. LLaMA. 그러나 Qwen-7B를 차별화하는 뚜렷한 특징이 있습니다.

  1. 묶이지 않은 임베딩을 사용합니다.
  2. 회전 위치 임베딩이 활용됩니다.
  3. 주의할 QKV를 제외하고 바이어스는 제외됩니다.
  4. RMSNorm은 LayerNorm보다 선호됩니다.
  5. 표준 ReLU 대신 SwiGLU가 통합되었습니다.
  6. 교육 프로세스를 신속하게 처리하기 위해 Flash Attention이 도입되었습니다.
  7. 이 모델은 32개의 레이어로 구성되어 있고 임베딩 차원은 4096이며 32개의 어텐션 헤드를 수용합니다.

라이센스 측면에서 Qwen-7B는 Llama-2. 상업적 사용을 허용하지만 사용자 수에 대한 규정이 있습니다. 하는 동안 Llama-2는 이 한도를 월간 활성 사용자 700억 명으로 설정하고 Qwen-7B의 임계값은 100억 명입니다.

심층 조사를 원하는 사람들은 GitHub에서 제공되는 기술 보고서를 참조할 수 있습니다. 추가적으로, Qwen-7B 시연는 중국어로 제공되며 모델의 기능을 실제로 탐색하는 데 관심이 있는 사용자가 액세스할 수 있습니다.

AI에 대해 자세히 알아보기:

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

변동성 속에서 비트코인 ​​ETF를 향한 기관의 선호도 증가

13F 서류를 통한 공개를 통해 주목할만한 기관 투자자들이 비트코인 ​​ETF에 손을 대고 있음이 드러났으며, 이는 비트코인 ​​ETF에 대한 수용이 증가하고 있음을 강조합니다.

현장 사진

선고일이 다가왔습니다: 미국 법원이 DOJ의 주장을 고려함에 따라 CZ의 운명이 균형을 이루고 있습니다.

자오창펑(Changpeng Zhao)은 오늘 시애틀의 미국 법원에서 선고를 받을 예정이다.

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
Nexo는 생태계 참여에 대해 사용자에게 12만 달러의 NEXO 토큰을 보상하기 위해 'The Hunt'를 시작합니다.
시장 뉴스 보도 Technology
Nexo는 생태계 참여에 대해 사용자에게 12만 달러의 NEXO 토큰을 보상하기 위해 'The Hunt'를 시작합니다.
2024 년 5 월 8 일
Revolut의 Revolut X Exchange는 제로 메이커 수수료 및 고급 분석으로 암호화폐 거래자를 우대합니다.
시장 소프트웨어 이야기와 리뷰 Technology
Revolut의 Revolut X Exchange는 제로 메이커 수수료 및 고급 분석으로 암호화폐 거래자를 우대합니다.
2024 년 5 월 8 일
암호화폐 거래 플랫폼 BitMEX, 수수료가 없고 현금 인센티브가 없는 옵션 거래 출시
근무지에서 발생 시장 뉴스 보도
암호화폐 거래 플랫폼 BitMEX, 수수료가 없고 현금 인센티브가 없는 옵션 거래 출시
2024 년 5 월 8 일
Lisk는 공식적으로 Ethereum Layer 2로 전환하고 Core v4.0.6을 공개합니다.
뉴스 보도 Technology
Lisk는 공식적으로 Ethereum Layer 2로 전환하고 Core v4.0.6을 공개합니다.
2024 년 5 월 8 일
CRYPTOMERIA LABS PTE. LTD.