뉴스 보도 기술
2026년 2월 16일

Qwen, 코딩, 추론 및 멀티모달 AI 성능 향상을 위한 새로운 비전-언어 모델 출시

요컨대

Qwen 팀은 멀티모달 성능, 강화 학습 및 훈련 효율성에서 상당한 발전을 이룬 오픈웨이트 Qwen3.5-397B-A17B 모델을 출시했습니다. 이는 보다 강력하고 범용적인 AI 에이전트를 향한 광범위한 노력의 일환입니다.

Qwen, 코딩, 추론 및 멀티모달 AI 성능 향상을 위한 새로운 비전-언어 모델 출시

알리바바 클라우드의 Qwen 팀은 새로운 Qwen3.5 시리즈의 첫 번째 모델인 오픈웨이트 Qwen3.5-397B-A17B를 공개했습니다. 

네이티브 비전-언어 시스템으로 자리매김한 이 모델은 추론, 코딩, 에이전트 작업 및 멀티모달 이해 전반에 걸쳐 뛰어난 성능을 제공하며, 이는 회사의 대규모 AI 개발 노력에 있어 상당한 진전을 반영합니다. 

이 모델은 Gated Delta Networks를 통한 선형 어텐션과 희소 혼합 모델(sparse mixture-of-experts) 설계를 결합한 하이브리드 아키텍처를 기반으로 구축되어 추론 과정에서 높은 효율성을 제공합니다. 전체 시스템은 397억 개의 파라미터를 포함하지만, 각 순방향 전달 과정에서는 17억 개의 파라미터만 활성화되므로 높은 성능을 유지하면서 계산 비용을 절감할 수 있습니다. 또한 이번 릴리스에서는 지원하는 언어 및 방언이 119개에서 201개로 확장되어 전 세계 사용자 및 개발자의 접근성이 향상되었습니다.

Qwen3.5는 강화 학습 및 사전 학습 효율성에서 큰 도약을 이루었습니다.

Qwen3.5 시리즈는 광범위한 환경에 걸쳐 강화 학습 확장성을 크게 향상시켜 Qwen3 대비 상당한 성능 향상을 이루었습니다. 특정 벤치마크에 최적화하는 대신, 개발팀은 작업 난이도와 일반화 가능성을 높이는 데 집중하여 BFCL-V4, VITA-Bench, DeepPlanning, Tool-Decathlon, MCP-Mark 등 다양한 평가에서 에이전트 성능을 개선했습니다. 자세한 결과는 추후 공개될 기술 보고서에서 확인할 수 있습니다.

사전 학습 개선 사항은 성능, 효율성 및 다용성을 포괄합니다. Qwen3.5는 강화된 다국어, STEM 및 추론 콘텐츠를 포함하는 훨씬 더 많은 양의 시각-텍스트 데이터로 학습되어 이전의 수조 개 매개변수 모델과 동등한 성능을 발휘합니다. 고희소성 MoE, 하이브리드 어텐션, 안정성 개선 및 다중 토큰 예측을 포함한 아키텍처 업그레이드는 특히 32개 및 256개 토큰의 확장된 컨텍스트 길이에서 처리량 향상을 가져옵니다. 초기 텍스트-비전 융합과 이미지, STEM 자료 및 비디오를 포함하는 확장된 데이터 세트를 통해 모델의 멀티모달 기능이 강화되었으며, 250개로 늘어난 어휘는 대부분의 언어에서 인코딩 및 디코딩 효율성을 향상시킵니다.

Qwen3.5의 기반 인프라는 효율적인 멀티모달 학습을 위해 설계되었습니다. 이기종 병렬 처리 전략은 병목 현상을 방지하기 위해 비전 및 언어 구성 요소를 분리하고, 희소 활성화 함수를 통해 텍스트-이미지-비디오 혼합 워크로드에서도 거의 최대 처리량을 구현합니다. 네이티브 FP8 파이프라인은 활성화 메모리 사용량을 약 절반으로 줄이고 학습 속도를 10% 이상 향상시키며, 대규모 토큰 처리에서도 안정성을 유지합니다. 

강화 학습은 모든 크기의 모델을 처리할 수 있는 완전 비동기 프레임워크를 기반으로 지원되며, 하드웨어 활용률 향상, 부하 분산 및 오류 복구 기능을 제공합니다. FP8 엔드투엔드 학습, 투기적 디코딩, 롤아웃 라우터 리플레이, 멀티턴 롤아웃 잠금과 같은 기술은 일관성을 유지하고 그래디언트 노후화를 줄이는 데 도움이 됩니다. 이 시스템은 대규모 에이전트 워크플로우를 지원하도록 설계되어 원활한 멀티턴 상호 작용과 다양한 환경에 걸친 폭넓은 일반화 성능을 가능하게 합니다.

사용자는 작업에 따라 자동, 사고, 빠른 모드를 제공하는 Qwen Chat을 통해 Qwen3.5와 상호 작용할 수 있습니다. 또한 이 모델은 Alibaba Cloud의 ModelStudio에서도 사용할 수 있으며, 간단한 매개변수를 통해 추론, 웹 검색, 코드 실행과 같은 고급 기능을 활성화할 수 있습니다. 타사 코딩 도구와의 통합을 통해 개발자는 최소한의 마찰로 Qwen3.5를 기존 워크플로에 쉽게 통합할 수 있습니다.

Qwen 팀에 따르면, Qwen3.5는 하이브리드 아키텍처와 네이티브 멀티모달 추론을 통해 범용 디지털 에이전트의 기반을 마련합니다. 향후 개발은 시스템 수준 통합에 중점을 둘 예정이며, 여기에는 세션 간 학습을 위한 영구 메모리, 실제 환경과의 상호작용을 위한 구현된 인터페이스, 자기 주도적 개선 메커니즘, 그리고 장기적인 자율 운영을 위한 경제적 인식 등이 포함됩니다. 궁극적인 목표는 특정 작업에 특화된 보조 기능을 넘어, 신뢰할 수 있고 인간과 유사한 판단력을 바탕으로 복잡하고 여러 날에 걸친 목표를 관리할 수 있는 일관성 있고 지속적인 에이전트를 구현하는 것입니다.

책임 한계

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

전담 저널리스트인 알리사(Alisa) MPost, 암호화폐, 영지식 증명, 투자 및 광범위한 영역을 전문으로 합니다. Web3. 새로운 트렌드와 기술에 대한 예리한 안목을 바탕으로 그녀는 끊임없이 진화하는 디지털 금융 환경에 대해 독자들에게 정보를 제공하고 참여시키기 위해 포괄적인 취재를 제공합니다.

더 많은 기사
알리사 데이비슨
알리사 데이비슨

전담 저널리스트인 알리사(Alisa) MPost, 암호화폐, 영지식 증명, 투자 및 광범위한 영역을 전문으로 합니다. Web3. 새로운 트렌드와 기술에 대한 예리한 안목을 바탕으로 그녀는 끊임없이 진화하는 디지털 금융 환경에 대해 독자들에게 정보를 제공하고 참여시키기 위해 포괄적인 취재를 제공합니다.

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

솔라나 폭풍 전의 고요: 차트, 고래, 온체인 신호가 지금 말하고 있는 것

솔라나는 채택 증가, 기관적 관심, 핵심 파트너십에 힘입어 강력한 성과를 보였지만, 잠재적인 어려움에 직면해 있습니다.

현장 사진

2025년 XNUMX월 암호화폐: 주요 트렌드, 변화, 그리고 앞으로의 전망

2025년 XNUMX월, 암호화폐 분야는 핵심 인프라 강화에 집중했고, 이더리움은 Pectra를 준비했습니다.

현장 사진
자세히 보기
더보기
바이낸스, 월스트리트저널의 명예훼손 보도 혐의로 법적 조치 착수
근무지에서 발생 뉴스 보도 기술
바이낸스, 월스트리트저널의 명예훼손 보도 혐의로 법적 조치 착수
2026 년 3 월 11 일
보안 연구원들은 코로나19 아이폰 취약점이 암호화폐 지갑을 표적으로 삼고 있다고 경고했습니다.
뉴스 보도 기술
보안 연구원들은 코로나19 아이폰 취약점이 암호화폐 지갑을 표적으로 삼고 있다고 경고했습니다.
2026 년 3 월 11 일
QCP 캐피털은 비트코인이 70만 달러 부근에서 거래되는 가운데, 거시경제 요인에 따른 시장 상황과 투자자들의 신중한 포지션을 지적했습니다.
시장 뉴스 보도 기술
QCP 캐피털은 비트코인이 70만 달러 부근에서 거래되는 가운데, 거시경제 요인에 따른 시장 상황과 투자자들의 신중한 포지션을 지적했습니다.
2026 년 3 월 11 일
2026년 자산 발행을 간소화하고 비용을 절감하는 7가지 RWA 도구
상위 목록 뉴스 보도 기술
2026년 자산 발행을 간소화하고 비용을 절감하는 7가지 RWA 도구
2026 년 3 월 11 일
CRYPTOMERIA LABS PTE. LTD.