뉴스 보도 기술
2023 년 9 월 19 일

Würstchen V2 모델의 승리 Stable Diffusion 고해상도 이미지 생성을 위한 놀라운 속도의 XL

최근 트윗 “Würstchen”(“소시지”를 의미하는 독일어)이라는 제목의 기사 작성자가 매니아와 전문가 모두의 관심을 끌었습니다. 해당 트윗은 새로운 Würstchen V2 모델을 사용하여 이미지를 생성한 흥미로운 결과를 공유했습니다.

Würstchen V2 모델의 승리 Stable Diffusion 고해상도 이미지 생성을 위한 놀라운 속도의 XL
관련: Midjourney 5.2 및 Stable Diffusion 창의적인 텍스트-이미지 생성을 위한 SDXL 0.9 업데이트

Würstchen은 빠르고 효율적이며 다음과 같은 모델보다 빠르게 이미지를 생성합니다. Stable Diffusion 더 적은 메모리를 사용하면서 XL. 또한 Würstchen v1에서는 9,000×512 해상도에서 훈련에 512 GPU 시간이 소요되는 데 비해 Würstchen v150,000에서는 XNUMX GPU 시간만 필요하므로 훈련 비용도 절감되었습니다. Stable Diffusion 1.4. 이러한 16배의 비용 절감은 새로운 실험을 수행하는 연구자에게 도움이 될 뿐만 아니라 더 많은 조직이 그러한 모델을 교육할 수 있는 기회를 열어줍니다. Würstchen v2는 24,602 GPU 시간을 사용하여 6×1.4로만 훈련된 SD512보다 512배 저렴합니다.

Würstchen V2 모델의 승리 Stable Diffusion 고해상도 이미지 생성을 위한 놀라운 속도의 XL
AI 커뮤니티의 눈길을 즉시 사로잡은 뛰어난 기능 중 하나는 Würstchen V2의 인상적인 속도입니다. 저자에 따르면 이 모델을 사용하여 1024개의 2048×7 이미지를 생성하는 데는 단 40초가 소요됩니다. 이를 관점에서 보면 SDXL 모델은 동일한 작업을 수행하는 데 비교적 느린 XNUMX초가 필요합니다.

Würstchen V2 모델의 승리 Stable Diffusion 고해상도 이미지 생성을 위한 놀라운 속도의 XL
이전에 소개된 Würstchen V1은 잠재성으로서 SDXL과 기반을 공유합니다. 확산 모델 그러나 더 빠른 Unet 아키텍처를 통합합니다. 커뮤니티는 Würstchen V2의 아키텍처에 대한 추가 세부 사항을 간절히 기대하고 있으며, 향상된 속도만으로도 주목할 만한 발전입니다.

뷔르스트첸 V2는 확산 모델 이는 고도로 압축된 이미지의 잠재 공간에서 작동하여 훈련 및 추론을 위한 계산 비용을 몇 배나 줄여줍니다. 이전에는 볼 수 없었던 42배 공간 압축을 달성하는 새로운 디자인을 사용합니다. Würstchen은 압축된 이미지를 픽셀 공간으로 다시 디코딩하는 A단계와 B단계의 XNUMX단계 압축을 사용합니다. 세 번째 모델인 Stage C는 고도로 압축된 잠재 공간에서 학습되므로 현재 최고 성능 모델에 사용되는 컴퓨팅의 일부만 필요로 하면서 더 저렴하고 빠른 추론이 가능합니다.

Würstchen V2는 두 가지 확산 단계로 구성됩니다.

  • 단계 A: 이 단계에는 텍스트 조건 확산이 포함되며 무려 1억 개의 매개변수를 자랑합니다. 여기서 가속은 초고압축 기술을 통해 달성됩니다. 특히 SDXL에서 볼 수 있는 128x128x4의 숨겨진 코드 크기 대신 Würstchen V2는 초기에 24x24x16의 해상도에서 작동합니다. 이는 픽셀 수가 적지만 채널이 많아져 속도가 크게 향상된다는 의미입니다.
  • 단계 B: 이는 600억 개의 매개변수를 갖춘 확산 모델로, 이미지를 24×24에서 128×128 해상도로 압축 해제합니다.

숨겨진 코드를 렌더링된 이미지로 변환하는 20천만 개의 매개변수를 갖춘 디코더가 프로세스를 완료합니다.

즉시 눈에 띄는 실질적인 이점은 Würstchen V2의 놀라운 속도입니다. 이는 SDXL보다 2~2.5배 빠른 속도로 작동하며, 이는 분야에서 주목할만한 발전입니다. AI 이미지 생성.

모든 기술 혁신과 마찬가지로 절충안이 있을 수 있습니다. 이미지 품질 측면에서 일부 전문가들은 약간의 손실을 제안하지만 구체적인 증거를 제공하기 위해 포괄적이고 정직한 비교가 여전히 기다리고 있습니다.

생성된 텍스트-이미지 예제는 다음과 같습니다.

Würstchen V2 모델의 승리 Stable Diffusion 고해상도 이미지 생성을 위한 놀라운 속도의 XL
Würstchen V2 모델의 승리 Stable Diffusion 고해상도 이미지 생성을 위한 놀라운 속도의 XL
Würstchen V2 모델의 승리 Stable Diffusion 고해상도 이미지 생성을 위한 놀라운 속도의 XL
Würstchen V2 모델의 승리 Stable Diffusion 고해상도 이미지 생성을 위한 놀라운 속도의 XL
Würstchen V2 모델의 승리 Stable Diffusion 고해상도 이미지 생성을 위한 놀라운 속도의 XL

더 많은 관련 항목 읽기:

책임 한계

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

솔라나 폭풍 전의 고요: 차트, 고래, 온체인 신호가 지금 말하고 있는 것

솔라나는 채택 증가, 기관적 관심, 핵심 파트너십에 힘입어 강력한 성과를 보였지만, 잠재적인 어려움에 직면해 있습니다.

현장 사진

2025년 XNUMX월 암호화폐: 주요 트렌드, 변화, 그리고 앞으로의 전망

2025년 XNUMX월, 암호화폐 분야는 핵심 인프라 강화에 집중했고, 이더리움은 Pectra를 준비했습니다.

현장 사진
자세히 보기
더보기
Curve의 마이클 에고로프, 중앙집중화 위험성 경고 DeFi 해조류 DAO 사태가 Aave로 확산되면서 악용 사례 발생
뉴스 보도 기술
Curve의 마이클 에고로프, 중앙집중화 위험성 경고 DeFi 해조류 DAO 사태가 Aave로 확산되면서 악용 사례 발생
2026 년 4 월 21 일
2026년 암호화폐를 일상 금융으로 탈바꿈시킬 10가지 프로토콜
상위 목록 기술
2026년 암호화폐를 일상 금융으로 탈바꿈시킬 10가지 프로토콜
2026 년 4 월 20 일
AI가 만나다 DeFi암호화 기술이 지능형 에이전트의 실행 계층으로 자리 잡는 이유는 무엇일까요?
뉴스 보도 기술
AI가 만나다 DeFi암호화 기술이 지능형 에이전트의 실행 계층으로 자리 잡는 이유는 무엇일까요?
2026 년 4 월 20 일
Bitget, IPO 사전 청약 신청 접수 시작하며 IPO 이전 투자 기회 확대
뉴스 보도 기술
Bitget, IPO 사전 청약 신청 접수 시작하며 IPO 이전 투자 기회 확대
2026 년 4 월 20 일
CRYPTOMERIA LABS PTE. LTD.