뉴스 보도 Technology
2023 년 9 월 19 일

Würstchen V2 모델의 승리 Stable Diffusion 고해상도 이미지 생성을 위한 놀라운 속도의 XL

최근 트윗 “Würstchen”(“소시지”를 의미하는 독일어)이라는 제목의 기사 작성자가 매니아와 전문가 모두의 관심을 끌었습니다. 해당 트윗은 새로운 Würstchen V2 모델을 사용하여 이미지를 생성한 흥미로운 결과를 공유했습니다.

Würstchen V2 모델의 승리 Stable Diffusion 고해상도 이미지 생성을 위한 놀라운 속도의 XL
관련: Midjourney 5.2 및 Stable Diffusion 창의적인 텍스트-이미지 생성을 위한 SDXL 0.9 업데이트

Würstchen은 빠르고 효율적이며 다음과 같은 모델보다 빠르게 이미지를 생성합니다. Stable Diffusion 더 적은 메모리를 사용하면서 XL. 또한 Würstchen v1에서는 9,000×512 해상도에서 훈련에 512 GPU 시간이 소요되는 데 비해 Würstchen v150,000에서는 XNUMX GPU 시간만 필요하므로 훈련 비용도 절감되었습니다. Stable Diffusion 1.4. 이러한 16배의 비용 절감은 새로운 실험을 수행하는 연구자에게 도움이 될 뿐만 아니라 더 많은 조직이 그러한 모델을 교육할 수 있는 기회를 열어줍니다. Würstchen v2는 24,602 GPU 시간을 사용하여 6×1.4로만 훈련된 SD512보다 512배 저렴합니다.

AI 커뮤니티의 눈길을 즉시 사로잡은 뛰어난 기능 중 하나는 Würstchen V2의 인상적인 속도입니다. 저자에 따르면 이 모델을 사용하여 1024개의 2048×7 이미지를 생성하는 데는 단 40초가 소요됩니다. 이를 관점에서 보면 SDXL 모델은 동일한 작업을 수행하는 데 비교적 느린 XNUMX초가 필요합니다.

이전에 소개된 Würstchen V1은 잠재성으로서 SDXL과 기반을 공유합니다. 확산 모델 그러나 더 빠른 Unet 아키텍처를 통합합니다. 커뮤니티는 Würstchen V2의 아키텍처에 대한 추가 세부 사항을 간절히 기대하고 있으며, 향상된 속도만으로도 주목할 만한 발전입니다.

뷔르스트첸 V2는 확산 모델 이는 고도로 압축된 이미지의 잠재 공간에서 작동하여 훈련 및 추론을 위한 계산 비용을 몇 배나 줄여줍니다. 이전에는 볼 수 없었던 42배 공간 압축을 달성하는 새로운 디자인을 사용합니다. Würstchen은 압축된 이미지를 픽셀 공간으로 다시 디코딩하는 A단계와 B단계의 XNUMX단계 압축을 사용합니다. 세 번째 모델인 Stage C는 고도로 압축된 잠재 공간에서 학습되므로 현재 최고 성능 모델에 사용되는 컴퓨팅의 일부만 필요로 하면서 더 저렴하고 빠른 추론이 가능합니다.

Würstchen V2는 두 가지 확산 단계로 구성됩니다.

  • 단계 A: 이 단계에는 텍스트 조건 확산이 포함되며 무려 1억 개의 매개변수를 자랑합니다. 여기서 가속은 초고압축 기술을 통해 달성됩니다. 특히 SDXL에서 볼 수 있는 128x128x4의 숨겨진 코드 크기 대신 Würstchen V2는 초기에 24x24x16의 해상도에서 작동합니다. 이는 픽셀 수가 적지만 채널이 많아져 속도가 크게 향상된다는 의미입니다.
  • 단계 B: 이는 600억 개의 매개변수를 갖춘 확산 모델로, 이미지를 24×24에서 128×128 해상도로 압축 해제합니다.

숨겨진 코드를 렌더링된 이미지로 변환하는 20천만 개의 매개변수를 갖춘 디코더가 프로세스를 완료합니다.

즉시 눈에 띄는 실질적인 이점은 Würstchen V2의 놀라운 속도입니다. 이는 SDXL보다 2~2.5배 빠른 속도로 작동하며, 이는 분야에서 주목할만한 발전입니다. AI 이미지 생성.

모든 기술 혁신과 마찬가지로 절충안이 있을 수 있습니다. 이미지 품질 측면에서 일부 전문가들은 약간의 손실을 제안하지만 구체적인 증거를 제공하기 위해 포괄적이고 정직한 비교가 여전히 기다리고 있습니다.

생성된 텍스트-이미지 예제는 다음과 같습니다.

더 많은 관련 항목 읽기:

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

변동성 속에서 비트코인 ​​ETF를 향한 기관의 선호도 증가

13F 서류를 통한 공개를 통해 주목할만한 기관 투자자들이 비트코인 ​​ETF에 손을 대고 있음이 드러났으며, 이는 비트코인 ​​ETF에 대한 수용이 증가하고 있음을 강조합니다.

현장 사진

선고일이 다가왔습니다: 미국 법원이 DOJ의 주장을 고려함에 따라 CZ의 운명이 균형을 이루고 있습니다.

자오창펑(Changpeng Zhao)은 오늘 시애틀의 미국 법원에서 선고를 받을 예정이다.

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
Espresso Systems, 롤업 상호 운용성 향상을 위해 AggLayer 개발을 위해 Polygon Lab과 협력
근무지에서 발생 뉴스 보도 Technology
Espresso Systems, 롤업 상호 운용성 향상을 위해 AggLayer 개발을 위해 Polygon Lab과 협력
2024 년 5 월 9 일
ZKP 기반 인프라 프로토콜 ZKBase, 로드맵 공개, 5월 테스트넷 출시 계획
뉴스 보도 Technology
ZKP 기반 인프라 프로토콜 ZKBase, 로드맵 공개, 5월 테스트넷 출시 계획
2024 년 5 월 9 일
BLOCKCHANCE와 CONF3RENCE가 독일 최대 규모를 위해 통합되었습니다. Web3 도르트문트 회의
근무지에서 발생 시장 소프트웨어 이야기와 리뷰 Technology
BLOCKCHANCE와 CONF3RENCE가 독일 최대 규모를 위해 통합되었습니다. Web3 도르트문트 회의
2024 년 5 월 9 일
NuLink가 Bybit에서 출시되었습니다 Web3 IDO 플랫폼. 구독 기간이 13월 XNUMX일까지 연장됩니다
시장 뉴스 보도 Technology
NuLink가 Bybit에서 출시되었습니다 Web3 IDO 플랫폼. 구독 기간이 13월 XNUMX일까지 연장됩니다
2024 년 5 월 9 일
CRYPTOMERIA LABS PTE. LTD.