뉴스 보도 Technology
2022 년 11 월 24 일

Stability AI의 Stable Diffusion 2 알고리즘 공개: 새로운 depth2img 모델, 초고해상도 업스케일러, 성인용 콘텐츠 없음

요컨대

Stable Diffusion 2.0 모델은 이전 모델보다 빠르고 오픈 소스이며 확장 가능하고 견고합니다.

Stable Diffusion 실시간 렌더링을 위한 새로운 기능으로 GPU 지원

깊이 가이드 stable diffusion 모델 – 창의적인 애플리케이션을 위한 새로운 아이디어가 포함된 이미지 대 이미지

Stability AI 이 출시 에 대한 블로그의 새 문서 Stable Diffusion 2. 그 안에, Stability AI 다른 최첨단 방법에 대해 벤치마킹하면서 이전 알고리즘보다 더 효율적이고 강력한 새로운 알고리즘을 제안합니다.

개방형 AI Stable Diffusion 2 알고리즘 공개: 새로운 depth2img 모델, 초고해상도 업스케일러, 성인용 콘텐츠 없음

CompVis의 오리지널 Stable Diffusion V1 모델 혁명적 인 오픈소스의 본질 AI 모델 전 세계적으로 수백 가지의 다양한 모델과 발전을 생산했습니다. 10,000개의 Github 스타로 가장 빠르게 상승한 것 중 하나를 보았고, 두 달도 안 되어 33,000개를 달성했으며, 이는 Github의 더 많은 프로그램보다 빠른 속도입니다.

원래 Stable Diffusion V1 릴리스는 Robin Rombach(Stability AI) 및 Björn Ommer 박사가 이끄는 LMU 뮌헨 CompVis 그룹의 Patrick Esser(Runway ML). 그들은 Latent를 사용하여 실험실의 이전 작업을 기반으로 구축했습니다. 확산 모델 LAION과 Eleuther AI로부터 중요한 지원을 받았습니다.

개방형 AI Stable Diffusion 2 알고리즘 공개: 새로운 depth2img 모델, 초고해상도 업스케일러, 성인용 콘텐츠 없음
개방형 AI Stable Diffusion 2 알고리즘 공개: 새로운 depth2img 모델, 초고해상도 업스케일러, 성인용 콘텐츠 없음

어떤 수 있습니다 Stable Diffusion v1과 다름 Stable Diffusion v2? 

Stable Diffusion 2.0에는 이전 버전에 비해 여러 가지 중요한 개선 사항과 기능이 포함되어 있으므로 살펴보겠습니다.

XNUMXD덴탈의 Stable Diffusion 2.0 릴리스는 LAION이 Stability AI, 이는 의 품질을 크게 향상시킵니다. 생성된 이미지 이전 V1 릴리스보다 이 릴리스의 텍스트-이미지 모델은 512×512 픽셀 및 768×768 픽셀의 기본 해상도로 이미지를 출력할 수 있습니다.

이러한 모델은 Stability AILAION의 NSFW 필터를 사용하여 성인 콘텐츠를 제외하도록 필터링됩니다.

50개의 DDIM 샘플 단계, 50개의 분류기 없는 안내 척도 및 1.5, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0 및 8.0을 사용한 평가는 체크포인트의 상대적 개선을 나타냅니다.

어떤 수 있습니다 Stable Diffusion v1과 다름 Stable Diffusion v2?

Stable Diffusion 2.0에는 이제 이미지 해상도를 XNUMX배 증가시키는 Upscaler Diffusion 모델이 통합되었습니다. 우리 모델의 예 업 스케일링 낮은 품질로 생성된 이미지(128×128)를 더 높은 해상도의 이미지로 변환하는 방법은 아래와 같습니다(512×512). Stable Diffusion 2.0은 텍스트-이미지 모델과 결합하면 이제 2048×2048 이상의 해상도로 이미지를 생성할 수 있습니다.

새로운 깊이 가이드 stable diffusion 모델, depth2img는 V1의 이전 이미지 대 이미지 기능을 완전히 새로운 창의적 가능성으로 확장합니다. Depth2img는 기존 모델을 사용하여 입력 이미지의 깊이를 결정한 다음 새 이미지를 생성합니다. 형상 텍스트와 깊이 정보를 기반으로 합니다. Depth-to-Image는 이미지의 일관성과 깊이를 유지하면서 원본과 크게 다르게 보이는 변경 사항을 제공하는 수많은 새로운 창의적 응용 프로그램을 제공할 수 있습니다.

새로운 기능 Stable Diffusion 2?

  • 새로운 stable diffusion 모델 768×768 해상도를 제공합니다.
  • U-Net은 버전 1.5와 동일한 양의 매개변수를 가지고 있지만 처음부터 훈련되었으며 OpenCLIP-ViT/H를 텍스트 인코더로 사용합니다. 소위 v-예측 모델은 SD 2.0-v입니다.
  • 앞서 언급한 모델은 2.0×512 이미지에서 일반적인 노이즈 예측 모델로 학습된 SD 512 기반에서 조정되었습니다.
  • x4 스케일링이 있는 잠재 텍스트 안내 확산 모델이 추가되었습니다.
  • 세련된 SD 2.0 기반 깊이 가이드 stable diffusion 모델. 이 모델은 구조 보존 img2img 및 모양 조건부 합성에 활용될 수 있으며 MiDaS에서 추론된 단안 깊이 추정에 따라 조정됩니다.
  • SD 2.0 기반에 구축된 개선된 텍스트 안내 인페인팅 모델입니다.

개발자들은 초기 반복과 마찬가지로 열심히 일했습니다. Stable Diffusion, 단일 GPU에서 실행되도록 모델을 최적화하기 위해 처음부터 가능한 한 많은 사람들이 액세스할 수 있도록 만들고 싶었습니다. 그들은 이미 수백만 명의 개인이 이러한 모델을 손에 넣고 협력하여 절대적으로 놀라운 것을 만들 때 어떤 일이 일어나는지 보았습니다. 이것이 바로 오픈 소스의 힘입니다. 최첨단 모델을 교육할 자원은 없지만 그 모델로 놀라운 일을 할 수 있는 능력이 있는 수백만 명의 재능 있는 사람들의 방대한 잠재력을 활용하는 것입니다.

새로운 기능 Stable Diffusion 2?

이 새로운 업데이트는 depth2img와 같은 강력한 새 기능과 더 나은 해상도 업스케일링 기능과 결합되어 수많은 새로운 애플리케이션의 기반 역할을 하고 새로운 창의적 잠재력의 폭발을 가능하게 합니다.

더 자세히 알아보세요. Stable Diffusion:

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

변동성 속에서 비트코인 ​​ETF를 향한 기관의 선호도 증가

13F 서류를 통한 공개를 통해 주목할만한 기관 투자자들이 비트코인 ​​ETF에 손을 대고 있음이 드러났으며, 이는 비트코인 ​​ETF에 대한 수용이 증가하고 있음을 강조합니다.

현장 사진

선고일이 다가왔습니다: 미국 법원이 DOJ의 주장을 고려함에 따라 CZ의 운명이 균형을 이루고 있습니다.

자오창펑(Changpeng Zhao)은 오늘 시애틀의 미국 법원에서 선고를 받을 예정이다.

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
Injective는 AltLayer와 힘을 합쳐 inEVM에 재스테이킹 보안을 도입했습니다.
근무지에서 발생 뉴스 보도 Technology
Injective는 AltLayer와 힘을 합쳐 inEVM에 재스테이킹 보안을 도입했습니다.
2024 년 5 월 3 일
Masa는 텔러와 협력하여 MASA 대출 풀을 도입하고 USDC에서 베이스 대출을 활성화합니다.
시장 뉴스 보도 Technology
Masa는 텔러와 협력하여 MASA 대출 풀을 도입하고 USDC에서 베이스 대출을 활성화합니다.
2024 년 5 월 3 일
Velodrome은 앞으로 몇 주 안에 Superchain 베타 버전을 출시하고 OP 스택 레이어 2 블록체인으로 확장합니다.
시장 뉴스 보도 Technology
Velodrome은 앞으로 몇 주 안에 Superchain 베타 버전을 출시하고 OP 스택 레이어 2 블록체인으로 확장합니다.
2024 년 5 월 3 일
CARV, 데이터 계층을 분산화하고 보상을 분배하기 위해 Aethir와의 파트너십 발표
근무지에서 발생 뉴스 보도 Technology
CARV, 데이터 계층을 분산화하고 보상을 분배하기 위해 Aethir와의 파트너십 발표
2024 년 5 월 3 일
CRYPTOMERIA LABS PTE. LTD.