뉴스 보도 Technology
2022 년 11 월 17 일

Nvidia, eDiff-I 발표: 스타일 즉시 전송으로 텍스트 및 이미지 합성을 위한 새로운 생성 AI

요컨대

Nvidia는 기업이 고품질의 매력적인 이미지를 만들 수 있도록 eDiff-I를 출시합니다.

eDiff-I 기술은 정기적으로 DALL-E2 및 Stable diffusion

eDiff-I는 새로운 AI 콘텐츠 제작 도구입니다. 제공 마케터와 비즈니스를 위한 전례 없는 텍스트-이미지 합성 기능 엔비디아. eDiff-I를 사용하면 기업은 값비싼 장비나 전문가의 도움 없이도 고품질의 매력적인 비주얼을 빠르고 쉽게 만들 수 있습니다. eDiff-I는 자연어 처리(NLP)를 사용하여 사용자 입력을 해석하고 해당 이미지를 생성합니다. 그런 다음 AI는 이미지를 분석하고 상황에 따라 가장 적합한 이미지를 선택합니다. 그 결과 마케팅 자료, 소셜 미디어 게시물, 이메일 캠페인 등과 같은 다양한 용도로 사용할 수 있는 고품질의 전문가 수준의 이미지가 생성됩니다.

eDiff-I는 차세대 생성 AI 전례 없는 기능을 제공하는 콘텐츠 제작 도구 텍스트를 이미지로 합성, 빠른 스타일 전송, 단어로 직관적인 페인팅. 텍스트에서 시각적 개체를 생성하기 위한 확산 모델로서 eDiff-I는 확산 모델의 동작이 샘플링의 여러 단계에서 다르다는 경험적 발견에 대한 응답으로 각각 특정 노이즈 간격에 특화된 전문가 노이즈 제거 네트워크의 앙상블을 훈련할 것을 제안합니다.

Nvidia, eDiff-I 발표: 스타일 즉시 전송으로 텍스트 및 이미지 합성을 위한 새로운 생성 AI

T5 텍스트 임베딩, CLIP 이미지 임베딩 및 CLIP 텍스트 임베딩은 eDiff-I 개념의 기초를 제공합니다. 이 방법론은 모든 텍스트 쿼리에 대한 응답으로 사실적인 그래픽을 생성할 수 있습니다.

텍스트-이미지 합성 외에도 두 가지 추가 기능을 제공합니다. 사용자가 캔버스에 분할 맵을 페인팅하여 이미지를 만들 수 있습니다.

관로
관로

파이프라인은 세 가지 확산 모델의 계단식으로 구성됩니다. 즉, 64×64의 해상도로 샘플을 생성할 수 있는 기본 모델과 그림을 각각 256×256 및 1024×1024의 해상도로 점진적으로 업샘플링할 수 있는 두 개의 초해상도 스택입니다. 모델은 캡션을 입력으로 받은 후 T5 XXL 및 텍스트 임베딩을 계산합니다. 이러한 그림 임베딩은 스타일의 벡터로 사용될 수 있습니다. 그런 다음 이러한 임베딩을 계단식으로 입력합니다. 확산 모델, 점차적으로 1024 x 1024 해상도의 이미지를 생성합니다.

eDiff-I 접근 방식은 오픈 소스 텍스트-이미지 알고리즘과 비교할 때 지속적으로 더 나은 합성 품질을 제공합니다.Stable diffusion) 및 (DALL-E2).

결과
결과

CLIP 이미지 임베딩을 사용할 때 eDiff-I 접근 방식은 스타일 전송을 용이하게 합니다. eDiff-I는 먼저 쥐다 스타일 참조 벡터로 활용할 수 있는 참조 스타일 이미지의 이미지 임베딩. 스타일 참조는 아래 그림의 왼쪽 패널에서 볼 수 있습니다. 스타일 컨디셔닝이 켜져 있을 때의 결과는 중앙 패널에 표시됩니다. 스타일 컨디셔닝이 해제된 경우 결과는 오른쪽 패널에 표시됩니다. 스타일 조건이 적용되면 eDiff-I 모델은 입력 캡션의 스타일에도 맞는 출력을 생성합니다. 스타일 컨디셔닝을 해제하면 자연스러운 사진이 연출됩니다.

스타일 전송
스타일 전송

구를 선택하고 이미지에 낙서함으로써 eDiff-I 방법 사용자는 텍스트 프롬프트에 나열된 항목의 배치를 변경할 수 있습니다. 그 후 모델은 다음을 사용합니다. 이미지 생성을 위한 프롬프트 및 맵 캡션과 입력 맵 모두와 호환됩니다.

관련 기사를 읽으십시오 :

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

선고일이 다가왔습니다: 미국 법원이 DOJ의 주장을 고려함에 따라 CZ의 운명이 균형을 이루고 있습니다.

자오창펑(Changpeng Zhao)은 오늘 시애틀의 미국 법원에서 선고를 받을 예정이다.

현장 사진

Samourai Wallet 창립자들은 다크넷 거래에서 2억 달러를 촉진한 혐의로 기소되었습니다

Samourai Wallet 창립자들의 우려는 업계에 주목할만한 좌절을 의미하며 지속적인 ...

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
AltLayer, 스테이킹 이니셔티브의 두 번째 단계에 진입하고 reALT 토큰 출시
시장 뉴스 보도 Technology
AltLayer, 스테이킹 이니셔티브의 두 번째 단계에 진입하고 reALT 토큰 출시
2024 년 5 월 2 일
BNB 체인, 1년 2024분기 보고서 발표, 가치 손실 55.8% 감소, BSC TVL 70.8% 급증 강조
시장 뉴스 보도 Technology
BNB 체인, 1년 2024분기 보고서 발표, 가치 손실 55.8% 감소, BSC TVL 70.8% 급증 강조
2024 년 5 월 2 일
네이버와 카카오의 카이아: 글로벌 암호화폐 시장을 뒤흔들 새로운 아시아 블록체인 강국
근무지에서 발생 소프트웨어 이야기와 리뷰 Technology
네이버와 카카오의 카이아: 글로벌 암호화폐 시장을 뒤흔들 새로운 아시아 블록체인 강국
2024 년 5 월 2 일
Aave Labs, Aave V2030 프로토콜 출시를 포함한 'Aave 4' 제안 공개
근무지에서 발생 뉴스 보도 Technology
Aave Labs, Aave V2030 프로토콜 출시를 포함한 'Aave 4' 제안 공개
2024 년 5 월 2 일
CRYPTOMERIA LABS PTE. LTD.