Nvidia, eDiff-I 발표: 스타일 즉시 전송으로 텍스트 및 이미지 합성을 위한 새로운 생성 AI
요컨대
Nvidia는 기업이 고품질의 매력적인 이미지를 만들 수 있도록 eDiff-I를 출시합니다.
eDiff-I 기술은 정기적으로 DALL-E2 및 Stable diffusion
eDiff-I는 새로운 AI 콘텐츠 제작 도구입니다. 제공 마케터와 비즈니스를 위한 전례 없는 텍스트-이미지 합성 기능 엔비디아. eDiff-I를 사용하면 기업은 값비싼 장비나 전문가의 도움 없이도 고품질의 매력적인 비주얼을 빠르고 쉽게 만들 수 있습니다. eDiff-I는 자연어 처리(NLP)를 사용하여 사용자 입력을 해석하고 해당 이미지를 생성합니다. 그런 다음 AI는 이미지를 분석하고 상황에 따라 가장 적합한 이미지를 선택합니다. 그 결과 마케팅 자료, 소셜 미디어 게시물, 이메일 캠페인 등과 같은 다양한 용도로 사용할 수 있는 고품질의 전문가 수준의 이미지가 생성됩니다.
eDiff-I는 차세대 생성 AI 전례 없는 기능을 제공하는 콘텐츠 제작 도구 텍스트를 이미지로 합성, 빠른 스타일 전송, 단어로 직관적인 페인팅. 텍스트에서 시각적 개체를 생성하기 위한 확산 모델로서 eDiff-I는 확산 모델의 동작이 샘플링의 여러 단계에서 다르다는 경험적 발견에 대한 응답으로 각각 특정 노이즈 간격에 특화된 전문가 노이즈 제거 네트워크의 앙상블을 훈련할 것을 제안합니다.
T5 텍스트 임베딩, CLIP 이미지 임베딩 및 CLIP 텍스트 임베딩은 eDiff-I 개념의 기초를 제공합니다. 이 방법론은 모든 텍스트 쿼리에 대한 응답으로 사실적인 그래픽을 생성할 수 있습니다.
텍스트-이미지 합성 외에도 두 가지 추가 기능을 제공합니다. 사용자가 캔버스에 분할 맵을 페인팅하여 이미지를 만들 수 있습니다.
파이프라인은 세 가지 확산 모델의 계단식으로 구성됩니다. 즉, 64×64의 해상도로 샘플을 생성할 수 있는 기본 모델과 그림을 각각 256×256 및 1024×1024의 해상도로 점진적으로 업샘플링할 수 있는 두 개의 초해상도 스택입니다. 모델은 캡션을 입력으로 받은 후 T5 XXL 및 텍스트 임베딩을 계산합니다. 이러한 그림 임베딩은 스타일의 벡터로 사용될 수 있습니다. 그런 다음 이러한 임베딩을 계단식으로 입력합니다. 확산 모델, 점차적으로 1024 x 1024 해상도의 이미지를 생성합니다.
eDiff-I 접근 방식은 오픈 소스 텍스트-이미지 알고리즘과 비교할 때 지속적으로 더 나은 합성 품질을 제공합니다.Stable diffusion) 및 (DALL-E2).
CLIP 이미지 임베딩을 사용할 때 eDiff-I 접근 방식은 스타일 전송을 용이하게 합니다. eDiff-I는 먼저 쥐다 스타일 참조 벡터로 활용할 수 있는 참조 스타일 이미지의 이미지 임베딩. 스타일 참조는 아래 그림의 왼쪽 패널에서 볼 수 있습니다. 스타일 컨디셔닝이 켜져 있을 때의 결과는 중앙 패널에 표시됩니다. 스타일 컨디셔닝이 해제된 경우 결과는 오른쪽 패널에 표시됩니다. 스타일 조건이 적용되면 eDiff-I 모델은 입력 캡션의 스타일에도 맞는 출력을 생성합니다. 스타일 컨디셔닝을 해제하면 자연스러운 사진이 연출됩니다.
구를 선택하고 이미지에 낙서함으로써 eDiff-I 방법 사용자는 텍스트 프롬프트에 나열된 항목의 배치를 변경할 수 있습니다. 그 후 모델은 다음을 사용합니다. 이미지 생성을 위한 프롬프트 및 맵 캡션과 입력 맵 모두와 호환됩니다.
관련 기사를 읽으십시오 :
책임 부인
줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.
저자에 관하여
Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다.
더 많은 기사Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다.