뉴스 보도
2022 년 11 월 06 일

ERNIE-ViLG 2.0: Baidu의 새로운 텍스트 투 이미지 모델은 Dalle-2 및 Stable Diffusion

요컨대

Dalle-2와 Stable Diffusion ERNIE-ViLG 2.0보다 성능이 훨씬 뛰어났습니다.

에니빌지 2.0 Dalle-2보다 더 나은 성능을 제공하는 text-to-image 모델이며 Stable Diffusion, 현재 사용 가능한 가장 인기 있는 두 가지 텍스트-이미지 모델입니다. 새로운 모델은 Baidu의 연구원 팀에 의해 설계되고 훈련되었으며 그 결과는 놀랍습니다.

새로운 text-to-image 모델 ERNIE-ViLG 2.0은 Dalle-2 및 Stable Diffusion
ERNIE-ViLG 2.0으로 생성된 이미지

결과는 ERNIE-ViLG 2.0이 Dalle-2를 훨씬 능가하는 것으로 나타났습니다. Stable Diffusion. 이것은 중요한 성과이며 ERNIE 프레임워크의 힘을 보여줍니다. 그만큼 Metaverse Post ERNIE-ViLG 2.0과 Stable Diffusion 아래 :

에니빌지 2.0
Stable Diffusion
에니빌지 2.0
Stable Diffusion
에니빌지 2.0
Stable Diffusion
에니빌지 2.0
Stable Diffusion
에니빌지 2.0

이러한 결과는 ERNIE-ViLG 2.0이 더 효과적이라는 가설을 강력하게 뒷받침합니다. Dalle-2 및 Stable Diffusion.

Unet 아키텍처 Stable Diffusion 기본으로 사용되지만 다음과 같이 변경됩니다.

  • 노이즈 제거 전문가의 혼합: 하나가 아닌 10개의 신경망이 있으며 각각은 특정 확산 단계만 담당합니다.
  • 텍스트 지식: 키워드가 더 많은 가중치를 갖도록 검색어의 단어에 자동으로 가중치를 다시 부여했습니다.
  • 시각적 지식: 학습하는 동안 중간 생성 결과에서 객체가 감지되었으며 객체가 있는 영역에 대한 손실 함수의 가중치가 증가했습니다.

그 결과 세계에서 가장 큰 텍스트-이미지 모델 모델 훈련을 위해 24억 개의 매개변수(SD보다 10배 더 큼)가 나왔습니다.

이전 모델과 비교하여 ERNIE-ViLG 2.0은 ViLG-300 이중 언어에서 동시에 테스트했을 때 이미지 품질 및 이미지-텍스트 일치 측면에서 훨씬 뛰어납니다. 신속한 사람이 설정합니다.

프롬프트는 중국어에서 영어로 자동 번역됩니다. 포옹 얼굴 AI로 전송되기 전에 공개 데모. 많은 기능이 여기에서 나옵니다.

  • ERNIE는 국제 공인을 모릅니다. 예를 들어 ERNIE는 Arnold Schwarzenegger를 모릅니다. 그것은 확실히 중국에서 현지 즐겨 찾기가 있습니다.
  • 결과적으로 프롬프트에 연예인 이름을 사용하는 방법은 광고의 품질을 획기적으로 높일 수 있습니다. 얼굴 실패합니다.
  • 중국어 번역으로 인해 약간의 왜곡을 예상할 수 있으므로 중국어를 할 줄 모르면 깜짝 놀랄 수도 있습니다.
  • Greg Rutkowski에 대해서는 아무것도 모릅니다.

관련 기사를 읽으십시오 :

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

변동성 속에서 비트코인 ​​ETF를 향한 기관의 선호도 증가

13F 서류를 통한 공개를 통해 주목할만한 기관 투자자들이 비트코인 ​​ETF에 손을 대고 있음이 드러났으며, 이는 비트코인 ​​ETF에 대한 수용이 증가하고 있음을 강조합니다.

현장 사진

선고일이 다가왔습니다: 미국 법원이 DOJ의 주장을 고려함에 따라 CZ의 운명이 균형을 이루고 있습니다.

자오창펑(Changpeng Zhao)은 오늘 시애틀의 미국 법원에서 선고를 받을 예정이다.

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
Injective는 AltLayer와 힘을 합쳐 inEVM에 재스테이킹 보안을 도입했습니다.
근무지에서 발생 뉴스 보도 Technology
Injective는 AltLayer와 힘을 합쳐 inEVM에 재스테이킹 보안을 도입했습니다.
2024 년 5 월 3 일
Masa는 텔러와 협력하여 MASA 대출 풀을 도입하고 USDC에서 베이스 대출을 활성화합니다.
시장 뉴스 보도 Technology
Masa는 텔러와 협력하여 MASA 대출 풀을 도입하고 USDC에서 베이스 대출을 활성화합니다.
2024 년 5 월 3 일
Velodrome은 앞으로 몇 주 안에 Superchain 베타 버전을 출시하고 OP 스택 레이어 2 블록체인으로 확장합니다.
시장 뉴스 보도 Technology
Velodrome은 앞으로 몇 주 안에 Superchain 베타 버전을 출시하고 OP 스택 레이어 2 블록체인으로 확장합니다.
2024 년 5 월 3 일
CARV, 데이터 계층을 분산화하고 보상을 분배하기 위해 Aethir와의 파트너십 발표
근무지에서 발생 뉴스 보도 Technology
CARV, 데이터 계층을 분산화하고 보상을 분배하기 위해 Aethir와의 파트너십 발표
2024 년 5 월 3 일
CRYPTOMERIA LABS PTE. LTD.