뉴스 보도
2022 년 11 월 06 일

ERNIE-ViLG 2.0: Baidu의 새로운 텍스트 투 이미지 모델은 Dalle-2 및 Stable Diffusion

요컨대

Dalle-2와 Stable Diffusion ERNIE-ViLG 2.0보다 성능이 훨씬 뛰어났습니다.

에니빌지 2.0 Dalle-2보다 더 나은 성능을 제공하는 text-to-image 모델이며 Stable Diffusion, 현재 사용 가능한 가장 인기 있는 두 가지 텍스트-이미지 모델입니다. 새로운 모델은 Baidu의 연구원 팀에 의해 설계되고 훈련되었으며 그 결과는 놀랍습니다.

새로운 text-to-image 모델 ERNIE-ViLG 2.0은 Dalle-2 및 Stable Diffusion
ERNIE-ViLG 2.0으로 생성된 이미지

결과는 ERNIE-ViLG 2.0이 Dalle-2를 훨씬 능가하는 것으로 나타났습니다. Stable Diffusion. 이것은 중요한 성과이며 ERNIE 프레임워크의 힘을 보여줍니다. 그만큼 Metaverse Post ERNIE-ViLG 2.0과 Stable Diffusion 아래 :

에니빌지 2.0
Stable Diffusion
에니빌지 2.0
Stable Diffusion
에니빌지 2.0
Stable Diffusion
에니빌지 2.0
Stable Diffusion
에니빌지 2.0

이러한 결과는 ERNIE-ViLG 2.0이 더 효과적이라는 가설을 강력하게 뒷받침합니다. Dalle-2 및 Stable Diffusion.

Unet 아키텍처 Stable Diffusion 기본으로 사용되지만 다음과 같이 변경됩니다.

  • 노이즈 제거 전문가의 혼합: 하나가 아닌 10개의 신경망이 있으며 각각은 특정 확산 단계만 담당합니다.
  • 텍스트 지식: 키워드가 더 많은 가중치를 갖도록 검색어의 단어에 자동으로 가중치를 다시 부여했습니다.
  • 시각적 지식: 학습하는 동안 중간 생성 결과에서 객체가 감지되었으며 객체가 있는 영역에 대한 손실 함수의 가중치가 증가했습니다.

그 결과 세계에서 가장 큰 텍스트-이미지 모델 모델 훈련을 위해 24억 개의 매개변수(SD보다 10배 더 큼)가 나왔습니다.

이전 모델과 비교하여 ERNIE-ViLG 2.0은 ViLG-300 이중 언어에서 동시에 테스트했을 때 이미지 품질 및 이미지-텍스트 일치 측면에서 훨씬 뛰어납니다. 신속한 사람이 설정합니다.

프롬프트는 중국어에서 영어로 자동 번역됩니다. 포옹 얼굴 AI로 전송되기 전에 공개 데모. 많은 기능이 여기에서 나옵니다.

  • ERNIE는 국제 공인을 모릅니다. 예를 들어 ERNIE는 Arnold Schwarzenegger를 모릅니다. 그것은 확실히 중국에서 현지 즐겨 찾기가 있습니다.
  • 결과적으로 프롬프트에 연예인 이름을 사용하는 방법은 광고의 품질을 획기적으로 높일 수 있습니다. 얼굴 실패합니다.
  • 중국어 번역으로 인해 약간의 왜곡을 예상할 수 있으므로 중국어를 할 줄 모르면 깜짝 놀랄 수도 있습니다.
  • Greg Rutkowski에 대해서는 아무것도 모릅니다.

관련 기사를 읽으십시오 :

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories

BRICS Nations Eye Stablecoin 거래 솔루션

by 빅토리아 팔치크
2024 년 5 월 01 일
뉴스레터에 가입하세요.
최신 뉴스

선고일이 다가왔습니다: 미국 법원이 DOJ의 주장을 고려함에 따라 CZ의 운명이 균형을 이루고 있습니다.

자오창펑(Changpeng Zhao)은 오늘 시애틀의 미국 법원에서 선고를 받을 예정이다.

현장 사진

Samourai Wallet 창립자들은 다크넷 거래에서 2억 달러를 촉진한 혐의로 기소되었습니다

Samourai Wallet 창립자들의 우려는 업계에 주목할만한 좌절을 의미하며 지속적인 ...

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
Ankr, AI 블록체인 플랫폼 Talus Network와 협력하여 AI용 비트코인 ​​유동성 잠금 해제
근무지에서 발생 뉴스 보도 Technology
Ankr, AI 블록체인 플랫폼 Talus Network와 협력하여 AI용 비트코인 ​​유동성 잠금 해제
2024 년 5 월 1 일
Binance Labs는 블록체인 전반에 걸쳐 Facebook의 Move 통합을 촉진하기 위해 Movement Lab을 지원합니다
근무지에서 발생 뉴스 보도 Technology
Binance Labs는 블록체인 전반에 걸쳐 Facebook의 Move 통합을 촉진하기 위해 Movement Lab을 지원합니다
2024 년 5 월 1 일
BRICS Nations Eye Stablecoin 거래 솔루션
근무지에서 발생 시장 이야기와 리뷰 Technology
BRICS Nations Eye Stablecoin 거래 솔루션
2024 년 5 월 1 일
비트코인 L2 네트워크 BOB, 향상된 기능을 위해 LayerZero와 통합
근무지에서 발생 뉴스 보도 Technology
비트코인 L2 네트워크 BOB, 향상된 기능을 위해 LayerZero와 통합
2024 년 5 월 1 일
CRYPTOMERIA LABS PTE. LTD.