ERNIE-ViLG 2.0: Baidu의 새로운 텍스트 투 이미지 모델은 Dalle-2 및 Stable Diffusion
요컨대
Dalle-2와 Stable Diffusion ERNIE-ViLG 2.0보다 성능이 훨씬 뛰어났습니다.
에니빌지 2.0 Dalle-2보다 더 나은 성능을 제공하는 text-to-image 모델이며 Stable Diffusion, 현재 사용 가능한 가장 인기 있는 두 가지 텍스트-이미지 모델입니다. 새로운 모델은 Baidu의 연구원 팀에 의해 설계되고 훈련되었으며 그 결과는 놀랍습니다.
결과는 ERNIE-ViLG 2.0이 Dalle-2를 훨씬 능가하는 것으로 나타났습니다. Stable Diffusion. 이것은 중요한 성과이며 ERNIE 프레임워크의 힘을 보여줍니다. 그만큼 Metaverse Post ERNIE-ViLG 2.0과 Stable Diffusion 아래 :
이러한 결과는 ERNIE-ViLG 2.0이 더 효과적이라는 가설을 강력하게 뒷받침합니다. Dalle-2 및 Stable Diffusion.
Unet 아키텍처 Stable Diffusion 기본으로 사용되지만 다음과 같이 변경됩니다.
- 노이즈 제거 전문가의 혼합: 하나가 아닌 10개의 신경망이 있으며 각각은 특정 확산 단계만 담당합니다.
- 텍스트 지식: 키워드가 더 많은 가중치를 갖도록 검색어의 단어에 자동으로 가중치를 다시 부여했습니다.
- 시각적 지식: 학습하는 동안 중간 생성 결과에서 객체가 감지되었으며 객체가 있는 영역에 대한 손실 함수의 가중치가 증가했습니다.
그 결과 세계에서 가장 큰 텍스트-이미지 모델 모델 훈련을 위해 24억 개의 매개변수(SD보다 10배 더 큼)가 나왔습니다.
프롬프트는 중국어에서 영어로 자동 번역됩니다. 포옹 얼굴 AI로 전송되기 전에 공개 데모. 많은 기능이 여기에서 나옵니다.
- ERNIE는 국제 공인을 모릅니다. 예를 들어 ERNIE는 Arnold Schwarzenegger를 모릅니다. 그것은 확실히 중국에서 현지 즐겨 찾기가 있습니다.
- 결과적으로 프롬프트에 연예인 이름을 사용하는 방법은 광고의 품질을 획기적으로 높일 수 있습니다. 얼굴 실패합니다.
- 중국어 번역으로 인해 약간의 왜곡을 예상할 수 있으므로 중국어를 할 줄 모르면 깜짝 놀랄 수도 있습니다.
- Greg Rutkowski에 대해서는 아무것도 모릅니다.
관련 기사를 읽으십시오 :
책임 부인
줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.
저자에 관하여
Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다.
더 많은 기사Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다.