뉴스 보도 Technology
2023 년 1 월 24 일

StyleGAN-T: 0.1초 이내에 결과를 생성하는 가장 빠른 텍스트-이미지 생성

요컨대

StyleGAN-T는 tex2image 생성을 위한 새로운 GAN입니다.

이 GAN은 좋은 결과를 생성하고 매우 빠릅니다(0.1×512 이미지의 경우 512초).

새로운 아키텍처는 StyleGAN-XL을 기반으로 하지만 생성기 및 판별기 설계를 재평가합니다.

이미지 생성이라는 주제가 나올 때 GAN이 더 이상 논의되지 않는다는 것을 확실히 눈치채셨을 것입니다. 다음과 같은 확산 모델 후 Stable Diffusion 나타나자 GAN은 어떻게든 뒷전으로 물러났습니다. 훈련이 어렵고 자주 넘어지기 때문입니다. GAN의 유일한 이점은 확산 모델과 달리 많은 실행이 아닌 단일 실행("정방향 통과")으로 이미지를 생성한다는 것입니다.

StyleGAN-T: 0.1초 미만의 가장 빠른 텍스트-이미지 생성

그러나 이제 GAN의 새로운 플레이어가 이 분야에 진입했습니다. 스타일GAN-T. tex-to-image 생성을 위한 이 GAN은 0.1×512 이미지에 대해 512초밖에 걸리지 않기 때문에 좋은 결과를 빠르게 생성합니다. 새로운 아키텍처는 StyleGAN-XL을 기반으로 하지만 생성기 및 판별기 디자인을 재평가하고 텍스트 프롬프트 정렬 및 생성된 그래픽에 CLIP을 사용합니다.

관련 기사 : VToonify: 예술적인 초상화 비디오 생성을 위한 실시간 AI 모델

일반적으로 StyleGAN-T는 이제 다른 GAN보다 텍스트-이미지를 더 빠르고 정확하게 생성합니다. 그러나 GAN은 여전히 ​​형편없으며 풀사이즈 SD 모델의 품질은 분명히 의문의 여지가 없습니다. 그러나 이 모든 것은 XNUMX년 안에 XNUMX초 이내에 텍스트에서 매우 높은 품질의 이미지를 생성하는 능력에 달려 있습니다. 또한 GAN과 GAN 사이 어딘가에 속할 것입니다. 확산 모델.

StyleGAN-T 아키텍처
StyleGAN-T 아키텍처

AI에 대해 자세히 알아보기:

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories

Galxe, Jambo와 파트너십을 맺고 글로벌 접근성 확대 Web3

by 알리사 데이비슨
2024 년 5 월 02 일
뉴스레터에 가입하세요.
최신 뉴스

Galxe, Jambo와 파트너십을 맺고 글로벌 접근성 확대 Web3

by 알리사 데이비슨
2024 년 5 월 02 일

선고일이 다가왔습니다: 미국 법원이 DOJ의 주장을 고려함에 따라 CZ의 운명이 균형을 이루고 있습니다.

자오창펑(Changpeng Zhao)은 오늘 시애틀의 미국 법원에서 선고를 받을 예정이다.

현장 사진

Samourai Wallet 창립자들은 다크넷 거래에서 2억 달러를 촉진한 혐의로 기소되었습니다

Samourai Wallet 창립자들의 우려는 업계에 주목할만한 좌절을 의미하며 지속적인 ...

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
Pantera Capital은 TON 블록체인에 투자하고 암호화폐 접근성을 확대할 수 있는 Telegram의 잠재력에 대한 자신감을 표명했습니다.
근무지에서 발생 뉴스 보도 Technology
Pantera Capital은 TON 블록체인에 투자하고 암호화폐 접근성을 확대할 수 있는 Telegram의 잠재력에 대한 자신감을 표명했습니다.
2024 년 5 월 2 일
Mitosis, 모듈식 유동성 프로토콜 발전을 위해 Amber Group 및 Foresight Ventures로부터 7만 달러 자금 조달
근무지에서 발생 뉴스 보도 Technology
Mitosis, 모듈식 유동성 프로토콜 발전을 위해 Amber Group 및 Foresight Ventures로부터 7만 달러 자금 조달
2024 년 5 월 2 일
Galxe, Jambo와 파트너십을 맺고 글로벌 접근성 확대 Web3
근무지에서 발생 뉴스 보도 Technology
Galxe, Jambo와 파트너십을 맺고 글로벌 접근성 확대 Web3
2024 년 5 월 2 일
Google의 Med-Gemini가 유리한 출발을 준비하고 있습니다. GPT-4 의료 분야의 탁월한 성능
AI Wiki 뉴스 소프트웨어 Technology
Google의 Med-Gemini가 유리한 출발을 준비하고 있습니다. GPT-4 의료 분야의 탁월한 성능
2024 년 5 월 2 일
CRYPTOMERIA LABS PTE. LTD.