GLIGEN: 경계 상자가 있는 새로운 정지된 텍스트-이미지 생성 모델
요컨대
GLIGEN(Grounded-Language-to-Image Generation)은 현재 사전 훈련된 확산 모델의 기능을 기반으로 확장하는 새로운 기술입니다.
캡션 및 경계 상자 조건 입력을 사용하여 GLIGEN 모델은 오픈 월드 기반 text2img를 생성합니다.
GLIGEN은 미리 훈련된 text2img 모델의 지식을 활용하여 특정 장소와 스타일의 다양한 객체를 생성할 수 있습니다.
GLIGEN은 텍스트를 이미지로 생성하는 동안 사람의 키포인트를 기반으로 할 수도 있습니다.
대규모 텍스트-이미지 확산 모델은 먼 길을 왔습니다. 그러나 현재 관행은 제어 가능성을 제한할 수 있는 텍스트 입력에만 의존하는 것입니다. 글리겐또는 Grounded-Language-to-Image Generation은 접지 입력에 조건을 부여할 수 있도록 하여 현재 사전 훈련된 텍스트-이미지 확산 모델의 기능을 구축하고 확장하는 새로운 기술입니다.
사전 훈련된 모델의 광범위한 개념 지식을 유지하기 위해 개발자는 모든 가중치를 동결하고 제어된 프로세스를 통해 접지 정보를 새로운 훈련 가능한 계층으로 펌핑합니다. 캡션 및 경계 상자 조건 입력을 사용하여 GLIGEN 모델은 오픈 월드 접지 텍스트를 이미지로 생성하고 접지 기능은 새로운 공간 구성 및 개념으로 효과적으로 일반화됩니다.
확인 데모 여기를 클릭해 문의해주세요.
- GLIGEN은 기존의 pre-trained를 기반으로 확산 모델, 사전 훈련된 방대한 양의 지식을 유지하기 위해 원래 가중치가 동결되었습니다.
- 각 트랜스포머 블록에서 추가 접지 입력을 흡수하기 위해 새로운 훈련 가능한 Gated Self-Attention 레이어가 생성됩니다.
- 각 접지 토큰에는 두 가지 유형의 정보가 있습니다. 접지된 사물에 대한 의미론적 정보(인코딩된 텍스트 또는 이미지)와 공간 위치 정보(인코딩된 경계 상자 또는 키 포인트)입니다.
AI에 대해 자세히 알아보기:
책임 부인
줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.
저자에 관하여
Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다.
더 많은 기사Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다.