Text-to-SVG: Berkeley 발표 픽셀 기반 확산 모델 추상화
요컨대
텍스트-이미지 합성 – UC Berkeley 연구원들은 텍스트 조건이 적용된 벡터 그래픽을 시연합니다. 확산 모델
텍스트-이미지 합성에서 확산 모델은 시연 뛰어난 결과. 확산 모델은 주석이 달린 사진의 방대한 데이터베이스를 사용하여 매우 다양한 물체와 상황의 래스터 이미지를 생성하는 방법을 배웁니다. 그러나 디지털 아이콘, 그래픽 및 스티커의 경우 디자이너는 일반적으로 SVG(Scalable Vector Graphics)와 같은 이미지의 벡터 표현을 사용합니다. 벡터 그래픽은 작으며 어떤 크기로도 확장할 수 있습니다.
UC Berkeley는 그림 픽셀 표현에 대해 훈련된 텍스트 조건 확산 모델을 사용하여 SVG로 내보낼 수 있는 벡터 그래픽을 생성하는 방법을 시연합니다. 캡션이 있는 SVG의 광범위한 컬렉션을 사용하지 않고도 이 작업을 수행합니다. 대신 버클리 연구원들은 텍스트에서 이미지로의 확산 텍스트-3D 합성에 대한 최근 작업에서 영감을 얻은 Score Distillation Sampling 손실로 샘플링하고 미세 조정하십시오.
생성된 벡터의 예
새로 생성된 SVG 갤러리를 확인하십시오. 여기에서 지금 확인해 보세요..
벡터 그래픽은 작지만 크기를 조정해도 선명도가 유지됩니다. Berkeley의 연구원들은 벡터 그래픽을 최적화하기 위해 Score Distillation Sampling을 기반으로 이미지-텍스트 손실을 개선합니다. VectorFusion에서 사용하는 DiffVG 미분 가능 SVG 렌더러는 역 비주얼을 가능하게 합니다.
또한 VectorFusion은 보다 효과적이고 고품질의 다단계 구성을 허용합니다. 이 방법은 다음에서 래스터 샘플을 가져오는 것으로 시작합니다. 텍스트-이미지 확산 모델 라는 Stable Diffusion. 샘플은 LIVE를 사용하여 VectorFusion에서 자동으로 추적됩니다. 그럼에도 불구하고 이러한 샘플은 세부 정보가 부족하거나 지루하거나 벡터 그래픽에 적용하기 어려운 경우가 많습니다. Score Distillation Sampling을 통해 생동감과 텍스트의 일관성을 향상시킵니다.
VectorFusion은 SVG 경로를 그리드의 사각형으로 제한하여 오래된 비디오 게임 스타일의 픽셀 아트를 생성할 수 있습니다.
이 접근 방식은 텍스트-스케치 생성을 지원하도록 쉽게 확장됩니다. 사용자 제공 텍스트를 정확하게 나타내는 추상 선 그리기를 학습하기 위해 먼저 무작위로 선택한 16개의 획을 그립니다. 그런 다음 잠재적인 Score Distillation Sampling 손실을 최적화합니다.
관련 기사를 읽으십시오 :
책임 부인
줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.
저자에 관하여
Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다.
더 많은 기사Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다.