Новостной репортаж Технологии
23 ноября 2022

Преобразование текста в SVG: Беркли объявил об абстрагировании модели диффузии на основе пикселей

Коротко

Синтез текста в изображение: исследователи из Калифорнийского университета в Беркли демонстрируют векторную графику с преобразованием текста. диффузионные модели

В синтезе текста в изображение модели диффузии имеют убивают выдающиеся результаты. Диффузионные модели учатся создавать растровые изображения чрезвычайно разнообразных объектов и ситуаций, используя огромные базы данных аннотированных изображений. Однако для цифровых значков, графики и наклеек дизайнеры обычно используют векторные представления изображений, такие как масштабируемая векторная графика (SVG). Векторная графика имеет небольшой размер и может масштабироваться до любого размера.

Преобразование текста в SVG: Беркли объявил об абстрагировании модели диффузии на основе пикселей

Калифорнийский университет в Беркли демонстрирует, как создавать векторную графику, которую можно экспортировать в формате SVG, используя модель диффузии с преобразованием текста, которая была обучена представлениям пикселей изображения. Это достигается без использования обширных коллекций SVG с подписями. Вместо этого исследователи из Беркли векторизируют распространение текста в изображение сэмплировать и точно настроить его с помощью Score Distillation Sampling loss, мотивированного недавней работой над синтезом текста в 3D.

Пример сгенерированных векторов

Ознакомьтесь со свежесгенерированной галереей SVG. здесь.

Векторная графика имеет небольшой размер, но сохраняет свою четкость при масштабировании до любого размера. Исследователи из Беркли улучшают потерю изображения и текста на основе Score Distillation Sampling для оптимизации векторной графики. Дифференцируемый модуль визуализации SVG DiffVG, который используется VectorFusion, делает возможным инверсное визуальное представление.

Кроме того, VectorFusion позволяет использовать многоступенчатую конфигурацию, которая является более эффективной и более качественной. Этот метод начинается со взятия растровых выборок из модель диффузии текста в изображение под названием Stable Diffusion. Затем VectorFusion автоматически отслеживает образцы с помощью LIVE. Тем не менее, этим образцам часто не хватает детализации, они скучны или их трудно адаптировать к векторной графике. Повышение яркости и текстовой последовательности с помощью выборки Score Distillation Sampling.

VectorFusion может создавать пиксельную графику в стиле старых видеоигр, ограничивая пути SVG квадратами на сетке.

Этот подход легко расширяется для поддержки преобразования текста в эскиз. Чтобы изучить абстрактный рисунок линии, который точно представляет введенный пользователем текст, мы сначала нарисуем 16 случайно выбранных штрихов. Затем мы оптимизируем нашу скрытую потерю выборки Score Distillation Sampling.

Прочитайте соответствующие статьи:

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Другие статьи
Дамир Ялалов
Дамир Ялалов

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Наступил день вынесения приговора: судьба CZ висит на волоске, поскольку суд США рассматривает ходатайство Министерства юстиции

Чанпэн Чжао сегодня предстанет перед судом США в Сиэтле.

Узнать больше

Основателей Samourai Wallet обвиняют в содействии сделкам в даркнете на 2 миллиарда долларов

Задержание основателей Samourai Wallet представляет собой заметную неудачу для отрасли, подчеркивая упорное...

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
AltLayer вступает во вторую фазу своей инициативы по стейкингу и представляет токен reALT
Области применения: Новостной репортаж Технологии
AltLayer вступает во вторую фазу своей инициативы по стейкингу и представляет токен reALT
2 мая 2024
Сеть BNB опубликовала отчет за первый квартал 1 года, в котором подчеркивается сокращение потерь стоимости на 2024%, в то время как TVL BSC взлетает на 55.8%
Области применения: Новостной репортаж Технологии
Сеть BNB опубликовала отчет за первый квартал 1 года, в котором подчеркивается сокращение потерь стоимости на 2024%, в то время как TVL BSC взлетает на 55.8%
2 мая 2024
Naver и Kaia из Kakao: новый азиатский блокчейн-гигант, готовый разрушить глобальные рынки криптовалют
Бизнес Software Истории и обзоры Технологии
Naver и Kaia из Kakao: новый азиатский блокчейн-гигант, готовый разрушить глобальные рынки криптовалют
2 мая 2024
Aave Labs представляет предложение «Aave 2030», включая запуск протокола Aave V4
Бизнес Новостной репортаж Технологии
Aave Labs представляет предложение «Aave 2030», включая запуск протокола Aave V4
2 мая 2024
CRYPTOMERIA LABS PTE. ООО