Stability AI Выпускает «стабильную модель Zero123», которая может генерировать 3D-объекты из одного изображения
Коротко
Stability AI анонсировала Stable Zero123, генеративную модель искусственного интеллекта, которая может создавать 3D-изображения из обычных изображений.
Stability AI — стартап, стоящий за системой искусственного интеллекта, генерирующей изображения. Stable Diffusion, представила свою последнюю инновацию — Stable Zero123. Генеративная модель искусственного интеллекта, обученная собственными силами, может создавать 3D-изображения из обычных изображений с повышенным качеством и эффективностью.
По заявлению компании, новая модель представляет собой улучшение по сравнению со своими предшественниками Zero1-to-3 и Zero123-XL благодаря передовым наборам данных и методам обучения. В отличие от своих аналогов, Stable Zero123 демонстрирует глубокое понимание объектов, создавая новые качественные виды с разных точек зрения.
Компания блоге говорит, что Stable Zero123 основан на Stable Diffusion 1.5, использующая тот же объем оперативной памяти видео (VRAM) для создания одного нового изображения. Однако, Stability AI дал понять, что создание 3D-объектов с помощью этой модели требует больше времени и памяти, порекомендовав значительную видеопамять объемом 24 ГБ для оптимальной производительности.
В объявлении следует отметить, что модель доступна только для некоммерческих и исследовательских целей, поскольку компания стремится продвигать инновации в научном сообществе.
Компания объявила, что исследователи и энтузиасты теперь могут получить доступ к Stable Zero123 на Обнимая лицо, облегчая экспериментирование и исследование его возможностей.
Устанавливаем новые стандарты в 3D генерация изображения
Со стабильным нулем123, Stability AI Целью проекта является развитие области компьютерных изображений, предоставляя исследователям инструмент для изучения возможностей создания 3D-изображений. С этой целью компания усовершенствовала набор обучающих данных для Stabile Zero123. Он использует отфильтрованный набор обучающих данных, полученный из Objaverse, уделяя особое внимание сохранению высококачественных 3D-объектов.
Компания визуализировала эти объекты реалистично, превзойдя предыдущие методы.
Как во время обучения, так и в процессе вывода генеративная модель искусственного интеллекта извлекает выгоду из условий возвышения. Предоставляя модели предполагаемый угол камеры, она делает более обоснованные и качественные прогнозы, что приводит к превосходным визуальным результатам.
Кроме того, включение заранее рассчитанного Набор данных (предварительно вычисленные латентные значения) и улучшенный загрузчик данных в сочетании с первыми двумя привели к увеличению эффективности обучения в 40 раз по сравнению с его предшественником Zero123-XL.
Чтобы стимулировать открытые исследования в области создания 3D-объектов, Stability AI улучшил открытый исходный код проекта Threestudio для поддержки Zero123 и Stable Zero123. Упрощенная версия процесса Stable 3D в настоящее время находится в частной предварительной версии и использует Score Distillation Sampling (SDS) для оптимизации поля нейронного излучения (NeRF) с использованием Stable Zero123.
Однако он не предназначен для коммерческого использования. В компании подчеркнули, что это будет эксклюзивный выпуск для исследовательских целей.
Отказ от ответственности
В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.
Об авторе
Кумар — опытный технический журналист, специализирующийся на динамических пересечениях искусственного интеллекта и машинного обучения, маркетинговых технологий и новых областях, таких как криптография, блокчейн и NFTс. Имея более чем трехлетний опыт работы в отрасли, Кумар зарекомендовал себя в создании убедительных повествований, проведении содержательных интервью и предоставлении всеобъемлющей информации. Опыт Кумара заключается в создании эффективного контента, включая статьи, отчеты и исследовательские публикации для известных отраслевых платформ. Обладая уникальным набором навыков, сочетающим в себе технические знания и умение рассказывать истории, Кумар преуспевает в ясной и увлекательной передаче сложных технологических концепций разнообразной аудитории.
Другие статьиКумар — опытный технический журналист, специализирующийся на динамических пересечениях искусственного интеллекта и машинного обучения, маркетинговых технологий и новых областях, таких как криптография, блокчейн и NFTс. Имея более чем трехлетний опыт работы в отрасли, Кумар зарекомендовал себя в создании убедительных повествований, проведении содержательных интервью и предоставлении всеобъемлющей информации. Опыт Кумара заключается в создании эффективного контента, включая статьи, отчеты и исследовательские публикации для известных отраслевых платформ. Обладая уникальным набором навыков, сочетающим в себе технические знания и умение рассказывать истории, Кумар преуспевает в ясной и увлекательной передаче сложных технологических концепций разнообразной аудитории.