گزارش خبری پیشرفته
ژوئیه 27، 2023

Stability AI راه اندازی Stable Diffusion XL 1.0 برای تولید سریع تصاویر 1 مگاپیکسلی

به طور خلاصه

Stability AI جدیدترین محصول خود، SDXL 1.0 را منتشر کرده است، ابزاری برای تولید متن به تصویر با کیفیت تصویر بهبود یافته و رابط کاربر پسند.

با 3.5 میلیارد پارامتر می تواند تصاویر 1 مگاپیکسلی با نسبت های مختلف تولید کند.

این مدل برای ساده سازی طراحی شده است متن به تصویر فرآیند تولید و شامل ویژگی های تنظیم دقیق، مانند ControlNet، برگرفته از تحقیقات دانشگاه استنفورد است.

SDXL 1.0 برای پردازنده های گرافیکی مصرف کننده با ظرفیت VRAM 8 گیگابایتی بهینه شده است و در نمونه های ابری با قیمت مناسب به همان اندازه کارآمد است.

این نرم‌افزار تنظیمات دقیق‌تری را ارائه می‌دهد که امکان تولید LoRA سفارشی یا نقاط بازرسی با کاهش سربار داده را فراهم می‌کند.

جامعه هوش مصنوعی می‌تواند در آینده نزدیک منتظر به‌روزرسانی‌ها باشد و SDXL 1.0 می‌تواند مفاهیم پیشرفته‌ای مانند جزئیات پیچیده یا ترکیب‌بندی‌های فضایی پیچیده را تولید کند.

این ابزار منبع باز در GitHub قابل دسترسی است و شفافیت و همکاری را در جامعه ارتقا می دهد.

Stable Diffusion XL 1.0 (SDXL 1.0)، جدیدترین محصول از Stability AI, بالاخره آزاد شده است. این ابزار که به عنوان جدیدترین پیشرفت در تولید متن به تصویر قرار گرفته است، به دلیل کیفیت تصویر بهبود یافته و رابط کاربر پسند خود متمایز است.

Stability AI راه اندازی Stable Diffusion XL 1.0 برای تولید سریع تصاویر 1 مگاپیکسلی
اعتبار: stability.ai
مربوط: افزایش ۲۶ درصدی سهام NVIDIA پس از درآمدهای قوی در سه ماهه اول به دلیل افزایش تقاضا برای پردازنده‌های گرافیکی هوش مصنوعی

در حالی که بسیاری در صنعت هوش مصنوعی به بهبود پلتفرم خود ادامه می دهند، Stability AIانتشار اخیر SDXL 1.0 پیشرفت امیدوار کننده ای را نشان می دهد. 3.5 میلیارد پارامتر قابل توجه این مدل، آن را قادر می سازد تا به سرعت تولید کند تصاویر 1 مگاپیکسلی در نسبت های مختلف. جو پنا، مدیر یادگیری ماشین کاربردی در Stability AI، در گفتگو با تک کرانچ بر قابلیت های این مدل تاکید کرد. او تاکید کرد که چگونه می توان آن را سفارشی کرد و چگونه می توانید مفاهیم و سبک های تصویر را با استفاده از نشانه های اولیه پردازش زبان طبیعی تنظیم کنید. با کمک این ویژگی‌ها، می‌توان وظایف کاربران را آسان‌تر کرد و در عین حال دستورالعمل‌های واضحی را برای ایجاد طرح‌های پیچیده دنبال کرد.

Stability AI به نظر می رسد به چالش های رایج در بخش هوش مصنوعی، به ویژه در مورد تولید متن پرداخته است. قابل ذکر است، بسیاری از مدل‌های پیشرفته تبدیل متن به تصویر، معمولاً زمانی که وظیفه تولید متن خوانا، به ویژه در سبک‌های پیچیده مانند خوشنویسی را بر عهده دارند، کوتاهی می‌کنند. با این حال، SDXL 1.0 مهارت در تولید متن پیشرفته را نشان داده است.

چیزی که SDXL 1.0 را بیشتر متمایز می کند، موقعیت رقابتی آن در برابر سایر رقبای اصلی است Midjourney و Adobe's Firefly سرویس. مدل جدید بر فرآیندهای اصلاح تصویر بهبود یافته و در نتیجه رنگ‌های غنی‌تر، نورپردازی برتر و کنتراست افزایش یافته تاکید دارد. علاوه بر این، گنجاندن یک ویژگی تنظیم دقیق، تولید تصاویر سفارشی را تسهیل می‌کند.

توسعه SDXL 1.0 از یک رویکرد آموزشی ساده بهره می برد و از پایگاه پارامترهای بزرگ آن بهره می برد و آن را به عنوان پایه ای ایده آل برای ابزارها و قابلیت های مختلف قرار می داد. عماد مستقيم مديرعامل با تشريح ويژگي هاي آن Stability AI، بیان کرد که SDXL 1.0 با دقت ساخته شده است تا کارآمدتر شود تولید متن به تصویر روند. این با ControlNet، برگرفته از تحقیقات دانشگاه استنفورد، غنی‌تر شده است و قابلیت‌های تنظیم دقیق و ترکیب را تسهیل می‌کند.

یکی از ویژگی های قابل توجه مدل SDXL 1.0 طراحی کاربر محور آن است. برخلاف نیاز به درخواست‌های طولانی برای به دست آوردن نتایج مطلوب، این مدل به کاربران اجازه می‌دهد تا دستورالعمل‌های پیچیده چند قسمتی را صادر کنند و به طور خلاصه هدف را با کلمات کمتری نسبت به مدل‌های قبلی به تصویر بکشند. در حال حاضر، این مدل نوآورانه از طریق چندین پلتفرم از جمله Amazon Bedrock و Amazon SageMaker Jumpstart قابل دسترسی است.

عملکرد پیشرفته در پردازنده‌های گرافیکی مصرف‌کننده و ویژگی‌های تنظیم دقیق پیشرفته

تصویر تولید شده SDXL 1.0
تصویر تولید شده SDXL 1.0
مربوط: Stability AI 101 میلیون دلار جمع آوری می کند، ارزش گذاری را به 1 میلیارد دلار می بندد

SDXL 1.0 که با توجه به سازگاری طراحی شده است، برای پردازنده‌های گرافیکی مصرف‌کننده با ظرفیت 8 گیگابایت VRAM بهینه شده است و در نمونه‌های ابری با قیمت مناسب به همان اندازه کارآمد است.

ویژگی ها و سازگاری:

راه‌اندازی SDXL 1.0 نشان‌دهنده تعهد Stability برای اطمینان از راه‌حل‌های هوش مصنوعی کارآمد و در دسترس برای کاربران است. یکی از نکات کلیدی این اعلامیه، توانایی این نرم افزار برای عملکرد یکپارچه بر روی پردازنده های گرافیکی استاندارد مصرف کننده است. برای کاربران، این به معنای پتانسیل عملکرد بهینه بدون نیاز به سخت افزار پیشرفته یا تخصصی است.

پیشرفت‌ها در تنظیم دقیق:

پایداری ویژگی هایی را در SDXL 1.0 گنجانده است که فرآیند آموزش مجدد مدل را برای مجموعه داده های منحصر به فرد ساده می کند. مدل فعلی اجازه می دهد تا LoRA سفارشی یا نقاط بازرسی با سربار داده کاهش یافته، که راه را برای سازگاری مدل کارآمدتر و سریعتر با نیازهای خاص هموار می کند. علاوه بر این، اشاره ای به آینده به عنوان وجود دارد Stability AI تیم در حال توسعه کنترل‌های پیشرفته برای ساختارها، سبک‌ها و ترکیب‌های خاص وظیفه است. به طور خاص، T2I/ControlNet، که برای SDXL تخصصی است، در افق است. در حالی که این پیشرفت‌ها در مرحله قبل از بتا باقی می‌مانند، جامعه هوش مصنوعی و کاربران می‌توانند به‌روزرسانی‌ها را در آینده نزدیک پیش‌بینی کنند.

ارائه مفاهیم پیشرفته:

SDXL 1.0 توانایی خود را برای تولید مفاهیمی که قبلاً برای مدل‌های تصویر چالش برانگیز بود، به نمایش می‌گذارد. این شامل ارائه جزئیات پیچیده مانند دست ها و متن، یا حتی ترکیب بندی های فضایی پیچیده تر، مانند صحنه هایی است که زنی را در پس زمینه در حال تعقیب سگ در پیش زمینه به تصویر می کشد. این ویژگی به ویژه قابل توجه است زیرا نشان دهنده جهشی در توانایی نرم افزار برای تفسیر و ارائه سناریوهای ظریف و چند وجهی است.

دسترسی منبع باز:

برای توسعه دهندگان و علاقه مندان به جستجوی عمیق تر، Stability وزن و کد SDXL 1.0 را در GitHub در دسترس قرار داده است. این حرکت نه تنها شفافیت را ترویج می کند، بلکه توسعه مشارکتی و نوآوری را در جامعه تشویق می کند.

آن را امتحان کنید:

برای کسانی که مشتاق آزمایش قابلیت‌های SDXL 1.0 هستند، Stability آن را در پلتفرم‌هایی مانند DreamStudio و ClipDrop ادغام کرده است. علاوه بر این، جلسات تعاملی و نمایش‌های بالقوه از طریق Discord در دسترس هستند و به کاربران اجازه می‌دهند ویژگی‌های ابزار را به طور مستقیم تجربه کنند.

درباره هوش مصنوعی بیشتر بخوانید:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

از Ripple تا The Big Green DAO: چگونه پروژه های ارزهای دیجیتال به خیریه کمک می کنند

بیایید طرح‌هایی را بررسی کنیم که از پتانسیل ارزهای دیجیتال برای اهداف خیریه استفاده می‌کنند.

بیشتر بدانید

AlphaFold 3، Med-Gemini، و دیگران: روشی که هوش مصنوعی مراقبت های بهداشتی را در سال 2024 متحول می کند

هوش مصنوعی به روش های مختلفی در مراقبت های بهداشتی ظاهر می شود، از کشف همبستگی های ژنتیکی جدید تا توانمندسازی سیستم های جراحی رباتیک...

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
10 ابزار رایگان هوش مصنوعی برای ایجاد محتوا، ویرایش ویدیو و موارد دیگر
AI Wiki هضم آموزش شیوه زندگی نرم افزار پیشرفته
10 ابزار رایگان هوش مصنوعی برای ایجاد محتوا، ویرایش ویدیو و موارد دیگر
ممکن است 14، 2024
هشدار کمیسیون اوراق بهادار هنگ کنگ در مورد کلاهبرداری های Deepfake که صنعت کریپتو را هدف قرار می دهد: پیامدهایی برای ایمنی سرمایه گذاران
شیوه زندگی دوربین های مداربسته Wiki نرم افزار داستان ها و نقدها پیشرفته
هشدار کمیسیون اوراق بهادار هنگ کنگ در مورد کلاهبرداری های Deepfake که صنعت کریپتو را هدف قرار می دهد: پیامدهایی برای ایمنی سرمایه گذاران
ممکن است 14، 2024
همکاری Ripple و Evmos در توسعه زنجیره جانبی XRP Ledger EVM با فناوری EvmOS
کسب و کار گزارش خبری پیشرفته
همکاری Ripple و Evmos در توسعه زنجیره جانبی XRP Ledger EVM با فناوری EvmOS
ممکن است 14، 2024
5ireChain "Testnet Thunder: GA" را برای تست استرس شبکه راه اندازی می کند و از کاربران دعوت می کند تا در آن شرکت کنند. Airdrop پاداش
گزارش خبری پیشرفته
5ireChain "Testnet Thunder: GA" را برای تست استرس شبکه راه اندازی می کند و از کاربران دعوت می کند تا در آن شرکت کنند. Airdrop پاداش
ممکن است 14، 2024
CRYPTOMERIA LABS PTE. محدود