DeepFloyd and Beyond: کاوش جدیدترین هنرهای هوش مصنوعی با مدیر عامل استودیو NightCafe
به طور خلاصه
مدیر عامل استودیو نایت کافه طی یک مصاحبه اختصاصی، بینش ها و دیدگاه های ارزشمندی را در مورد هنر تولید شده توسط هوش مصنوعی ارائه کرد.
آنگوس راسل DeepFloyd را معرفی کرد – یک الگوریتم جدید که توسط شریک NightCafe Studio توسعه یافته است. Stability AI، که در فضای پیکسل عمل می کند و از یک مدل زبان بزرگ (LLM) برای تولید تصاویر استفاده می کند.
استودیو کافه شبانه یک AI Art Generator است که به کاربران این امکان را می دهد تا با کمک هوش مصنوعی در چند ثانیه هنرهای خیره کننده و آینده نگر خلق کنند. تأسیس شده توسط آنگوس راسل چهار سال پیش، استودیو نایت کافه از ناامیدی خود آنگوس از ناتوانی در یافتن آثار هنری که با او طنین انداز شده بود متولد شد. او با آگاهی از وجود الگوریتم های انتقال سبک، به دنبال وب سایتی گشت که او را قادر می سازد تا از طریق انتقال سبک، هنری شخصی سازی شده ایجاد کند و آن را چاپ کند.
در کمال ناامیدی او نتوانست چنین پلتفرمی را پیدا کند. با این حال، این عقب نشینی جرقه یک ایده بدیع را در او ایجاد کرد. او تصمیم گرفت یک اپلیکیشن انتقال سبک عصبی برای خلق آثار هنری تولید شده توسط هوش مصنوعی ایجاد کند و آن را در Reddit قرار داد.
NightCafe Studio به عنوان یک پلتفرم تولید متن به تصویر آغاز شد و آن را به اولین در نوع خود تبدیل کرد. این ویژگی منحصر به فرد باعث افزایش قابل توجهی در درآمد و پایگاه کاربران شد. از آن زمان، این پلتفرم در خط مقدم هوش مصنوعی مولد باقی مانده است و جامعه بزرگی از علاقه مندان را جذب می کند که از استفاده از ژنراتور برای خلق آثار هنری خیره کننده لذت می برند. امروزه، NightCafe Studio به طور گسترده ای به عنوان یکی از محبوب ترین و خلاقانه ترین تولید کننده های تصویر هوش مصنوعی موجود در نظر گرفته می شود.
در طی مصاحبه ای با آنگوس راسل، مزایا و محدودیت های هنر تولید شده توسط هوش مصنوعی، افزایش استفاده از هوش مصنوعی در دنیای هنر و آخرین الگوریتم تولید تصویر هوش مصنوعی، DeepFloyd را بررسی کردیم.
ظهور هنر تولید شده توسط هوش مصنوعی
در دهه گذشته، صنعت هنر شاهد نفوذ تدریجی هوش مصنوعی و یادگیری ماشینی (ML) بوده است. این فناوریهای پیشرفته، مفاهیم جدید و جذابی مانند Deepfakes و SLAB، که در سراسر جهان مورد توجه قرار گرفته اند. امروزه، صنعت هنر نمیتواند تأثیر عظیم هوش مصنوعی را نادیده بگیرد، که اکنون باعث ایجاد یک انقلاب طولانی مدت در این بخش شده است.
آنگوس در مورد چگونگی رشد استودیو NightCafe در طول انتشار صحبت کرد Stable Diffusion، یک مدل تبدیل متن به تصویر که شرکت او در روز راه اندازی با آن وارد عمل شد. از آن زمان، به دلیل منبع باز الگوریتم ها و کدهای نمونه، مانع ورود برای ایجاد ابزارهای مشابه کاهش یافته است.
موسس استودیو نایت کافه معتقد است که ایجاد هنر هوش مصنوعی فقط به محصول نهایی مربوط نمی شود، بلکه به فرآیند ایجاد آن نیز مربوط می شود. او آن را نوعی درمان و آرامش میداند که به افراد اجازه میدهد تا خود را به روشهای منحصربهفرد و خلاقانه ابراز کنند. بسیاری از افرادی که هرگز خود را خلاق نمی دانستند، توانایی های هنری خود را از طریق تصاویر تولید شده توسط هوش مصنوعی کشف کرده اند. این فلسفه در رابط کاربری این پلتفرم منعکس شده است، که به گونه ای طراحی شده است که کاربر پسند و قابل دسترس برای هنرمندان در تمام سطوح مهارت باشد.
فقط در NightCafe Studio، در حال حاضر بین دو تا سه میلیون کاربر در ماه وجود دارد که حدود یک میلیون تصویر در روز تولید می کنند. Stability AIیک شرکت هوش مصنوعی مولد منبع باز، اظهار داشت: که آنها بیش از 10 میلیون کاربر داشتند که بلافاصله پس از راه اندازی روزانه فعال بودند Stable Diffusion.
توصیه می شود: 10+ بهترین مولد هنر هوش مصنوعی در سال 2023: Midjourney, DALL-E, Night Cafe, Artbreeder |
DeepFloyd IF: الگوریتم جدید تولید تصویر هوش مصنوعی که بازی را تغییر می دهد
NightCafe Studio در حال پیاده سازی الگوریتم جدیدی توسط Stability AI نام دیپ فلوید، که نوید ایجاد انقلابی در نحوه تولید تصاویر با هوش مصنوعی را می دهد.
DeepFloyd، که در حال حاضر در نسخه بتا است، یک مدل جدید متن به تصویر است که می تواند تصاویر چشمگیری را از توضیحات زبان طبیعی ایجاد کند. این بر اساس یک معماری جدید است که یک مدل زبان بزرگ را با سه مدل انتشار ترکیب می کند. این مدل از Imagen الهام گرفته شده است، مدلی مشابه که توسط Google Research توسعه یافته اما هرگز برای عموم منتشر نشده است.
این مدل می تواند تصاویر واضح و منسجمی را با متن و اشیاء در روابط فضایی مختلف ایجاد کند که برای اکثر مدل های متن به تصویر دیگر یک کار چالش برانگیز است. این با استفاده از مدل زبان بزرگ T5-XXL-1.1 به عنوان رمزگذار متن و مقدار قابل توجهی از لایههای متقاطع متن-تصویر که اتحاد سریع و تصویر بهتری را فراهم میکند، به دست میآید.
DeepFloyd همچنین می تواند تصاویری با نسبت ابعاد غیر استاندارد ایجاد کند و از درجه بالایی از نور واقعی برخوردار است. علاوه بر این، امکان ترجمه تصویر به تصویر صفر شات را فراهم می کند، به این معنی که سبک، الگوها و جزئیات یک تصویر خروجی را می توان با حفظ شکل اولیه تصویر منبع بدون نیاز به تنظیم دقیق تغییر داد.
الگوریتم جدید به روشی متفاوت از Stable Diffusion. DeepFloyd از فضای پیکسل و مدل زبان بزرگ (LLM) استفاده می کند، در حالی که Stable Diffusion از فضای پنهان و یک مدل CLIP ثابت استفاده می کند. DeepFloyd همچنین از چندین فرآیند انتشار برای ایجاد تصاویر استفاده می کند Stable Diffusion فقط از یک واحد استفاده می کند.
DeepFloyd نام گروه تحقیقاتی سازنده الگوریتم است و خود الگوریتم IF نام دارد. گروه تحقیقاتی شامل بسیاری از همان افرادی است که خلق کرده اند GPT-3سلف، GPT-2و یک مدل زبان پیشرفته قبلی به نام RuGPT.
برخی گمانه زنی ها نشان می دهد که نام IF ممکن است از آهنگی به همین نام از پینک فلوید الهام گرفته شده باشد، همانطور که در بیوس رسانه های اجتماعی گروه تحقیقاتی الگوریتم اشاره شده است.
در مورد الگوریتم بیشتر بخوانید اینجا کلیک نمایید.
مقایسه محدودیتهای هنر هوش مصنوعی و هنر دیجیتال
یکی از محدودیتهای اصلی هوش مصنوعی متن است، اگرچه DeepFloyd با این مشکل مقابله میکند. محدودیت دیگر دشواری دریافت تصویر دقیقاً همانطور که تصور می شود، به خصوص بدون درخواست متخصص است. هوش مصنوعی همچنین فاقد توانایی درک و تفسیر است زمینه های فرهنگی و اجتماعی که هنر انسان را شکل می دهد. بنابراین، هنر تولید شده توسط هوش مصنوعی گاهی اوقات می تواند آثاری تولید کند که به نظر بی جا یا از نظر فرهنگی بی احساس به نظر می رسند.
آنگوس گفت، با این حال، تصاویر تولید شده توسط هوش مصنوعی همچنان میتوانند زیبا و گاهی حتی بهتر از ایده اصلی باشند، تا زمانی که کاربر آماده غافلگیری باشد. علاوه بر این، راه هایی برای اصلاح وجود دارد تصاویر تولید شده با استفاده از الگوریتم های هوش مصنوعی یا فتوشاپ. در حالی که در حال حاضر به دست آوردن یک تصویر دقیق یک منطقه تحقیقات فعال است، پیشرفت قابل توجهی در حال انجام است. ممکن است به زودی کنترل کامل بر تمام جنبه های یک تصویر امکان پذیر شود.
هوش مصنوعی به تصاویر و هنری که در وب به عنوان الهام وجود دارد، تکیه می کند، اما فقط به آنهایی که آموزش داده شده است. الگوریتم های مختلف مانند Midjourney، DALL-E و Stable Diffusion، روی مجموعه داده های مختلف آموزش دیده اند، به این معنی که ممکن است در انواع خاصی از تصاویر بهتر عمل کنند.
به تازگی، محققان تاثیر حذف تصاویر با کیفیت پایین از مجموعه داده های آموزشی را برای بهبود نتایج هوش مصنوعی بررسی کرده اند. با فیلتر کردن این تصاویر با کیفیت پایین، مجموعه دادههای حاصل ممکن است کوچکتر اما با کیفیتتر شوند و بدون افزایش اندازه مدلهای هوش مصنوعی یا نیاز به سختافزار گرانتر، به نتایج بهتری منجر شوند. Angus به اشتراک گذاشت که این رویکرد نشان دهنده روشی امیدوارکننده برای بهبود کیفیت تصاویر تولید شده توسط هوش مصنوعی بدون تکیه بر مدل های بزرگتر و با منابع فشرده تر است.
یکی از مسائل مربوط به هوش مصنوعی در هنر این است که ممکن است ارزش کار هنرمندان انسانی را که زمان زیادی را صرف خلق هنر میکنند بیارزش کند، در حالی که هوش مصنوعی میتواند در عرض چند ثانیه هنر تولید کند. با این حال، کیفیت ناملموس خاصی در هنر انسانی وجود دارد که ممکن است تکرار آن برای هوش مصنوعی دشوار باشد، مانند عمق احساسی و پیچیدگی که اغلب در آثار خلق شده توسط انسان وجود دارد. استودیو NightCafe معتقد است که هوش مصنوعی کمتر در مورد ایجاد هنر برای اهداف تجاری و بیشتر در مورد لذت بردن از خود فرآیند خلاق است.
"همیشه در هنر ساخته شده توسط انسان ارزش وجود خواهد داشت زیرا نشان دهنده تلاش و مهارت هنرمند است، در حالی که هنر تولید شده توسط هوش مصنوعی همان ارزش ذاتی را ندارد."
آنگوس گفت.
یکی از مسائل اخلاقی پیرامون هوش مصنوعی در هنر، استفاده از تصویر عمومی برای آموزش الگوریتمهای هوش مصنوعی است که ممکن است متعلق به شرکتی که هوش مصنوعی را آموزش میدهد نباشد. در حالی که در حال حاضر هیچ قانونی نقض نشده است، اما سؤالاتی در مورد رضایت و حفظ حریم خصوصی ایجاد می کند. شرکت های منبع باز دوست دارند OpenAI و DALL-E روی اخلاقیتر کردن فرآیند کار میکنند، اما این یک سوال باز باقی میماند. ممکن است مقررات آینده در مورد استفاده از تصاویر برای آموزش هوش مصنوعی در هنر وجود داشته باشد.
علیرغم این نگرانیها، آنگوس معتقد است که فرآیند هوش مصنوعی در هنر اساساً با هنرمندانی که از آثار هنرمندان دیگر الهام میگیرند، متفاوت نیست. هوش مصنوعی میداند که چیزها چگونه به نظر میرسند و مانند انسانها، بخشهایی از تصاویر را به خاطر میآورد. به سادگی بهتر است آنها را از ابتدا بازسازی کنید.
ادامه مطلب:
سلب مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
Agne روزنامه نگاری است که آخرین روندها و تحولات در متاورس، هوش مصنوعی و Web3 صنایع برای Metaverse Post. اشتیاق او به داستان نویسی باعث شده است که مصاحبه های متعددی با متخصصان این حوزه ها انجام دهد و همیشه به دنبال کشف داستان های هیجان انگیز و جذاب است. اگنه دارای مدرک لیسانس در ادبیات است و پیشینه گسترده ای در نوشتن در مورد طیف گسترده ای از موضوعات از جمله سفر، هنر و فرهنگ دارد. او همچنین به عنوان سردبیر برای سازمان حقوق حیوانات داوطلب شده است، جایی که به افزایش آگاهی در مورد مسائل رفاهی حیوانات کمک کرد. با او تماس بگیرید [ایمیل محافظت شده].
مقالات بیشترAgne روزنامه نگاری است که آخرین روندها و تحولات در متاورس، هوش مصنوعی و Web3 صنایع برای Metaverse Post. اشتیاق او به داستان نویسی باعث شده است که مصاحبه های متعددی با متخصصان این حوزه ها انجام دهد و همیشه به دنبال کشف داستان های هیجان انگیز و جذاب است. اگنه دارای مدرک لیسانس در ادبیات است و پیشینه گسترده ای در نوشتن در مورد طیف گسترده ای از موضوعات از جمله سفر، هنر و فرهنگ دارد. او همچنین به عنوان سردبیر برای سازمان حقوق حیوانات داوطلب شده است، جایی که به افزایش آگاهی در مورد مسائل رفاهی حیوانات کمک کرد. با او تماس بگیرید [ایمیل محافظت شده].