گزارش خبری پیشرفته
ژوئن 19، 2023

SnapFusion: مدل سریع تبدیل متن به تصویر برای دستگاه های تلفن همراه در عرض 1.9 ثانیه

به طور خلاصه

SnapFusion ایجاد محتوا را با اجرا تغییر می دهد مدل های انتشار متن به تصویر به طور مستقیم در دستگاه های تلفن همراه، کاهش هزینه ها و رفع نگرانی های حفظ حریم خصوصی.

اسنپ ​​فیوژن یک مدل هوش مصنوعی متن به تصویر است که کاربران را قادر می‌سازد تا تصاویر خیره‌کننده‌ای را از توضیحات زبان طبیعی تولید کنند، همه اینها در عرض دو ثانیه در دستگاه‌های تلفن همراه خود. دوران تکیه بر پردازنده‌های گرافیکی پیشرفته یا سرویس‌های مبتنی بر ابر برای اجرای این مدل‌های پیچیده گذشته است. SnapFusion با قرار دادن قدرت انتشار متن به تصویر در دست کاربران، تولید محتوا را دموکراتیزه می کند.

SnapFusion: مدل سریع و کارآمد تبدیل متن به تصویر برای دستگاه های تلفن همراه در عرض 1.9 ثانیه
اعتبار: Midjourney / lili10292#2100

ایجاد تصاویر واقعی از توضیحات متنی همیشه یک کار چالش برانگیز بوده است. مدل های قبلی نیاز به معماری شبکه بزرگ و چندین تکرار حذف نویز، ساختن آنها از نظر محاسباتی گران و کند است. علاوه بر این، اجرای این مدل‌ها اغلب شامل ارسال داده‌های کاربر به سرویس‌های شخص ثالث، افزایش می‌شود نگرانی های حریم خصوصی.

برای مقابله با این چالش ها، سازندگان SnapFusion یک معماری شبکه کارآمد ایجاد کردند و فرآیند تقطیر مرحله ای را بهبود بخشیدند. آنها با شناسایی افزونگی‌ها در مدل اصلی، یک UNet کارآمد را معرفی کردند و محاسبات رمزگشای تصویر را کاهش دادند. تقطیر داده ها. علاوه بر این، آنها تقطیر مرحله ای را با کاوش در استراتژی های آموزشی و معرفی تکنیک های منظم سازی افزایش دادند.

arxiv.org/pdf/2306.00980.pdf

آزمایش های گسترده بر روی مجموعه داده MS-COCO برتری SnapFusion را نشان داد. SnapFusion تنها با هشت مرحله حذف نویز، امتیازات FID و CLIP بهتری را در مقایسه با قبلی کسب کرد. مدل پیشرفته, Stable Diffusion نسخه 1.5 که به 50 مرحله نیاز داشت. این بهبود قابل توجه در کارایی و عملکرد، امکانات جدیدی را برای تولید محتوا باز می کند.

تاثیر SnapFusion فراتر از دستاوردهای فنی آن است. با دویدن مدل های انتشار متن به تصویر به طور مستقیم بر روی دستگاه های تلفن همراه، نیاز به پردازنده های گرافیکی گران قیمت و خدمات مبتنی بر ابر را از بین می برد. این نه تنها هزینه ها را کاهش می دهد، بلکه نگرانی های مربوط به حریم خصوصی مرتبط با ارسال داده های کاربر به اشخاص ثالث را نیز برطرف می کند. کاربران اکنون می توانند خلاقیت خود را رها کرده و تصاویری با کیفیت بالا در حال حرکت تولید کنند.

اندازه پارامتر مدل را می توان بیشتر کاهش داد تا با دستگاه های مختلف لبه سازگار شود. علاوه بر این، بهینه سازی مدل برای دستگاه های مختلف تلفن همراه به دستیابی به استنتاج سریع سرعت یک موضوع تحقیقاتی مداوم است.

استفاده مسئولانه از SnapFusion و فناوری های مشابه برای جلوگیری از برنامه های مخرب ضروری است. می‌توان اقداماتی را انجام داد، مانند سیستم‌های تشخیص خودکار که محتوای تصویری را که مقررات را نقض می‌کند شناسایی و پرچم‌گذاری می‌کند. با ایجاد تعادل بین نوآوری و ملاحظات اخلاقی، SnapFusion می‌تواند ایجاد محتوا را تغییر دهد و در عین حال تجربه کاربری ایمن و مسئولانه را تضمین کند.

درباره هوش مصنوعی بیشتر بخوانید:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

در میان نوسانات، اشتهای سازمانی به سمت ETF های بیت کوین رشد می کند

افشاگری از طریق پرونده های 13F نشان می دهد که سرمایه گذاران نهادی قابل توجهی در ETF های بیت کوین مشغول هستند و بر پذیرش فزاینده ...

بیشتر بدانید

روز صدور حکم فرا می رسد: با بررسی دادگاه ایالات متحده به درخواست وزارت دادگستری، سرنوشت CZ در تعادل است

چانگ پنگ ژائو امروز در دادگاهی در سیاتل آمریکا محکوم خواهد شد.

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
زتا مارکت جامعه را آغاز می کند Airdrop، 1٪ از عرضه توکن Z را به جوامع سولانا اختصاص می دهد
بازارها گزارش خبری پیشرفته
زتا مارکت جامعه را آغاز می کند Airdrop، 1٪ از عرضه توکن Z را به جوامع سولانا اختصاص می دهد
ممکن است 8، 2024
اوراق قرضه دیجیتال مبتنی بر بلاک چین KfW: جهشی به سوی اکوسیستم مالی شفاف تر و کارآمدتر
کسب و کار نرم افزار داستان ها و نقدها پیشرفته
اوراق قرضه دیجیتال مبتنی بر بلاک چین KfW: جهشی به سوی اکوسیستم مالی شفاف تر و کارآمدتر
ممکن است 8، 2024
قانون بازنگری شده اهدای کمک های مالی کره جنوبی: آیا این یک گام به جلو یا عقب برای بشردوستی رمزنگاری است؟
رمزنگاری Wiki هضم کسب و کار بازارها پیشرفته
قانون بازنگری شده اهدای کمک های مالی کره جنوبی: آیا این یک گام به جلو یا عقب برای بشردوستی رمزنگاری است؟
ممکن است 8، 2024
هوش مصنوعی مولد در سال 2024: روندهای نوظهور، پیشرفت ها و چشم انداز آینده
AI Wiki نرم افزار داستان ها و نقدها پیشرفته
هوش مصنوعی مولد در سال 2024: روندهای نوظهور، پیشرفت ها و چشم انداز آینده
ممکن است 8، 2024
CRYPTOMERIA LABS PTE. محدود