گزارش خبری تکنولوژی
ژوئن 19، 2023

SnapFusion: مدل سریع تبدیل متن به تصویر برای دستگاه های تلفن همراه در عرض 1.9 ثانیه

به طور خلاصه

SnapFusion ایجاد محتوا را با اجرا تغییر می دهد مدل های انتشار متن به تصویر به طور مستقیم در دستگاه های تلفن همراه، کاهش هزینه ها و رفع نگرانی های حفظ حریم خصوصی.

اسنپ ​​فیوژن یک مدل هوش مصنوعی متن به تصویر است که کاربران را قادر می‌سازد تا تصاویر خیره‌کننده‌ای را از توضیحات زبان طبیعی تولید کنند، همه اینها در عرض دو ثانیه در دستگاه‌های تلفن همراه خود. دوران تکیه بر پردازنده‌های گرافیکی پیشرفته یا سرویس‌های مبتنی بر ابر برای اجرای این مدل‌های پیچیده گذشته است. SnapFusion با قرار دادن قدرت انتشار متن به تصویر در دست کاربران، تولید محتوا را دموکراتیزه می کند.

SnapFusion: مدل سریع و کارآمد تبدیل متن به تصویر برای دستگاه های تلفن همراه در عرض 1.9 ثانیه
اعتبار: Midjourney / lili10292#2100

ایجاد تصاویر واقعی از توضیحات متنی همیشه یک کار چالش برانگیز بوده است. مدل های قبلی نیاز به معماری شبکه بزرگ و چندین تکرار حذف نویز، ساختن آنها از نظر محاسباتی گران و کند است. علاوه بر این، اجرای این مدل‌ها اغلب شامل ارسال داده‌های کاربر به سرویس‌های شخص ثالث، افزایش می‌شود نگرانی های حریم خصوصی.

برای مقابله با این چالش ها، سازندگان SnapFusion یک معماری شبکه کارآمد ایجاد کردند و فرآیند تقطیر مرحله ای را بهبود بخشیدند. آنها با شناسایی افزونگی‌ها در مدل اصلی، یک UNet کارآمد را معرفی کردند و محاسبات رمزگشای تصویر را کاهش دادند. تقطیر داده ها. علاوه بر این، آنها تقطیر مرحله ای را با کاوش در استراتژی های آموزشی و معرفی تکنیک های منظم سازی افزایش دادند.

SnapFusion: مدل سریع تبدیل متن به تصویر برای دستگاه های تلفن همراه در عرض 1.9 ثانیه
arxiv.org/pdf/2306.00980.pdf

آزمایش های گسترده بر روی مجموعه داده MS-COCO برتری SnapFusion را نشان داد. SnapFusion تنها با هشت مرحله حذف نویز، امتیازات FID و CLIP بهتری را در مقایسه با قبلی کسب کرد. مدل پیشرفته, Stable Diffusion نسخه 1.5 که به 50 مرحله نیاز داشت. این بهبود قابل توجه در کارایی و عملکرد، امکانات جدیدی را برای تولید محتوا باز می کند.

تاثیر SnapFusion فراتر از دستاوردهای فنی آن است. با دویدن مدل های انتشار متن به تصویر به طور مستقیم بر روی دستگاه های تلفن همراه، نیاز به پردازنده های گرافیکی گران قیمت و خدمات مبتنی بر ابر را از بین می برد. این نه تنها هزینه ها را کاهش می دهد، بلکه نگرانی های مربوط به حریم خصوصی مرتبط با ارسال داده های کاربر به اشخاص ثالث را نیز برطرف می کند. کاربران اکنون می توانند خلاقیت خود را رها کرده و تصاویری با کیفیت بالا در حال حرکت تولید کنند.

اندازه پارامتر مدل را می توان بیشتر کاهش داد تا با دستگاه های مختلف لبه سازگار شود. علاوه بر این، بهینه سازی مدل برای دستگاه های مختلف تلفن همراه به دستیابی به استنتاج سریع سرعت یک موضوع تحقیقاتی مداوم است.

استفاده مسئولانه از SnapFusion و فناوری های مشابه برای جلوگیری از برنامه های مخرب ضروری است. می‌توان اقداماتی را انجام داد، مانند سیستم‌های تشخیص خودکار که محتوای تصویری را که مقررات را نقض می‌کند شناسایی و پرچم‌گذاری می‌کند. با ایجاد تعادل بین نوآوری و ملاحظات اخلاقی، SnapFusion می‌تواند ایجاد محتوا را تغییر دهد و در عین حال تجربه کاربری ایمن و مسئولانه را تضمین کند.

درباره هوش مصنوعی بیشتر بخوانید:

رفع مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

آرامش قبل از طوفان سولانا: نمودارها، نهنگ‌ها و سیگنال‌های درون زنجیره‌ای اکنون چه می‌گویند؟

سولانا عملکرد قوی‌ای را نشان داده است که ناشی از افزایش پذیرش، علاقه نهادی و مشارکت‌های کلیدی است، در حالی که با پتانسیل ... روبرو است.

بیشتر بدانید

کریپتو در آوریل ۲۰۲۵: روندهای کلیدی، تغییرات و آنچه در آینده رخ خواهد داد

در آوریل ۲۰۲۵، فضای کریپتو بر تقویت زیرساخت‌های اصلی متمرکز شد و اتریوم برای Pectra آماده می‌شد...

بیشتر بدانید
ادامه مطلب
ادامه مطلب
گزارش CertiK برای سال ۲۰۲۶ نشان می‌دهد که بازارهای پیش‌بینی‌شده در بحبوحه خطرات امنیتی و مقررات جهانی پراکنده، وارد جریان اصلی می‌شوند.
گزارش خبری تکنولوژی
گزارش CertiK برای سال ۲۰۲۶ نشان می‌دهد که بازارهای پیش‌بینی‌شده در بحبوحه خطرات امنیتی و مقررات جهانی پراکنده، وارد جریان اصلی می‌شوند.
11 فوریه، 2026
اسپارک از مجموعه وام‌های نهادی خود برای هدایت ۹ میلیارد دلار نقدینگی استیبل کوین به امور مالی سنتی رونمایی کرد.
کسب و کار گزارش خبری
اسپارک از مجموعه وام‌های نهادی خود برای هدایت ۹ میلیارد دلار نقدینگی استیبل کوین به امور مالی سنتی رونمایی کرد.
11 فوریه، 2026
برنامه دو مرحله‌ای، ۵۰ سخنران، و نگاهی عمیق به سرمایه‌گذاری و امور مالی دیجیتال: نگاهی به دستور کار مدیریت دارایی HSC
فصل های هک کسب و کار شیوه زندگی بازارها گزارش خبری تکنولوژی
برنامه دو مرحله‌ای، ۵۰ سخنران، و نگاهی عمیق به سرمایه‌گذاری و امور مالی دیجیتال: نگاهی به دستور کار مدیریت دارایی HSC
11 فوریه، 2026
رابین‌هود شبکه آزمایشی لایه ۲ مبتنی بر آربیتروم را برای پیشرفت زیرساخت مالی درون‌زنجیره‌ای راه‌اندازی می‌کند
گزارش خبری تکنولوژی
رابین‌هود شبکه آزمایشی لایه ۲ مبتنی بر آربیتروم را برای پیشرفت زیرساخت مالی درون‌زنجیره‌ای راه‌اندازی می‌کند
11 فوریه، 2026
CRYPTOMERIA LABS PTE. محدود