گزارش خبری پیشرفته
ژانویه 08، 2023

VALL-E: مدل جدید تبدیل متن به گفتار صفر شات مایکروسافت می تواند صدای همه را در سه ثانیه کپی کند.

به طور خلاصه

مدل TTS مبتنی بر ترانسفورماتور تنها با یک نمونه سه ثانیه ای از هر صدا VALL-E می تواند گفتار را در هر صدا تولید کند.

این یک پیشرفت قابل توجه در جهت سیستم های TTS با صدای طبیعی تر است.

با این حال، مایکروسافت چند نمونه از مدل در حال استفاده را ارائه کرده است، و بدیهی است که این نشان دهنده پیشرفت قابل توجهی در فناوری TTS است.

از زمان انتشار اولین مدل تبدیل متن به گفتار (TTS)، محققان به دنبال راه‌هایی برای بهبود نحوه تولید گفتار این سیستم‌ها بوده‌اند. جدیدترین مدل مایکروسافت دره، گامی رو به جلو در این زمینه است.

VALL-E یک مدل TTS مبتنی بر ترانسفورماتور است که می تواند گفتار را در هر صدایی تنها پس از شنیدن یک نمونه سه ثانیه ای از آن صدا تولید کند. این یک پیشرفت قابل توجه نسبت به مدل های قبلی است که برای تولید صدای جدید به دوره آموزشی بسیار طولانی تری نیاز داشت.

VALL-E یک شاهکار فناوری شگفت انگیز است که پتانسیل تغییر نحوه تعامل ما با رسانه های دیجیتال را دارد.
مقاله مرتبط: مایکروسافت مدلی منتشر کرده است که می تواند یک آواتار سه بعدی از یک عکس یک شخص بسازد

علاوه بر این، لحن، کاریزما و سبک صدا همگی در گفتار تولید شده دست نخورده نگه داشته می شوند. این یک گام مهم به جلو در ایجاد صدای طبیعی تر سیستم های TTS است.

این مدل مبتنی بر ترانسفورماتور بوده و دارای ظاهری Dale-1 می باشد. نباید با Dalle-2 مبتنی بر انتشار اشتباه گرفته شود. کد هنوز وجود ندارد. و کاربران نسبت به ارسال آن تردید دارند.

مقاله مرتبط: به نظر می رسد VALL-E مایکروسافت خطرناک ترین نرم افزار کلاهبرداری تا کنون باشد

با این حال، مایکروسافت چند نمونه از این مدل را در عمل منتشر کرده است و واضح است که این یک پیشرفت بزرگ در فناوری TTS است.

مثال # 1:

مثال #2:

مثال # 3:

درباره هوش مصنوعی بیشتر بخوانید:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

در میان نوسانات، اشتهای سازمانی به سمت ETF های بیت کوین رشد می کند

افشاگری از طریق پرونده های 13F نشان می دهد که سرمایه گذاران نهادی قابل توجهی در ETF های بیت کوین مشغول هستند و بر پذیرش فزاینده ...

بیشتر بدانید

روز صدور حکم فرا می رسد: با بررسی دادگاه ایالات متحده به درخواست وزارت دادگستری، سرنوشت CZ در تعادل است

چانگ پنگ ژائو امروز در دادگاهی در سیاتل آمریکا محکوم خواهد شد.

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
Espresso Systems با Polygon Labs برای توسعه AggLayer برای افزایش قابلیت همکاری Rollup همکاری می کند.
کسب و کار گزارش خبری پیشرفته
Espresso Systems با Polygon Labs برای توسعه AggLayer برای افزایش قابلیت همکاری Rollup همکاری می کند.
ممکن است 9، 2024
پروتکل زیرساختی مبتنی بر ZKP ZKBase نقشه راه را رونمایی کرد، برنامه تست نت را در ماه مه راه اندازی کرد
گزارش خبری پیشرفته
پروتکل زیرساختی مبتنی بر ZKP ZKBase نقشه راه را رونمایی کرد، برنامه تست نت را در ماه مه راه اندازی کرد
ممکن است 9، 2024
BLOCKCHANCE و CONF3RENCE برای بزرگترین آلمان متحد می شوند Web3 کنفرانس دورتموند
کسب و کار بازارها نرم افزار داستان ها و نقدها پیشرفته
BLOCKCHANCE و CONF3RENCE برای بزرگترین آلمان متحد می شوند Web3 کنفرانس دورتموند
ممکن است 9، 2024
NuLink در Bybit راه اندازی می شود Web3 پلتفرم IDO. مرحله اشتراک تا 13 اردیبهشت تمدید شد
بازارها گزارش خبری پیشرفته
NuLink در Bybit راه اندازی می شود Web3 پلتفرم IDO. مرحله اشتراک تا 13 اردیبهشت تمدید شد
ممکن است 9، 2024
CRYPTOMERIA LABS PTE. محدود