متا یک هوش مصنوعی گفتاری متن باز ساخته است که بیش از 4,000 زبان گفتاری را می شناسد
به طور خلاصه
پروژه MMS این شرکت می تواند بیش از 4,000 زبان را تشخیص دهد.
مانند بسیاری دیگر از پروژه های هوش مصنوعی اعلام شده عمومی، متا مدل ها و کدهای خود را برای کمک به حفظ تنوع زبان به اشتراک می گذارد.
از طریق این کار، آنها امیدوارند که سهم کوچکی در حفظ تنوع زبانی باورنکردنی در جهان داشته باشند.
متا ایجاد کرده است یک مدل زبان هوش مصنوعی که یک پیچ و تاب تازه است ChatGPT. منبع باز پروژه MMS برای حفظ تنوع زبان و تشویق تحقیقات ایجاد شده است و می تواند بیش از 4,000 زبان گفتاری را تشخیص دهد و متن (گفتار) را در بیش از 1,100 تولید کند. شرکت دارد به صورت عمومی منتشر شد مدل ها و کدهای امروزی آن برای پیشبرد اهدافش.
متا نوشت: «ما بهطور عمومی خلاقیتها و کدهای خود را به اشتراک میگذاریم تا دیگران را در جامعه تحقیقاتی تشویق کنیم تا بر اساس کار ما کار کنند. "از طریق این تلاش، ما امیدواریم که تنوع زبانی فوق العاده جهان را حفظ کنیم."
دشواری آموزش تشخیصدهندههای گفتار و مدلهای تبدیل متن به گفتار در مقادیر زیاد صدا بدون برچسب رونویسی معمولی است. برچسب ها برای آن بسیار مهم هستند فراگیری ماشین، که می تواند داده ها را به درستی شناسایی و طبقه بندی کند. با این حال، همانطور که متا توضیح می دهد، برای زبان هایی که در دهه های آینده ناپدید می شوند، "این داده ها به سادگی وجود ندارند".
متا از ضبطهای صوتی متون مذهبی برای جمعآوری دادهها به شیوهای غیر متعارف استفاده میکرد. این شرکت گفت: «ما از ترجمه متون مذهبی مانند کتاب مقدس استفاده کردیم، که به طور گسترده برای تحقیق ترجمه زبان مبتنی بر متن در بسیاری از زبانها مورد مطالعه قرار گرفتهاند، زیرا به زبانهای مختلف ترجمه شدهاند. ما ضبطهای صوتی افرادی را که این متون را به زبانهای مختلف میخوانند، از ترجمههای در دسترس عموم استخراج کردیم.» محققان متا بیش از 4,000 زبان را به آن اضافه کردند مدل.
این رویکرد مانند دستور العملی برای یک مدل هوش مصنوعی به شدت مغرضانه به نظر می رسد که از جهان بینی مسیحی حمایت می کند. با این حال، قبل از اینکه ایده را مسخره کنید، آن را از دیدگاه متا در نظر بگیرید: محققان بر این باورند که این موضوع به این دلیل است که آنها از یک طبقهبندی زمانی CTC پیوندگرا (یا مدل توالی به دنباله یا نوع توالی) استفاده میکنند که از نظر شرایط بسیار محدودتر است. قدرت محاسباتی در مقایسه با مدل های زبان بزرگ (همچنین به عنوان انواع توالی شناخته می شود) یا مدل های متوالی برای تشخیص گفتار. متا میگوید که این امر منجر به سوگیری مردانه در ضبطهای مذهبی ضبط شده توسط اکثر سخنرانان مرد نشده است.
متا از wav2vec 2.0، یک مدل "یادگیری بازنمایی گفتار خود نظارت" برای آموزش wav2vec 2.0 استفاده کرد. مدل تراز که داده ها را قابل استفاده تر می کند. مدل گفتار خود نظارتی که متا از دادههای بدون برچسب خود نظارت کرد، به نتایج عالی منجر شد. متا دریافت که مدلهای گفتاری بسیار چندزبانه در مقایسه با مدلهای موجود عملکرد خوبی داشتند و 10 برابر بیشتر زبانها را پوشش میدادند، به ویژه در مقایسه با نجوا. متا به نیمی از نرخ خطای کلمات دست یافت، در حالی که Massively Multilingual Speech 11 برابر بیشتر زبان ها را پوشش داد.
متا میگوید که مدلهای گفتار به نوشتار جدید آن بینقص نیستند. به عنوان مثال، آنها ممکن است کلمات یا عباراتی را اشتباه ترجمه کنند، که می تواند منجر به گفتار توهین آمیز و/یا نادرست شود. توسعه مسئولانه فناوری های هوش مصنوعی باید از طریق همکاری بین جامعه هوش مصنوعی انجام شود.
همانطور که متا MMS را برای تحقیقات منبع باز منتشر کرده است، امیدوار است که بتواند روند ناپدید شدن استفاده از زبان را معکوس کند. در این دیدگاه، فناوری کمکی، TTS، و حتی فناوری واقعیت مجازی و واقعیت افزوده ممکن است به همه اجازه دهد تا به زبان مادری خود صحبت کنند و یاد بگیرند. در این بیانیه آمده است: «ما دنیایی را تصور میکنیم که در آن فناوری تأثیر معکوس دارد و مردم را ترغیب میکند تا زبان خود را زنده نگه دارند، زیرا میتوانند با صحبت کردن به زبان دلخواه خود به اطلاعات دسترسی داشته باشند و از فناوری استفاده کنند.»
- اخیرا متا اعلام کرده است نتایج مالی برای سه ماهه اول سال 2023. علیرغم تلاشهای اخیر برای بازسازی، این شرکت سرمایهگذاران را با افزایش غیرمنتظره فروش در سه ماهه اول غافلگیر کرد. سهام در روز چهارشنبه 12 درصد افزایش یافت.
مقالات مرتبط بیشتر را بخوانید:
- 4,000 نفر بدون اینکه بدانند تحت روان درمانی ربات هوش مصنوعی قرار گرفتند
- مختل کردن اختلال: چگونه پلاک تله پورت استیج متا آدرس های متاورس را در اختیار خواهد گرفت.
- FTC با شکایتی از جاه طلبی های متا VR جلوگیری می کند
سلب مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.
مقالات بیشترDamir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.