گزارش خبری پیشرفته
ممکن است 23، 2023

متا یک هوش مصنوعی گفتاری متن باز ساخته است که بیش از 4,000 زبان گفتاری را می شناسد

به طور خلاصه

پروژه MMS این شرکت می تواند بیش از 4,000 زبان را تشخیص دهد.

مانند بسیاری دیگر از پروژه های هوش مصنوعی اعلام شده عمومی، متا مدل ها و کدهای خود را برای کمک به حفظ تنوع زبان به اشتراک می گذارد.

از طریق این کار، آنها امیدوارند که سهم کوچکی در حفظ تنوع زبانی باورنکردنی در جهان داشته باشند.

متا ایجاد کرده است یک مدل زبان هوش مصنوعی که یک پیچ و تاب تازه است ChatGPT. منبع باز پروژه MMS برای حفظ تنوع زبان و تشویق تحقیقات ایجاد شده است و می تواند بیش از 4,000 زبان گفتاری را تشخیص دهد و متن (گفتار) را در بیش از 1,100 تولید کند. شرکت دارد به صورت عمومی منتشر شد مدل ها و کدهای امروزی آن برای پیشبرد اهدافش.

متا نوشت: «ما به‌طور عمومی خلاقیت‌ها و کدهای خود را به اشتراک می‌گذاریم تا دیگران را در جامعه تحقیقاتی تشویق کنیم تا بر اساس کار ما کار کنند. "از طریق این تلاش، ما امیدواریم که تنوع زبانی فوق العاده جهان را حفظ کنیم."

متا یک هوش مصنوعی گفتاری متن باز ساخته است که بیش از 4,000 زبان گفتاری را می شناسد

دشواری آموزش تشخیص‌دهنده‌های گفتار و مدل‌های تبدیل متن به گفتار در مقادیر زیاد صدا بدون برچسب رونویسی معمولی است. برچسب ها برای آن بسیار مهم هستند فراگیری ماشین، که می تواند داده ها را به درستی شناسایی و طبقه بندی کند. با این حال، همانطور که متا توضیح می دهد، برای زبان هایی که در دهه های آینده ناپدید می شوند، "این داده ها به سادگی وجود ندارند".

متا از ضبط‌های صوتی متون مذهبی برای جمع‌آوری داده‌ها به شیوه‌ای غیر متعارف استفاده می‌کرد. این شرکت گفت: «ما از ترجمه متون مذهبی مانند کتاب مقدس استفاده کردیم، که به طور گسترده برای تحقیق ترجمه زبان مبتنی بر متن در بسیاری از زبان‌ها مورد مطالعه قرار گرفته‌اند، زیرا به زبان‌های مختلف ترجمه شده‌اند. ما ضبط‌های صوتی افرادی را که این متون را به زبان‌های مختلف می‌خوانند، از ترجمه‌های در دسترس عموم استخراج کردیم.» محققان متا بیش از 4,000 زبان را به آن اضافه کردند مدل.

این رویکرد مانند دستور العملی برای یک مدل هوش مصنوعی به شدت مغرضانه به نظر می رسد که از جهان بینی مسیحی حمایت می کند. با این حال، قبل از اینکه ایده را مسخره کنید، آن را از دیدگاه متا در نظر بگیرید: محققان بر این باورند که این موضوع به این دلیل است که آنها از یک طبقه‌بندی زمانی CTC پیوندگرا (یا مدل توالی به دنباله یا نوع توالی) استفاده می‌کنند که از نظر شرایط بسیار محدودتر است. قدرت محاسباتی در مقایسه با مدل های زبان بزرگ (همچنین به عنوان انواع توالی شناخته می شود) یا مدل های متوالی برای تشخیص گفتار. متا می‌گوید که این امر منجر به سوگیری مردانه در ضبط‌های مذهبی ضبط شده توسط اکثر سخنرانان مرد نشده است.

متا از wav2vec 2.0، یک مدل "یادگیری بازنمایی گفتار خود نظارت" برای آموزش wav2vec 2.0 استفاده کرد. مدل تراز که داده ها را قابل استفاده تر می کند. مدل گفتار خود نظارتی که متا از داده‌های بدون برچسب خود نظارت کرد، به نتایج عالی منجر شد. متا دریافت که مدل‌های گفتاری بسیار چندزبانه در مقایسه با مدل‌های موجود عملکرد خوبی داشتند و 10 برابر بیشتر زبان‌ها را پوشش می‌دادند، به ویژه در مقایسه با نجوا. متا به نیمی از نرخ خطای کلمات دست یافت، در حالی که Massively Multilingual Speech 11 برابر بیشتر زبان ها را پوشش داد.

متا می‌گوید که مدل‌های گفتار به نوشتار جدید آن بی‌نقص نیستند. به عنوان مثال، آنها ممکن است کلمات یا عباراتی را اشتباه ترجمه کنند، که می تواند منجر به گفتار توهین آمیز و/یا نادرست شود. توسعه مسئولانه فناوری های هوش مصنوعی باید از طریق همکاری بین جامعه هوش مصنوعی انجام شود.

همانطور که متا MMS را برای تحقیقات منبع باز منتشر کرده است، امیدوار است که بتواند روند ناپدید شدن استفاده از زبان را معکوس کند. در این دیدگاه، فناوری کمکی، TTS، و حتی فناوری واقعیت مجازی و واقعیت افزوده ممکن است به همه اجازه دهد تا به زبان مادری خود صحبت کنند و یاد بگیرند. در این بیانیه آمده است: «ما دنیایی را تصور می‌کنیم که در آن فناوری تأثیر معکوس دارد و مردم را ترغیب می‌کند تا زبان خود را زنده نگه دارند، زیرا می‌توانند با صحبت کردن به زبان دلخواه خود به اطلاعات دسترسی داشته باشند و از فناوری استفاده کنند.»

  • اخیرا متا اعلام کرده است نتایج مالی برای سه ماهه اول سال 2023. علیرغم تلاش‌های اخیر برای بازسازی، این شرکت سرمایه‌گذاران را با افزایش غیرمنتظره فروش در سه ماهه اول غافلگیر کرد. سهام در روز چهارشنبه 12 درصد افزایش یافت.

مقالات مرتبط بیشتر را بخوانید:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

در میان نوسانات، اشتهای سازمانی به سمت ETF های بیت کوین رشد می کند

افشاگری از طریق پرونده های 13F نشان می دهد که سرمایه گذاران نهادی قابل توجهی در ETF های بیت کوین مشغول هستند و بر پذیرش فزاینده ...

بیشتر بدانید

روز صدور حکم فرا می رسد: با بررسی دادگاه ایالات متحده به درخواست وزارت دادگستری، سرنوشت CZ در تعادل است

چانگ پنگ ژائو امروز در دادگاهی در سیاتل آمریکا محکوم خواهد شد.

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
Injective با AltLayer نیروها را به هم می پیوندد تا امنیت مجدد را به inEVM بیاورد
کسب و کار گزارش خبری پیشرفته
Injective با AltLayer نیروها را به هم می پیوندد تا امنیت مجدد را به inEVM بیاورد
ممکن است 3، 2024
Masa با Teller همکاری می کند تا استخر وام MASA را معرفی کند، وام USDC را بر اساس امکان پذیر می کند
بازارها گزارش خبری پیشرفته
Masa با Teller همکاری می کند تا استخر وام MASA را معرفی کند، وام USDC را بر اساس امکان پذیر می کند
ممکن است 3، 2024
Velodrome نسخه بتا سوپرچین را در هفته‌های آینده عرضه می‌کند و در سراسر بلاک‌چین‌های OP Stack Layer 2 گسترش می‌یابد
بازارها گزارش خبری پیشرفته
Velodrome نسخه بتا سوپرچین را در هفته‌های آینده عرضه می‌کند و در سراسر بلاک‌چین‌های OP Stack Layer 2 گسترش می‌یابد
ممکن است 3، 2024
CARV شراکت با Aethir را برای تمرکززدایی لایه داده خود و توزیع جوایز اعلام می کند.
کسب و کار گزارش خبری پیشرفته
CARV شراکت با Aethir را برای تمرکززدایی لایه داده خود و توزیع جوایز اعلام می کند.
ممکن است 3، 2024
CRYPTOMERIA LABS PTE. محدود