گزارش خبری پیشرفته
سپتامبر 25، 2023

OpenAI" ChatGPT ارتقای عمده را رونمایی می کند، مکالمه صوتی و چت تصویری را اضافه می کند

به طور خلاصه

OpenAI قابلیت‌های صوتی و تصویری جدیدی را در اختیار شما قرار خواهد داد ChatGPT طی دو هفته آینده

این ویژگی‌ها فقط برای کاربران Plus و Enterprise در دسترس خواهند بود.

OpenAI امروز اعلام کرد که قابلیت‌های صوتی و تصویری جدیدی را در اختیار کاربران قرار می‌دهد ChatGPT. ویژگی‌های جدید به کاربران امکان می‌دهد با آنها مکالمه صوتی داشته باشند ChatGPT یا از طریق تصاویر با چت بات چت کنید.

این اعلامیه به دنبال ادعاهای کاربران Reddit است که ادعا می کردند به آن دسترسی پیدا کرده اند OpenAI's مدل ها و متعاقباً این اطلاعات را در پلتفرم به اشتراک گذاشت. Redditor FeltSteam یک مدل هوش مصنوعی با نام کاری Arrakis را توصیف کرد که طبق گزارش‌ها به کاربران اجازه می‌دهد «هر ترکیبی از متن، صدا و ویدیو را وارد کنند».

Open AI در نامه ای نوشت: «قابلیت صوتی جدید با یک مدل جدید تبدیل متن به گفتار، که قادر به تولید صدای انسان مانند فقط از متن و چند ثانیه نمونه گفتار است، ارائه می شود. پست های وبلاگ. ما با صداپیشگان حرفه ای برای ایجاد هر یک از صداها همکاری کردیم. ما همچنین از Whisper، سیستم تشخیص گفتار منبع باز خود، برای رونویسی کلمات گفتاری شما به متن استفاده می کنیم.

با ویژگی های جدید، کاربران می توانند در یک مکالمه رفت و برگشت با آن شرکت کنند ChatGPT با استفاده از صدای آنها آنها همچنین می توانند در مورد تصاویر با چت بات بحث کنند. این ویژگی ها طی دو هفته آینده برای کاربران Plus و Enterprise ارائه می شود.

قابلیت صوتی به‌عنوان یک گزینه انتخابی برای iOS و Android ارائه می‌شود در حالی که ویژگی تصویر در همه پلتفرم‌ها در دسترس خواهد بود.

برای شروع استفاده از عملکرد صوتی، کاربران می توانند به تنظیمات → ویژگی های جدید در برنامه تلفن همراه رفته و «مکالمات صوتی» را انتخاب کنند. در مرحله بعد، کاربر باید روی دکمه هدفون موجود در گوشه سمت راست بالای صفحه اصلی ضربه بزند و صدای دلخواه خود را از پنج صدای مختلف انتخاب کند.

برای گفتگو با ChatGPT از طریق تصاویر، کاربر می تواند روی دکمه عکس ضربه بزند تا یک تصویر را بگیرد یا یکی را انتخاب کند. اگر از iOS یا Android استفاده می کنید، قبل از ادامه روی دکمه پلاس ضربه بزنید. علاوه بر این، آن‌ها می‌توانند در بحث‌هایی با تصاویر متعدد شرکت کنند یا از آنها برای هدایت ربات چت استفاده کنند.

OpenAI می گوید که درک تصویر توسط چند وجهی ایجاد می شود GPT-3.5 و GPT-4. این مدل‌ها از توانایی‌های استدلال زبان برای تجزیه و تحلیل مجموعه‌ای از محتوای بصری، شامل عکس‌ها، اسکرین‌شات‌ها و اسناد حاوی ترکیبی از متن و تصاویر استفاده می‌کنند.

OpenAIمشارکت با Spotify

Spotify نیز امروز اعلام کرد ویژگی ترجمه صوتی آن با هوش مصنوعی. ویژگی جدید می‌تواند پادکست‌ها را با استفاده از صدای اصلی پادکست به زبان‌های مختلف ترجمه کند.

مطابق با در آستانه، این ویژگی ترجمه متکی است OpenAIابزار رونویسی صدای Whisper که قادر به رونویسی گفتار انگلیسی و ترجمه زبان های مختلف به انگلیسی است.

به عنوان بخشی از آزمایشی، این شرکت با پادکست‌های Dax Shepard، Monica Padman، Lex Fridman، Bill Simmons و Steven Bartlett همکاری کرده است تا ترجمه‌های صوتی مبتنی بر هوش مصنوعی را به زبان‌هایی مانند اسپانیایی، فرانسوی و آلمانی برای قسمت‌های کاتالوگ خاص و آینده ایجاد کند. منتشر شده.

زیاد سلطان، معاون شخصی سازی در اسپاتیفای در بیانیه ای گفت: «ما معتقدیم که یک رویکرد متفکرانه به هوش مصنوعی می تواند به ایجاد ارتباطات عمیق تر بین شنوندگان و سازندگان کمک کند، یکی از اجزای اصلی ماموریت Spotify برای باز کردن پتانسیل خلاقیت انسان».

قسمت‌های ترجمه‌شده صوتی از سازندگان آزمایشی در سراسر جهان برای کاربران Premium و Free در دسترس خواهد بود.

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

سیندی یک روزنامه نگار در Metaverse Post، پوشش موضوعات مرتبط با web3, NFT، متاورس و هوش مصنوعی، با تمرکز بر مصاحبه با Web3 بازیگران صنعت او با بیش از 30 مدیر اجرایی در سطح C صحبت کرده است و بینش ارزشمند آنها را برای خوانندگان به ارمغان آورده است. سیندی که اصالتاً اهل سنگاپور است، اکنون در تفلیس، گرجستان مستقر است. او دارای مدرک لیسانس در مطالعات ارتباطات و رسانه از دانشگاه استرالیای جنوبی است و یک دهه تجربه در روزنامه نگاری و نویسندگی دارد. از طریق با او در تماس باشید [ایمیل محافظت شده] با میزهای مطبوعاتی، اطلاعیه ها و فرصت های مصاحبه.

مقالات بیشتر
سیندی تان
سیندی تان

سیندی یک روزنامه نگار در Metaverse Post، پوشش موضوعات مرتبط با web3, NFT، متاورس و هوش مصنوعی، با تمرکز بر مصاحبه با Web3 بازیگران صنعت او با بیش از 30 مدیر اجرایی در سطح C صحبت کرده است و بینش ارزشمند آنها را برای خوانندگان به ارمغان آورده است. سیندی که اصالتاً اهل سنگاپور است، اکنون در تفلیس، گرجستان مستقر است. او دارای مدرک لیسانس در مطالعات ارتباطات و رسانه از دانشگاه استرالیای جنوبی است و یک دهه تجربه در روزنامه نگاری و نویسندگی دارد. از طریق با او در تماس باشید [ایمیل محافظت شده] با میزهای مطبوعاتی، اطلاعیه ها و فرصت های مصاحبه.

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

از Ripple تا The Big Green DAO: چگونه پروژه های ارزهای دیجیتال به خیریه کمک می کنند

بیایید طرح‌هایی را بررسی کنیم که از پتانسیل ارزهای دیجیتال برای اهداف خیریه استفاده می‌کنند.

بیشتر بدانید

AlphaFold 3، Med-Gemini، و دیگران: روشی که هوش مصنوعی مراقبت های بهداشتی را در سال 2024 متحول می کند

هوش مصنوعی به روش های مختلفی در مراقبت های بهداشتی ظاهر می شود، از کشف همبستگی های ژنتیکی جدید تا توانمندسازی سیستم های جراحی رباتیک...

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
شبکه Manta Staking بومی را معرفی می کند و به کاربران امکان می دهد MANTA را با Omni Liquid Staking به اشتراک بگذارند.
بازارها گزارش خبری پیشرفته
شبکه Manta Staking بومی را معرفی می کند و به کاربران امکان می دهد MANTA را با Omni Liquid Staking به اشتراک بگذارند.
ممکن است 15، 2024
بلومبرگ: فاز ادغام پس از نصف شدن قبل از اینکه بیت کوین به اوج خود برسد
بازارها گزارش خبری پیشرفته
بلومبرگ: فاز ادغام پس از نصف شدن قبل از اینکه بیت کوین به اوج خود برسد
ممکن است 15، 2024
Vitalik Buterin پیشنهاد EIP-7706 را برای معرفی نوع جدیدی از گاز برای Calldata تراکنش اتریوم منتشر کرد.
گزارش خبری پیشرفته
Vitalik Buterin پیشنهاد EIP-7706 را برای معرفی نوع جدیدی از گاز برای Calldata تراکنش اتریوم منتشر کرد.
ممکن است 14، 2024
هشدار می دهد که توکن WLD Worldcoin برای مواجهه با فشار فروش تهاجمی با بازگشایی های بیشتر در ماه های آینده DeFi2 بایت معامله گر
بازارها گزارش خبری پیشرفته
هشدار می دهد که توکن WLD Worldcoin برای مواجهه با فشار فروش تهاجمی با بازگشایی های بیشتر در ماه های آینده DeFi2 بایت معامله گر
ممکن است 14، 2024
CRYPTOMERIA LABS PTE. محدود