OpenAI" ChatGPT ارتقای عمده را رونمایی می کند، مکالمه صوتی و چت تصویری را اضافه می کند
به طور خلاصه
OpenAI قابلیتهای صوتی و تصویری جدیدی را در اختیار شما قرار خواهد داد ChatGPT طی دو هفته آینده
این ویژگیها فقط برای کاربران Plus و Enterprise در دسترس خواهند بود.
OpenAI امروز اعلام کرد که قابلیتهای صوتی و تصویری جدیدی را در اختیار کاربران قرار میدهد ChatGPT. ویژگیهای جدید به کاربران امکان میدهد با آنها مکالمه صوتی داشته باشند ChatGPT یا از طریق تصاویر با چت بات چت کنید.
این اعلامیه به دنبال ادعاهای کاربران Reddit است که ادعا می کردند به آن دسترسی پیدا کرده اند OpenAI's مدل ها و متعاقباً این اطلاعات را در پلتفرم به اشتراک گذاشت. Redditor FeltSteam یک مدل هوش مصنوعی با نام کاری Arrakis را توصیف کرد که طبق گزارشها به کاربران اجازه میدهد «هر ترکیبی از متن، صدا و ویدیو را وارد کنند».
Open AI در نامه ای نوشت: «قابلیت صوتی جدید با یک مدل جدید تبدیل متن به گفتار، که قادر به تولید صدای انسان مانند فقط از متن و چند ثانیه نمونه گفتار است، ارائه می شود. پست های وبلاگ. ما با صداپیشگان حرفه ای برای ایجاد هر یک از صداها همکاری کردیم. ما همچنین از Whisper، سیستم تشخیص گفتار منبع باز خود، برای رونویسی کلمات گفتاری شما به متن استفاده می کنیم.
من برخی گمانه زنی های تایید نشده عجیب و غریب در مورد مدل های داخلی قدرتمند در Reddit پیدا کردم.
— Yam Peleg (@Yampeleg) سپتامبر 25، 2023
- لطفا همه را با یک دانه نمک مصرف کنید. –
ظاهرا،
دو کاربر مختلف ادعا می کنند که به آن دسترسی پیدا کرده اند OpenAIمدل های داخلی هستند و اطلاعات را در reddit به اشتراک می گذارند.
فلت استیم… pic.twitter.com/JRJH4xADZX
با ویژگی های جدید، کاربران می توانند در یک مکالمه رفت و برگشت با آن شرکت کنند ChatGPT با استفاده از صدای آنها آنها همچنین می توانند در مورد تصاویر با چت بات بحث کنند. این ویژگی ها طی دو هفته آینده برای کاربران Plus و Enterprise ارائه می شود.
قابلیت صوتی بهعنوان یک گزینه انتخابی برای iOS و Android ارائه میشود در حالی که ویژگی تصویر در همه پلتفرمها در دسترس خواهد بود.
برای شروع استفاده از عملکرد صوتی، کاربران می توانند به تنظیمات → ویژگی های جدید در برنامه تلفن همراه رفته و «مکالمات صوتی» را انتخاب کنند. در مرحله بعد، کاربر باید روی دکمه هدفون موجود در گوشه سمت راست بالای صفحه اصلی ضربه بزند و صدای دلخواه خود را از پنج صدای مختلف انتخاب کند.
برای گفتگو با ChatGPT از طریق تصاویر، کاربر می تواند روی دکمه عکس ضربه بزند تا یک تصویر را بگیرد یا یکی را انتخاب کند. اگر از iOS یا Android استفاده می کنید، قبل از ادامه روی دکمه پلاس ضربه بزنید. علاوه بر این، آنها میتوانند در بحثهایی با تصاویر متعدد شرکت کنند یا از آنها برای هدایت ربات چت استفاده کنند.
OpenAI می گوید که درک تصویر توسط چند وجهی ایجاد می شود GPT-3.5 و GPT-4. این مدلها از تواناییهای استدلال زبان برای تجزیه و تحلیل مجموعهای از محتوای بصری، شامل عکسها، اسکرینشاتها و اسناد حاوی ترکیبی از متن و تصاویر استفاده میکنند.
OpenAIمشارکت با Spotify
Spotify نیز امروز اعلام کرد ویژگی ترجمه صوتی آن با هوش مصنوعی. ویژگی جدید میتواند پادکستها را با استفاده از صدای اصلی پادکست به زبانهای مختلف ترجمه کند.
مطابق با در آستانه، این ویژگی ترجمه متکی است OpenAIابزار رونویسی صدای Whisper که قادر به رونویسی گفتار انگلیسی و ترجمه زبان های مختلف به انگلیسی است.
به عنوان بخشی از آزمایشی، این شرکت با پادکستهای Dax Shepard، Monica Padman، Lex Fridman، Bill Simmons و Steven Bartlett همکاری کرده است تا ترجمههای صوتی مبتنی بر هوش مصنوعی را به زبانهایی مانند اسپانیایی، فرانسوی و آلمانی برای قسمتهای کاتالوگ خاص و آینده ایجاد کند. منتشر شده.
زیاد سلطان، معاون شخصی سازی در اسپاتیفای در بیانیه ای گفت: «ما معتقدیم که یک رویکرد متفکرانه به هوش مصنوعی می تواند به ایجاد ارتباطات عمیق تر بین شنوندگان و سازندگان کمک کند، یکی از اجزای اصلی ماموریت Spotify برای باز کردن پتانسیل خلاقیت انسان».
قسمتهای ترجمهشده صوتی از سازندگان آزمایشی در سراسر جهان برای کاربران Premium و Free در دسترس خواهد بود.
سلب مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
سیندی یک روزنامه نگار در Metaverse Post، پوشش موضوعات مرتبط با web3, NFT، متاورس و هوش مصنوعی، با تمرکز بر مصاحبه با Web3 بازیگران صنعت او با بیش از 30 مدیر اجرایی در سطح C صحبت کرده است و بینش ارزشمند آنها را برای خوانندگان به ارمغان آورده است. سیندی که اصالتاً اهل سنگاپور است، اکنون در تفلیس، گرجستان مستقر است. او دارای مدرک لیسانس در مطالعات ارتباطات و رسانه از دانشگاه استرالیای جنوبی است و یک دهه تجربه در روزنامه نگاری و نویسندگی دارد. از طریق با او در تماس باشید [ایمیل محافظت شده] با میزهای مطبوعاتی، اطلاعیه ها و فرصت های مصاحبه.
مقالات بیشترسیندی یک روزنامه نگار در Metaverse Post، پوشش موضوعات مرتبط با web3, NFT، متاورس و هوش مصنوعی، با تمرکز بر مصاحبه با Web3 بازیگران صنعت او با بیش از 30 مدیر اجرایی در سطح C صحبت کرده است و بینش ارزشمند آنها را برای خوانندگان به ارمغان آورده است. سیندی که اصالتاً اهل سنگاپور است، اکنون در تفلیس، گرجستان مستقر است. او دارای مدرک لیسانس در مطالعات ارتباطات و رسانه از دانشگاه استرالیای جنوبی است و یک دهه تجربه در روزنامه نگاری و نویسندگی دارد. از طریق با او در تماس باشید [ایمیل محافظت شده] با میزهای مطبوعاتی، اطلاعیه ها و فرصت های مصاحبه.