تقرير الأخبار تكنولوجيا
25 سبتمبر 2023

OpenAIالصورة ChatGPT يكشف النقاب عن ترقية رئيسية ويضيف المحادثة الصوتية والدردشة المصورة

في سطور

OpenAI سيتم طرح إمكانات الصوت والصورة الجديدة في ChatGPT خلال الاسبوعين المقبلين.

ستكون هذه الميزات متاحة فقط لمستخدمي Plus وEnterprise.

OpenAI أعلنت اليوم أنها ستطرح إمكانات جديدة للصوت والصورة في ChatGPT. ستسمح الميزات الجديدة للمستخدمين بإجراء محادثة صوتية معهم ChatGPT أو الدردشة مع الشات بوت من خلال الصور.

يأتي هذا الإعلان في أعقاب ادعاءات مستخدمي Reddit الذين زعموا أنهم تمكنوا من الوصول إلى OpenAIنماذج ثم قاموا بعد ذلك بمشاركة هذه المعلومات على المنصة. وصف موقع Redditor FeltSteam نموذجًا للذكاء الاصطناعي يحمل الاسم العملي Arrakis، والذي يقال إنه يسمح للمستخدمين "بإدخال أي مجموعة من النصوص والصوت والفيديو".

"إن القدرة الصوتية الجديدة مدعومة بنموذج جديد لتحويل النص إلى كلام، قادر على توليد صوت يشبه الإنسان من نص فقط وبضع ثوان من عينة الكلام"، كتب Open AI في مقال: بلوق وظيفة. "لقد تعاونا مع ممثلين صوتيين محترفين لإنشاء كل صوت. نحن نستخدم أيضًا Whisper، وهو نظام التعرف على الكلام مفتوح المصدر الخاص بنا، لتحويل كلماتك المنطوقة إلى نص.

ومع الميزات الجديدة، يمكن للمستخدمين المشاركة في محادثة ذهابًا وإيابًا معه ChatGPT باستخدام أصواتهم. يمكنهم أيضًا مناقشة الصور باستخدام برنامج الدردشة الآلي. سيتم طرح الميزات خلال الأسبوعين المقبلين لمستخدمي Plus وEnterprise.

ستتوفر القدرة الصوتية على نظامي iOS وAndroid كاشتراك بينما ستكون ميزة الصورة متاحة على جميع الأنظمة الأساسية.

لبدء استخدام الوظيفة الصوتية، يمكن للمستخدمين التوجه إلى الإعدادات → الميزات الجديدة في تطبيق الهاتف المحمول واختيار "المحادثات الصوتية". بعد ذلك، يجب على المستخدم النقر على زر سماعة الرأس الموجود في الزاوية العلوية اليمنى من الشاشة الرئيسية واختيار صوته المفضل من بين مجموعة مختارة من خمسة أصوات مختلفة.

للتحدث مع ChatGPT من خلال الصور، يمكن للمستخدم النقر على زر الصورة لالتقاط صورة أو اختيار واحدة. إذا كنت تستخدم iOS أو Android، فانقر فوق زر علامة الجمع قبل المتابعة. بالإضافة إلى ذلك، يمكنهم المشاركة في المناقشات باستخدام صور متعددة أو استخدامها لتوجيه برنامج الدردشة الآلي.

OpenAI يقول أن فهم الصورة مدعوم بالوسائط المتعددة GPT-3. و5 GPT-4. تستفيد هذه النماذج من قدرات التفكير اللغوي لتحليل مجموعة متنوعة من المحتوى المرئي، بما في ذلك الصور الفوتوغرافية ولقطات الشاشة والمستندات التي تحتوي على مجموعة من النصوص والصور.

OpenAIشراكة مع سبوتيفي

سبوتيفي أيضا اليوم ميزة الترجمة الصوتية المدعومة بالذكاء الاصطناعي. يمكن للميزة الجديدة ترجمة ملفات البودكاست إلى لغات مختلفة، وذلك باستخدام الصوت الأصلي لمقدم البودكاست.

وفقًا وشك، تعتمد ميزة الترجمة هذه على OpenAIأداة النسخ الصوتي، Whisper، القادرة على نسخ الكلام الإنجليزي وترجمة اللغات المختلفة إلى الإنجليزية.

كجزء من البرنامج التجريبي، تعاونت الشركة مع مقدمي البودكاست داكس شيبرد، ومونيكا بادمان، وليكس فريدمان، وبيل سيمونز، وستيفن بارتليت لإنشاء ترجمات صوتية تعتمد على الذكاء الاصطناعي بلغات مثل الإسبانية والفرنسية والألمانية لحلقات محددة من الكتالوج والمسلسلات القادمة. إطلاق.

وقال زياد سلطان، نائب رئيس قسم التخصيص في Spotify، في بيان: "نعتقد أن النهج المدروس تجاه الذكاء الاصطناعي يمكن أن يساعد في بناء روابط أعمق بين المستمعين والمبدعين، وهو عنصر أساسي في مهمة Spotify لإطلاق العنان لإمكانات الإبداع البشري".

ستكون الحلقات المترجمة صوتيًا من منشئي البرامج التجريبية متاحة في جميع أنحاء العالم للمستخدمين المميزين والمجانيين.

إخلاء المسئولية

تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.

نبذة عن الكاتب

سيندي صحفية في Metaverse Post، تغطي الموضوعات المتعلقة بـ web3, NFT، metaverse و AI ، مع التركيز على المقابلات مع Web3 لاعبين الصناعة. لقد تحدثت إلى أكثر من 30 مديرًا تنفيذيًا على مستوى C وما زال العدد في ازدياد، حيث قدمت أفكارهم القيمة للقراء. أصلها من سنغافورة، وتقيم سيندي الآن في تبليسي، جورجيا. حصلت على درجة البكالوريوس في الاتصالات والدراسات الإعلامية من جامعة جنوب أستراليا ولديها عشر سنوات من الخبرة في الصحافة والكتابة. تواصل معها عبر [البريد الإلكتروني محمي] مع المداخلات الصحفية والإعلانات وفرص المقابلات.

المزيد من المقالات
سيندي تان
سيندي تان

سيندي صحفية في Metaverse Post، تغطي الموضوعات المتعلقة بـ web3, NFT، metaverse و AI ، مع التركيز على المقابلات مع Web3 لاعبين الصناعة. لقد تحدثت إلى أكثر من 30 مديرًا تنفيذيًا على مستوى C وما زال العدد في ازدياد، حيث قدمت أفكارهم القيمة للقراء. أصلها من سنغافورة، وتقيم سيندي الآن في تبليسي، جورجيا. حصلت على درجة البكالوريوس في الاتصالات والدراسات الإعلامية من جامعة جنوب أستراليا ولديها عشر سنوات من الخبرة في الصحافة والكتابة. تواصل معها عبر [البريد الإلكتروني محمي] مع المداخلات الصحفية والإعلانات وفرص المقابلات.

Hot Stories
اشترك في صحيفتنا الإخبارية.
آخـر الأخبار

تنمو الشهية المؤسسية تجاه صناديق الاستثمار المتداولة في البيتكوين وسط التقلبات

تكشف الإفصاحات من خلال ملفات 13F عن مستثمرين مؤسسيين بارزين يشتغلون بصناديق الاستثمار المتداولة في البيتكوين، مما يؤكد القبول المتزايد لـ ...

لمعرفة المزيد

وصول يوم النطق بالحكم: مصير تشيكوسلوفاكيا معلق في الميزان بينما تنظر المحكمة الأمريكية في التماس وزارة العدل

ومن المقرر أن يواجه Changpeng Zhao الحكم في محكمة أمريكية في سياتل اليوم.

لمعرفة المزيد
انضم إلى مجتمعنا التقني المبتكر
تفاصيل أكثر
المزيد
تعلن خوارزمية التعدين التي تعمل بنظام ZKP Soland عن إطلاقها والبيع المسبق لأداة التعدين لمدة 20 يومًا
تقرير الأخبار تكنولوجيا
تعلن خوارزمية التعدين التي تعمل بنظام ZKP Soland عن إطلاقها والبيع المسبق لأداة التعدين لمدة 20 يومًا
13 مايو 2024
تخطط Notcoin لتوزيع 5% من إمدادات التوكنات الخاصة بها على 500,000 من أعضاء المجتمع ومستخدمي تبادل العملات المشفرة
الأسواق تقرير الأخبار تكنولوجيا
تخطط Notcoin لتوزيع 5% من إمدادات التوكنات الخاصة بها على 500,000 من أعضاء المجتمع ومستخدمي تبادل العملات المشفرة
13 مايو 2024
تحول دونالد ترامب إلى العملات المشفرة: من الخصم إلى المدافع، وماذا يعني ذلك بالنسبة لسوق العملات المشفرة في الولايات المتحدة
باقة الأعمال الأسواق قصص ومراجعات تكنولوجيا
تحول دونالد ترامب إلى العملات المشفرة: من الخصم إلى المدافع، وماذا يعني ذلك بالنسبة لسوق العملات المشفرة في الولايات المتحدة
10 مايو 2024
ستطلق Layer3 رمز L3 هذا الصيف، وتخصص 51% من إجمالي العرض للمجتمع
الأسواق تقرير الأخبار تكنولوجيا
ستطلق Layer3 رمز L3 هذا الصيف، وتخصص 51% من إجمالي العرض للمجتمع
10 مايو 2024
CRYPTOMERIA LABS PTE. المحدودة.