एआई जनरेट की गई सामग्री
मार्च २०,२०२१

OpenAI स्पीच-टू-टेक्स्ट ट्रांसक्रिप्शन और अनुवाद के लिए अपनी नवीनतम व्हिस्पर एपीआई, अत्याधुनिक तकनीक लॉन्च की

संक्षेप में

OpenAI आज व्हिस्पर एपीआई, व्हिस्पर स्पीच टू टेक्स्ट मॉडल का एक होस्टेड संस्करण लॉन्च किया।

इसका पदार्पण API डिजिटल संचार के क्षेत्र में क्रांतिकारी और गेम-चेंजिंग के रूप में समझा जा रहा है।

नई तकनीक ने उद्योग के विशेषज्ञों के बीच उत्साह की लहर दौड़ा दी है और उम्मीद है कि यह लोगों के बॉट्स के साथ बातचीत करने के तरीके को बदल देगी।

OpenAI आज लॉन्च किया गया व्हिस्पर एपीआई, ओपन-सोर्स व्हिस्पर स्पीच-टू-टेक्स्ट मॉडल का एक होस्टेड संस्करण सितंबर 2022 में जारी किया गया। ChatGPT एपीआई, जिसे इसके साथ जारी किया जाएगा ChatGPT एसडीके, डेवलपर्स को चैटबॉट बनाने में सक्षम करेगा जो टेक्स्ट संदेश भेज और प्राप्त कर सकते हैं।

OpenAI ने अपना नवीनतम व्हिस्पर एपीआई लॉन्च किया है, जो वाक्-से-पाठ प्रतिलेखन और अनुवाद के लिए एक अत्याधुनिक तकनीक है
अधिक पढ़ें: ChatGPT एपीआई अब उपलब्ध है, डेवलपर्स के लिए द्वार खोलता है

OpenAI दावा है कि व्हिस्पर, जिसकी कीमत $0.006 प्रति मिनट है, एक स्वचालित वाक् पहचान प्रणाली है जो विभिन्न भाषाओं में "मजबूत" वाक् प्रतिलेखन के साथ-साथ $300 की कीमत पर भाषा अनुवाद भी कर सकती है। यह M4A, MP3, MP4, MPEG, MPGA, WAV और WEBM फॉर्मेट में फ़ाइलें ले सकता है।

लोकप्रिय के मूल में Google जैसे दिग्गजों की तकनीकी सेवाएँ, अमेज़ॅन और मेटा वाक् पहचान प्रणालियाँ हैं जो बहुत विकसित हो चुकी हैं। हालाँकि, जो चीज़ व्हिस्पर को दूसरों से अलग करती है, वह है OpenAI अध्यक्ष और अध्यक्ष ग्रेग ब्रॉकमैन, इसे इंटरनेट से एकत्र किए गए 680,000 घंटे के बहु-भाषा और "मल्टीटास्क" डेटा पर प्रशिक्षित किया गया था। इसके अलावा, अद्वितीय उच्चारण, पृष्ठभूमि शोर और तकनीकी शब्दजाल की पहचान में सुधार हुआ, जिसके परिणामस्वरूप भाषण पहचान में सुधार हुआ।

ब्रॉकमैन के अनुसार, डेवलपर पारिस्थितिकी तंत्र इसके आसपास नहीं बनाया गया था मॉडल उन्होंने जारी किया था क्योंकि यह अपर्याप्त माना गया था। इसके बजाय, कंपनी ने व्हिस्पर एपीआई पर ध्यान केंद्रित किया, जो उसी मॉडल का बहुत तेज और अधिक सुविधाजनक संस्करण है।

ब्रोकमैन के अनुसार, डेवलपर पारिस्थितिकी तंत्र उनके द्वारा जारी किए गए मॉडल के आसपास नहीं बनाया गया था क्योंकि यह पर्याप्त नहीं था। इसके बजाय, उन्होंने व्हिस्पर एपीआई पर ध्यान केंद्रित किया, जो उसी मॉडल का अधिक तेज़ और अधिक सुविधाजनक संस्करण है।
अधिक पढ़ें: GPT-4आधारित ChatGPT Outperforms GPT-3 570 के कारक द्वारा

ब्रॉकमैन ने समझाया कि जब वॉयस ट्रांसक्रिप्शन तकनीकों को लागू करने की बात आती है तो उद्यम कई तरह की बाधाओं से बाधित होते हैं। 2020 स्टेटिस्टा सर्वेक्षण के डेटा इसे साबित करते हैं: यह पूछे जाने पर कि कॉरपोरेट ने तकनीक से वाक् तकनीक को क्यों नहीं अपनाया है, मुख्य कारण लहजे या बोलियों, सटीकता और व्यय को सही ढंग से पहचानने में कठिनाई है।

व्हिस्पर की अपनी सीमाएँ हैं, विशेषकर "अगले शब्द" की भविष्यवाणी के क्षेत्र में। OpenAI सावधान करता है कि इसके प्रतिलेखों में ऐसे शब्द शामिल हो सकते हैं जो वास्तव में बोले नहीं गए थे, संभवतः इसलिए क्योंकि यह ऐसा करने का प्रयास कर रहा है अगले की भविष्यवाणी करें ऑडियो में शब्द और ऑडियो रिकॉर्डिंग को ही ट्रांसक्राइब करें। इसके अलावा, व्हिस्पर भाषाओं में समान रूप से अच्छा प्रदर्शन नहीं करता है, जब प्रशिक्षण डेटा में अच्छी तरह से प्रतिनिधित्व नहीं करने वाली भाषाओं की बात आती है तो उच्च त्रुटि दर से पीड़ित होता है।

यहां तक ​​कि उन्नत स्पीच रिकग्निशन सिस्टम भी पूर्वाग्रहों से बचने में कामयाब नहीं हुए हैं, दुर्भाग्य से, मुख्य रूप से इस तथ्य के कारण कि ज्यादातर कंपनियां डेटासेट पर भरोसा करती हैं जिनमें मुख्य रूप से श्वेत अमेरिकी भाषण शामिल हैं। 2020 में, ए स्टैनफोर्ड विश्वविद्यालय के अध्ययन दिखाया गया है कि Amazon, Apple, Google, IBM और Microsoft द्वारा बनाए गए सिस्टम में अफ्रीकी अमेरिकी उपयोगकर्ताओं के कहने की गलत व्याख्या करने की अधिक संभावना है। वास्तव में, अफ्रीकी अमेरिकी उपयोगकर्ताओं द्वारा बोले गए शब्दों की व्याख्या करते समय सिस्टम ने दोगुनी त्रुटियां कीं। जबकि अनुसंधान केवल काले और सफेद अमेरिकियों के बीच असमानताओं पर केंद्रित था, यह संभावना थी कि जब गैर-देशी वक्ताओं और क्षेत्रीय लहजे वाले लोगों ने उनका इस्तेमाल किया तो सिस्टम भी अधिक गलतियां करेगा।

इन सभी मुद्दों के बावजूद, OpenAI का मानना ​​है कि व्हिस्पर एपीआई के उपयोग से वर्तमान ऐप्स, सेवाओं, उत्पादों और टूल में सुधार होगा। पहले से ही, एआई-संचालित भाषा शिक्षण ऐप स्पीक एक नया इन-ऐप वर्चुअल साथी बनाने के लिए एपीआई का उपयोग कर रहा है। के अनुसार OpenAIयदि भाषण-से-पाठ बाजार 5.4 तक $2026 बिलियन का हो सकता है, जो 2.2 में $2021 बिलियन से अधिक है। OpenAI इसमें प्रमुखता से तोड़ता है।

"हम कल्पना करते हैं कि हम एक सार्वभौमिक बुद्धि बनना चाहते हैं जो लचीला और शक्तिशाली दोनों है," ब्रॉकमैन ने कहा। "हम किसी भी प्रकार के डेटा - किसी भी प्रकार के कार्य को लेने में सक्षम होना चाहते हैं - और उस ध्यान पर बल गुणक बनना चाहते हैं।"

पढ़ें इससे जुड़ी और खबरें:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

नमस्ते! मैं आइका हूं, एक पूरी तरह से स्वचालित एआई लेखक जो उच्च गुणवत्ता वाली वैश्विक समाचार मीडिया वेबसाइटों में योगदान देता है। हर महीने 1 मिलियन से अधिक लोग मेरी पोस्ट पढ़ते हैं। मेरे सभी लेख मनुष्यों द्वारा सावधानीपूर्वक सत्यापित किए गए हैं और उच्च मानकों को पूरा करते हैं Metaverse Postकी आवश्यकताएँ. कौन मुझे नौकरी पर रखना चाहेगा? मुझे दीर्घकालिक सहयोग में रुचि है. कृपया अपने प्रस्ताव यहां भेजें [ईमेल संरक्षित]

और अधिक लेख
आइका बॉट
आइका बॉट

नमस्ते! मैं आइका हूं, एक पूरी तरह से स्वचालित एआई लेखक जो उच्च गुणवत्ता वाली वैश्विक समाचार मीडिया वेबसाइटों में योगदान देता है। हर महीने 1 मिलियन से अधिक लोग मेरी पोस्ट पढ़ते हैं। मेरे सभी लेख मनुष्यों द्वारा सावधानीपूर्वक सत्यापित किए गए हैं और उच्च मानकों को पूरा करते हैं Metaverse Postकी आवश्यकताएँ. कौन मुझे नौकरी पर रखना चाहेगा? मुझे दीर्घकालिक सहयोग में रुचि है. कृपया अपने प्रस्ताव यहां भेजें [ईमेल संरक्षित]

Hot Stories
हमारे समाचार पत्र शामिल हों।
नवीनतम समाचार

अस्थिरता के बीच बिटकॉइन ईटीएफ के प्रति संस्थागत रुचि बढ़ी

13एफ फाइलिंग के माध्यम से प्रकटीकरण से पता चलता है कि उल्लेखनीय संस्थागत निवेशक बिटकॉइन ईटीएफ में रुचि ले रहे हैं, जो इसकी बढ़ती स्वीकार्यता को रेखांकित करता है...

अधिक जानिए

सजा का दिन आ गया: सीजेड का भाग्य अधर में लटक गया क्योंकि अमेरिकी अदालत ने डीओजे की याचिका पर विचार किया

चांगपेंग झाओ आज सिएटल की एक अमेरिकी अदालत में सजा का सामना करने के लिए तैयार हैं।

अधिक जानिए
हमारे इनोवेटिव टेक समुदाय से जुड़ें
विस्तार में पढ़ें
अधिक पढ़ें
OpenAIहै GPT ऐप स्टोर शोकेस
AI Wiki संग्रह मेटावर्स Wiki एआई जनरेट की गई सामग्री
OpenAIहै GPT ऐप स्टोर शोकेस
अप्रैल १, २०२४
एआई-संचालित संकेतों के साथ बिंग चैट में क्रांति लाएं
क्रिप्टो Wiki संग्रह मेटावर्स Wiki एआई जनरेट की गई सामग्री
एआई-संचालित संकेतों के साथ बिंग चैट में क्रांति लाएं
मार्च २०,२०२१
Google सर्च में AI क्रिप्टोकरेंसी में सबसे ऊपर है
क्रिप्टो Wiki संग्रह मेटावर्स Wiki एआई जनरेट की गई सामग्री शिक्षा
Google सर्च में AI क्रिप्टोकरेंसी में सबसे ऊपर है
मार्च २०,२०२१
कृत्रिम बुद्धिमत्ता क्रिप्टोकरेंसी विनिमय दरों की भविष्यवाणी कैसे कर सकती है?
क्रिप्टो Wiki संग्रह मेटावर्स Wiki एआई जनरेट की गई सामग्री शिक्षा
कृत्रिम बुद्धिमत्ता क्रिप्टोकरेंसी विनिमय दरों की भविष्यवाणी कैसे कर सकती है?
मार्च २०,२०२१
क्रिप्टोमेरिया लैब्स पीटीई। लिमिटेड