समाचार रिपोर्ट टेक्नोलॉजी
मार्च २०,२०२१

GPT-4 छवियों, दस्तावेज़ों, आरेखों और स्क्रीनशॉट के लिए आपके अनुरोधों को संभाल सकता है

संक्षेप में

GPT-4 छवियों, दस्तावेज़ों, आरेखों और स्क्रीनशॉट के अनुरोधों को संभाल सकता है। यह एक सुधार है GPT-3, जो केवल पाठ को संभालता है।

GPT-4 विभिन्न परीक्षाओं और परीक्षणों में बेहतर प्रदर्शन किया है और छवियों के माध्यम से अतिरिक्त जानकारी और विवरण तक पहुंच सकते हैं जो लिखित रूप में उपलब्ध नहीं हो सकते हैं।

gpt-4 छवियाँ दस्तावेज़ स्क्रीनशॉट

OpenAIनवीनतम मील का पत्थर, नया मॉडल GPT-4, उन अनुरोधों को स्वीकार कर सकता है जिनमें इनपुट के रूप में चित्र, टेक्स्ट वाले दस्तावेज़, आरेख या स्क्रीनशॉट शामिल हैं। यह पिछले संस्करण की तुलना में एक महत्वपूर्ण सुधार दर्शाता है, GPT-3, जो केवल टेक्स्ट को समझ और आउटपुट कर सकता है। इस नई सुविधा के साथ, GPT-4 अंतर्विष्ट पाठ और छवियों से युक्त इनपुट दिए गए टेक्स्ट आउटपुट उत्पन्न करता है।

“डोमेन की एक श्रृंखला पर-जिसमें टेक्स्ट और फोटोग्राफ, आरेख या स्क्रीनशॉट वाले दस्तावेज़ शामिल हैं-GPT-4 यह वैसी ही क्षमताएं प्रदर्शित करता है जैसे यह केवल-पाठ इनपुट पर करता है।"

OpenAI लिखा था।

ChatGPT-4 इसका आकार अपने पूर्ववर्तियों की तुलना में बड़ा है, जो दर्शाता है कि इसने बड़ी मात्रा में डेटा पर प्रशिक्षण लिया है और इसकी मॉडल फ़ाइल में अधिक वजन है, जिसके परिणामस्वरूप इसके संचालन की लागत अधिक है। नवीनतम एआई भाषा का उपयोग करके मानव जैसा पाठ उत्पन्न किया जा सकता है ध्यान लगा के पढ़ना या सीखना और एक बड़े डेटासेट पर पूर्व-प्रशिक्षित किया जा रहा है।

GPT-4 है अन्य एआई भाषाओं की तुलना में बेहतर प्रदर्शन का प्रदर्शन किया छवियों के माध्यम से अतिरिक्त जानकारी और विवरण तक पहुंचने की अपनी क्षमता के कारण विभिन्न प्रकार की परीक्षाओं और परीक्षणों में जो लिखित रूप में उपलब्ध नहीं हो सकते हैं।

नई GPT-4 मॉडल आपको बता सकता है कि चित्रण में वास्तव में क्या दर्शाया गया है, उसका विश्लेषण कर सकता है और यहां तक ​​कि उसका अर्थ भी समझा सकता है। डेमो में, GPT-4 उस दृश्य चुटकुले को समझाया जहां एक वीजीए केबल आईफोन से जुड़ा हुआ है। यह यह भी समझा सकता है कि "अत्यधिक इस्त्री" प्रस्तुत करने वाली तस्वीर में क्या असामान्य है, जिसे आप नीचे देख सकते हैं।

gpt-4 छवियों
स्रोत: OpenAI

हालाँकि, इसके और भी उपयोगी निहितार्थ हैं GPT-4का नया ज्ञान. प्रेजेंटेशन में दिखाया गया कि पीजीटी-4 बता सकता है कि चित्र में दिखाई गई सामग्री से क्या पकाया जा सकता है। इसका मतलब यह है कि यदि आपके पास खाद्य उत्पाद हैं और आपको पता नहीं है कि उनके साथ क्या करना है तो मॉडल आपको खाना बनाने में मदद कर सकता है। आपके पास जो भोजन है उसका एक स्नैपशॉट लें और चैट करें-GPT आपको बता सकता है कि आपके पास घर पर मौजूद सामग्री से आप क्या बना सकते हैं।

यह दृश्य जानकारी को समझने और व्याख्या करने की क्षमता बनाता है GPT-4 छवि कैप्शनिंग, विज़ुअल प्रश्न उत्तर और यहां तक ​​कि सामग्री निर्माण जैसे कार्यों के लिए एक शक्तिशाली उपकरण। पाठ और दृश्य समझ दोनों के एकीकरण के साथ, GPT-4 इसमें विज्ञापन, डिज़ाइन और ई-कॉमर्स जैसे विभिन्न उद्योगों में क्रांति लाने और लोगों को उनके उबाऊ, सांसारिक कार्यों को करने में मदद करने की क्षमता है।

उन्नत भाषा मॉडल टेक्स्ट, तालिकाओं, आरेखों या अन्य दृश्य प्रस्तुतियों के साथ स्क्रीनशॉट और दस्तावेज़ों को भी 'समझता' है। उदाहरण के लिए, यदि आप तीन पेज का शोध पत्र अपलोड करते हैं और उसका सारांश और स्पष्टीकरण चाहते हैं, GPT-4 ऐसा करने में सक्षम है. 

ब्लूमबर्ग के एंकर जॉन एर्लिचमैन ने प्रदर्शित किया कि कैसे वह एक हाथ से स्केच किए गए डिज़ाइन को एक कार्यात्मक वेबसाइट में बदलने में सक्षम थे।

नई तकनीक का उपयोग गतिशीलता सहायता के रूप में भी किया जा सकता है क्योंकि इसका उपयोग दृष्टिबाधित लोगों के लिए पर्यावरण का वर्णन करने के लिए किया जा सकता है। इसके लिए, ओपन एआई ने पहले से ही एक एप्लिकेशन के साथ भागीदारी की है मेरी आंखें बनो जिसे नेत्रहीन लोगों को मदद देने के लिए डिज़ाइन किया गया है जब उन्हें किसी चीज़ पर नज़र डालने की ज़रूरत होती है, उदाहरण के लिए, किराने की खरीदारी करते समय। ऐप "दृष्टिहीन स्वयंसेवकों और पेशेवरों को नेत्रहीन और कम दृष्टि वाले लोगों को अधिक स्वतंत्र जीवन जीने में सहायता करने के लिए बड़े और छोटे कार्यों को हल करने के लिए अपनी आँखें उधार देने की सुविधा देता है।" अब, यह एक आभासी स्वयंसेवी उपकरण द्वारा संचालित भी प्रदान करता है OpenAIहै GPT-4.

हालांकि OpenAIहै GPT-4 वर्तमान में इनपुट के रूप में टेक्स्ट और छवियों को संसाधित करने की क्षमता प्रदान करता है, मॉडल अभी तक ऑडियो और वीडियो इनपुट को संभालने के लिए सुसज्जित नहीं है। फिर भी, ऐसे संकेत हैं कि इन तौर-तरीकों को प्रौद्योगिकी के अगले पुनरावृत्ति में शामिल किया जा सकता है।

अधिक पढ़ें:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

एग्ने एक पत्रकार हैं जो मेटावर्स, एआई और में नवीनतम रुझानों और विकास को कवर करते हैं Web3 उद्योगों के लिए Metaverse Post. कहानी कहने के प्रति उनके जुनून ने उन्हें इन क्षेत्रों के विशेषज्ञों के साथ कई साक्षात्कार आयोजित करने के लिए प्रेरित किया है, जो हमेशा रोमांचक और आकर्षक कहानियों को उजागर करने की कोशिश करते हैं। एग्ने के पास साहित्य में स्नातक की डिग्री है और यात्रा, कला और संस्कृति सहित विभिन्न विषयों पर लिखने की उनकी व्यापक पृष्ठभूमि है। उन्होंने पशु अधिकार संगठन के लिए एक संपादक के रूप में भी स्वेच्छा से काम किया है, जहां उन्होंने पशु कल्याण के मुद्दों के बारे में जागरूकता बढ़ाने में मदद की। उससे संपर्क करें [ईमेल संरक्षित].

और अधिक लेख
एग्ने सिमरमैन
एग्ने सिमरमैन

एग्ने एक पत्रकार हैं जो मेटावर्स, एआई और में नवीनतम रुझानों और विकास को कवर करते हैं Web3 उद्योगों के लिए Metaverse Post. कहानी कहने के प्रति उनके जुनून ने उन्हें इन क्षेत्रों के विशेषज्ञों के साथ कई साक्षात्कार आयोजित करने के लिए प्रेरित किया है, जो हमेशा रोमांचक और आकर्षक कहानियों को उजागर करने की कोशिश करते हैं। एग्ने के पास साहित्य में स्नातक की डिग्री है और यात्रा, कला और संस्कृति सहित विभिन्न विषयों पर लिखने की उनकी व्यापक पृष्ठभूमि है। उन्होंने पशु अधिकार संगठन के लिए एक संपादक के रूप में भी स्वेच्छा से काम किया है, जहां उन्होंने पशु कल्याण के मुद्दों के बारे में जागरूकता बढ़ाने में मदद की। उससे संपर्क करें [ईमेल संरक्षित].

Hot Stories
हमारे समाचार पत्र शामिल हों।
नवीनतम समाचार

सजा का दिन आ गया: सीजेड का भाग्य अधर में लटक गया क्योंकि अमेरिकी अदालत ने डीओजे की याचिका पर विचार किया

चांगपेंग झाओ आज सिएटल की एक अमेरिकी अदालत में सजा का सामना करने के लिए तैयार हैं।

अधिक जानिए

समुराई वॉलेट संस्थापकों पर डार्कनेट डील में $2B की सुविधा देने का आरोप लगाया गया

समुराई वॉलेट के संस्थापकों की आशंका उद्योग के लिए एक उल्लेखनीय झटके का प्रतिनिधित्व करती है, जो लगातार जारी रहने को रेखांकित करती है ...

अधिक जानिए
हमारे इनोवेटिव टेक समुदाय से जुड़ें
विस्तार में पढ़ें
अधिक पढ़ें
2024 में गेम डेवलपमेंट में एआई पुनर्जागरण
AI Wiki मेटावर्स Wiki शिक्षा Markets सॉफ्टवेयर टेक्नोलॉजी
2024 में गेम डेवलपमेंट में एआई पुनर्जागरण
1 मई 2024
एस्टी लॉडर की नई एआई इनोवेशन लैब के अंदर: जेनेरेटिव एआई सौंदर्य ब्रांडों को कैसे बदल रहा है, इस पर एक करीबी नजर
लाइफस्टाइल सॉफ्टवेयर कहानियाँ और समीक्षाएँ टेक्नोलॉजी
एस्टी लॉडर की नई एआई इनोवेशन लैब के अंदर: जेनेरेटिव एआई सौंदर्य ब्रांडों को कैसे बदल रहा है, इस पर एक करीबी नजर
1 मई 2024
चेनलिंक और रैपिड एडिशन सीसीआईपी-आधारित ब्लॉकचेन एडाप्टर विकसित करने के लिए सहयोग करते हैं
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
चेनलिंक और रैपिड एडिशन सीसीआईपी-आधारित ब्लॉकचेन एडाप्टर विकसित करने के लिए सहयोग करते हैं
1 मई 2024
बिटस्माइली ने अल्फानेट वी1 लॉन्च किया, जो बिटकॉइन लेयर 2 नेटवर्क बिटलेयर पर शुरू हुआ
समाचार रिपोर्ट टेक्नोलॉजी
बिटस्माइली ने अल्फानेट वी1 लॉन्च किया, जो बिटकॉइन लेयर 2 नेटवर्क बिटलेयर पर शुरू हुआ
1 मई 2024
क्रिप्टोमेरिया लैब्स पीटीई। लिमिटेड