GPT-4 می تواند به درخواست های شما برای تصاویر، اسناد، نمودارها و اسکرین شات ها رسیدگی کند
به طور خلاصه
GPT-4 می تواند درخواست های تصاویر، اسناد، نمودارها و اسکرین شات ها را رسیدگی کند. این یک پیشرفت است GPT-3، که فقط متن را مدیریت می کرد.
GPT-4 در آزمون ها و تست های مختلف عملکرد برتری دارد و می تواند از طریق تصاویری که ممکن است به صورت کتبی در دسترس نباشد به اطلاعات و جزئیات اضافی دسترسی پیدا کند.
OpenAIآخرین نقطه عطف، مدل جدید GPT-4، می تواند درخواست هایی را بپذیرد که شامل تصاویر، اسناد همراه با متن، نمودارها یا عکس های صفحه به عنوان ورودی است. این نشان دهنده پیشرفت قابل توجهی نسبت به نسخه قبلی است، GPT-3، که فقط می توانست متن را بفهمد و خروجی بگیرد. با این ویژگی جدید، GPT-4 خروجی های متنی را تولید می کند که ورودی های داده شده متشکل از متن و تصاویر به هم ریخته است.
"در طیف وسیعی از دامنه ها - از جمله اسناد با متن و عکس، نمودارها یا اسکرین شات ها -GPT-4 قابلیتهای مشابهی را مانند ورودیهای متنی نشان میدهد.»
OpenAI نوشت.
ChatGPT-4 اندازه بزرگتری نسبت به نسخه های قبلی خود دارد و این نشان می دهد که روی حجم بیشتری از داده ها آموزش دیده است و وزن بیشتری در فایل مدل خود دارد و در نتیجه هزینه بیشتری برای عملیات آن به همراه دارد. جدیدترین زبان هوش مصنوعی می تواند متنی شبیه انسان را با استفاده از آن تولید کند یادگیری عمیق و از قبل بر روی یک مجموعه داده بزرگ آموزش داده شده است.
GPT-4 است عملکرد برتری نسبت به سایر زبان های هوش مصنوعی نشان داد در انواع آزمون ها و آزمون ها تا حدی به دلیل توانایی آن در دسترسی به اطلاعات و جزئیات اضافی از طریق تصاویری است که ممکن است به صورت کتبی در دسترس نباشند.
جدید GPT-4 مدل می تواند به شما بگوید دقیقاً چه چیزی در تصویر نشان داده شده است، آن را تجزیه و تحلیل کند و حتی معنای آن را توضیح دهد. در دمو، GPT-4 شوخی تصویری را توضیح داد که در آن کابل VGA به آیفون وصل می شود. همچنین می تواند توضیح دهد که در تصویری که "اتو شدید" را ارائه می دهد، چه چیزی غیرمعمول است، که در زیر می توانید آن را بررسی کنید.
با این حال، پیامدهای مفیدتری نیز وجود دارد GPT-4دانش جدید است. در ارائه، نشان داده شد که PGT-4 می تواند از موادی که در تصویر نشان داده شده است، بفهمد چه چیزی می تواند پخته شود. این بدان معناست که اگر محصولات غذایی دارید و نمیدانید با آنها چه کار کنید، مدل میتواند به شما در آشپزی کمک کند. از غذاهایی که دارید عکس بگیرید و چت کنیدGPT می تواند به شما بگوید چه چیزی می توانید از موادی که در خانه دارید تهیه کنید.
این توانایی درک و تفسیر اطلاعات بصری باعث می شود GPT-4 ابزاری قدرتمند برای کارهایی مانند نوشتن شرح تصاویر، پاسخگویی به سوالات بصری و حتی تولید محتوا. با ادغام متن و درک بصری، GPT-4 این پتانسیل را دارد که صنایع مختلف مانند تبلیغات، طراحی و تجارت الکترونیک را متحول کند و به مردم کمک کند تا کارهای خسته کننده و پیش پا افتاده را برای آنها انجام دهند.
پیشرفته مدل زبان همچنین اسکرین شات ها و اسناد را با متن، جداول، نمودارها یا سایر نمایش های بصری «درک» می کند. به عنوان مثال، اگر یک مقاله تحقیقاتی سه صفحه ای آپلود می کنید و نیاز به خلاصه و توضیح آن دارید، GPT-4 قادر به انجام این کار است.
Jon Erlichman مجری بلومبرگ نشان داد که چگونه می تواند یک طرح دستی را به یک وب سایت کاربردی تبدیل کند.
فن آوری جدید همچنین می تواند به عنوان کمک حرکتی مورد استفاده قرار گیرد زیرا می تواند برای توصیف محیط برای افراد کم بینا مورد استفاده قرار گیرد. برای این منظور، Open AI قبلاً با اپلیکیشنی به نام شریک شده است چشم من باش که برای کمک به افراد نابینا طراحی شده است، زمانی که لازم است به چیزی نگاه کنند، مثلاً در هنگام خرید مواد غذایی. این برنامه به «داوطلبان و متخصصان بینا اجازه می دهد تا چشمان خود را برای حل کارهای کوچک و بزرگ برای کمک به افراد نابینا و کم بینا برای داشتن زندگی مستقل تری به کار گیرند». در حال حاضر، همچنین یک ابزار داوطلب مجازی ارائه می دهد که توسط OpenAI" GPT-4.
هر چند OpenAI" GPT-4 در حال حاضر توانایی پردازش متن و تصاویر را به عنوان ورودی ارائه می دهد، این مدل هنوز برای کنترل ورودی های صوتی و تصویری مجهز نشده است. با این وجود، نشانه هایی وجود دارد که این روش ها ممکن است در تکرار بعدی فناوری گنجانده شوند.
ادامه مطلب:
- 7 شرکت برتر که پذیرفته شدند GPT-4
- GPT-4-مستقر ChatGPT عملکرد بهتر GPT-3 با ضریب 570
- مایکروسافت تأیید کرد که Bing در حالت پیشرفته اجرا می شود GPT-4 مدل
- GPT-4 در مقابل GPT-3: مدل جدید چه چیزی برای ارائه دارد؟
سلب مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
Agne روزنامه نگاری است که آخرین روندها و تحولات در متاورس، هوش مصنوعی و Web3 صنایع برای Metaverse Post. اشتیاق او به داستان نویسی باعث شده است که مصاحبه های متعددی با متخصصان این حوزه ها انجام دهد و همیشه به دنبال کشف داستان های هیجان انگیز و جذاب است. اگنه دارای مدرک لیسانس در ادبیات است و پیشینه گسترده ای در نوشتن در مورد طیف گسترده ای از موضوعات از جمله سفر، هنر و فرهنگ دارد. او همچنین به عنوان سردبیر برای سازمان حقوق حیوانات داوطلب شده است، جایی که به افزایش آگاهی در مورد مسائل رفاهی حیوانات کمک کرد. با او تماس بگیرید [ایمیل محافظت شده].
مقالات بیشترAgne روزنامه نگاری است که آخرین روندها و تحولات در متاورس، هوش مصنوعی و Web3 صنایع برای Metaverse Post. اشتیاق او به داستان نویسی باعث شده است که مصاحبه های متعددی با متخصصان این حوزه ها انجام دهد و همیشه به دنبال کشف داستان های هیجان انگیز و جذاب است. اگنه دارای مدرک لیسانس در ادبیات است و پیشینه گسترده ای در نوشتن در مورد طیف گسترده ای از موضوعات از جمله سفر، هنر و فرهنگ دارد. او همچنین به عنوان سردبیر برای سازمان حقوق حیوانات داوطلب شده است، جایی که به افزایش آگاهی در مورد مسائل رفاهی حیوانات کمک کرد. با او تماس بگیرید [ایمیل محافظت شده].