گزارش خبری پیشرفته
مارس 15، 2023

GPT-4 می تواند به درخواست های شما برای تصاویر، اسناد، نمودارها و اسکرین شات ها رسیدگی کند

به طور خلاصه

GPT-4 می تواند درخواست های تصاویر، اسناد، نمودارها و اسکرین شات ها را رسیدگی کند. این یک پیشرفت است GPT-3، که فقط متن را مدیریت می کرد.

GPT-4 در آزمون ها و تست های مختلف عملکرد برتری دارد و می تواند از طریق تصاویری که ممکن است به صورت کتبی در دسترس نباشد به اطلاعات و جزئیات اضافی دسترسی پیدا کند.

gpt-4 تصاویر اسکرین شات ها را اسناد می کند

OpenAIآخرین نقطه عطف، مدل جدید GPT-4، می تواند درخواست هایی را بپذیرد که شامل تصاویر، اسناد همراه با متن، نمودارها یا عکس های صفحه به عنوان ورودی است. این نشان دهنده پیشرفت قابل توجهی نسبت به نسخه قبلی است، GPT-3، که فقط می توانست متن را بفهمد و خروجی بگیرد. با این ویژگی جدید، GPT-4 خروجی های متنی را تولید می کند که ورودی های داده شده متشکل از متن و تصاویر به هم ریخته است.

"در طیف وسیعی از دامنه ها - از جمله اسناد با متن و عکس، نمودارها یا اسکرین شات ها -GPT-4 قابلیت‌های مشابهی را مانند ورودی‌های متنی نشان می‌دهد.»

OpenAI نوشت.

ChatGPT-4 اندازه بزرگتری نسبت به نسخه های قبلی خود دارد و این نشان می دهد که روی حجم بیشتری از داده ها آموزش دیده است و وزن بیشتری در فایل مدل خود دارد و در نتیجه هزینه بیشتری برای عملیات آن به همراه دارد. جدیدترین زبان هوش مصنوعی می تواند متنی شبیه انسان را با استفاده از آن تولید کند یادگیری عمیق و از قبل بر روی یک مجموعه داده بزرگ آموزش داده شده است.

GPT-4 است عملکرد برتری نسبت به سایر زبان های هوش مصنوعی نشان داد در انواع آزمون ها و آزمون ها تا حدی به دلیل توانایی آن در دسترسی به اطلاعات و جزئیات اضافی از طریق تصاویری است که ممکن است به صورت کتبی در دسترس نباشند.

جدید GPT-4 مدل می تواند به شما بگوید دقیقاً چه چیزی در تصویر نشان داده شده است، آن را تجزیه و تحلیل کند و حتی معنای آن را توضیح دهد. در دمو، GPT-4 شوخی تصویری را توضیح داد که در آن کابل VGA به آیفون وصل می شود. همچنین می تواند توضیح دهد که در تصویری که "اتو شدید" را ارائه می دهد، چه چیزی غیرمعمول است، که در زیر می توانید آن را بررسی کنید.

gpt-4 تصاویر
منبع: OpenAI

با این حال، پیامدهای مفیدتری نیز وجود دارد GPT-4دانش جدید است. در ارائه، نشان داده شد که PGT-4 می تواند از موادی که در تصویر نشان داده شده است، بفهمد چه چیزی می تواند پخته شود. این بدان معناست که اگر محصولات غذایی دارید و نمی‌دانید با آن‌ها چه کار کنید، مدل می‌تواند به شما در آشپزی کمک کند. از غذاهایی که دارید عکس بگیرید و چت کنیدGPT می تواند به شما بگوید چه چیزی می توانید از موادی که در خانه دارید تهیه کنید.

این توانایی درک و تفسیر اطلاعات بصری باعث می شود GPT-4 ابزاری قدرتمند برای کارهایی مانند نوشتن شرح تصاویر، پاسخگویی به سوالات بصری و حتی تولید محتوا. با ادغام متن و درک بصری، GPT-4 این پتانسیل را دارد که صنایع مختلف مانند تبلیغات، طراحی و تجارت الکترونیک را متحول کند و به مردم کمک کند تا کارهای خسته کننده و پیش پا افتاده را برای آنها انجام دهند.

پیشرفته مدل زبان همچنین اسکرین شات ها و اسناد را با متن، جداول، نمودارها یا سایر نمایش های بصری «درک» می کند. به عنوان مثال، اگر یک مقاله تحقیقاتی سه صفحه ای آپلود می کنید و نیاز به خلاصه و توضیح آن دارید، GPT-4 قادر به انجام این کار است. 

Jon Erlichman مجری بلومبرگ نشان داد که چگونه می تواند یک طرح دستی را به یک وب سایت کاربردی تبدیل کند.

فن آوری جدید همچنین می تواند به عنوان کمک حرکتی مورد استفاده قرار گیرد زیرا می تواند برای توصیف محیط برای افراد کم بینا مورد استفاده قرار گیرد. برای این منظور، Open AI قبلاً با اپلیکیشنی به نام شریک شده است چشم من باش که برای کمک به افراد نابینا طراحی شده است، زمانی که لازم است به چیزی نگاه کنند، مثلاً در هنگام خرید مواد غذایی. این برنامه به «داوطلبان و متخصصان بینا اجازه می دهد تا چشمان خود را برای حل کارهای کوچک و بزرگ برای کمک به افراد نابینا و کم بینا برای داشتن زندگی مستقل تری به کار گیرند». در حال حاضر، همچنین یک ابزار داوطلب مجازی ارائه می دهد که توسط OpenAI" GPT-4.

هر چند OpenAI" GPT-4 در حال حاضر توانایی پردازش متن و تصاویر را به عنوان ورودی ارائه می دهد، این مدل هنوز برای کنترل ورودی های صوتی و تصویری مجهز نشده است. با این وجود، نشانه هایی وجود دارد که این روش ها ممکن است در تکرار بعدی فناوری گنجانده شوند.

ادامه مطلب:

برچسب ها:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Agne روزنامه نگاری است که آخرین روندها و تحولات در متاورس، هوش مصنوعی و Web3 صنایع برای Metaverse Post. اشتیاق او به داستان نویسی باعث شده است که مصاحبه های متعددی با متخصصان این حوزه ها انجام دهد و همیشه به دنبال کشف داستان های هیجان انگیز و جذاب است. اگنه دارای مدرک لیسانس در ادبیات است و پیشینه گسترده ای در نوشتن در مورد طیف گسترده ای از موضوعات از جمله سفر، هنر و فرهنگ دارد. او همچنین به عنوان سردبیر برای سازمان حقوق حیوانات داوطلب شده است، جایی که به افزایش آگاهی در مورد مسائل رفاهی حیوانات کمک کرد. با او تماس بگیرید [ایمیل محافظت شده].

مقالات بیشتر
اگنه سیمرمن
اگنه سیمرمن

Agne روزنامه نگاری است که آخرین روندها و تحولات در متاورس، هوش مصنوعی و Web3 صنایع برای Metaverse Post. اشتیاق او به داستان نویسی باعث شده است که مصاحبه های متعددی با متخصصان این حوزه ها انجام دهد و همیشه به دنبال کشف داستان های هیجان انگیز و جذاب است. اگنه دارای مدرک لیسانس در ادبیات است و پیشینه گسترده ای در نوشتن در مورد طیف گسترده ای از موضوعات از جمله سفر، هنر و فرهنگ دارد. او همچنین به عنوان سردبیر برای سازمان حقوق حیوانات داوطلب شده است، جایی که به افزایش آگاهی در مورد مسائل رفاهی حیوانات کمک کرد. با او تماس بگیرید [ایمیل محافظت شده].

Hot Stories

راه حل تجارت استیبل کوین چشم ملل BRICS

by ویکتوریا پالچیک
ممکن است 01، 2024
به خبرنامه ما بپیوندید.
آخرین اخبار

روز صدور حکم فرا می رسد: با بررسی دادگاه ایالات متحده به درخواست وزارت دادگستری، سرنوشت CZ در تعادل است

چانگ پنگ ژائو امروز در دادگاهی در سیاتل آمریکا محکوم خواهد شد.

بیشتر بدانید

بنیانگذاران کیف پول سامورایی متهم به تسهیل 2 میلیارد دلار در معاملات Darknet شدند

دلهره از بنیانگذاران کیف پول سامورای نشان دهنده یک شکست قابل توجه برای صنعت است که تاکیدی بر ادامه دار بودن ...

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
Ankr با پلتفرم بلاک چین هوش مصنوعی شبکه Talus برای باز کردن نقدینگی بیت کوین برای هوش مصنوعی همکاری می کند
کسب و کار گزارش خبری پیشرفته
Ankr با پلتفرم بلاک چین هوش مصنوعی شبکه Talus برای باز کردن نقدینگی بیت کوین برای هوش مصنوعی همکاری می کند
ممکن است 1، 2024
Binance Labs از Movement Labs برای تسهیل ادغام حرکت فیس بوک در میان بلاک چین ها پشتیبانی می کند.
کسب و کار گزارش خبری پیشرفته
Binance Labs از Movement Labs برای تسهیل ادغام حرکت فیس بوک در میان بلاک چین ها پشتیبانی می کند.
ممکن است 1، 2024
راه حل تجارت استیبل کوین چشم ملل BRICS
کسب و کار بازارها داستان ها و نقدها پیشرفته
راه حل تجارت استیبل کوین چشم ملل BRICS
ممکن است 1، 2024
BOB شبکه بیت کوین L2 با لایه صفر برای کارکردهای پیشرفته ادغام می شود
کسب و کار گزارش خبری پیشرفته
BOB شبکه بیت کوین L2 با لایه صفر برای کارکردهای پیشرفته ادغام می شود
ممکن است 1، 2024
CRYPTOMERIA LABS PTE. محدود