Haber Raporu Teknoloji
15 Mart, 2023

GPT-4 Resim, Belge, Diyagram ve Ekran Görüntüsü Taleplerinizi Karşılayabilir

Kısaca

GPT-4 resim, belge, diyagram ve ekran görüntüsü isteklerini karşılayabilir. Bu bir gelişme GPT-3, yalnızca metni işleyen.

GPT-4 çeşitli sınav ve testlerde üstün performansa sahip olup, yazılı olarak bulunamayan görseller aracılığıyla ek bilgi ve detaylara ulaşabilmektedir.

gpt-4 görüntüler belgeler ekran görüntüleri

OpenAIen son dönüm noktası, yeni model GPT-4, girdi olarak resimler, metin içeren belgeler, diyagramlar veya ekran görüntüleri içeren istekleri kabul edebilir. Bu, önceki versiyona göre önemli bir gelişmeyi temsil ediyor, GPT-3yalnızca metni anlayabilen ve çıktısını alabilen. Bu yeni özellik ile GPT-4 serpiştirilmiş metin ve resimlerden oluşan girdiler verildiğinde metin çıktıları üretir.

"Metin ve fotoğraf içeren belgeler, diyagramlar veya ekran görüntüleri de dahil olmak üzere çeşitli alanlardaGPT-4 salt metin girişlerinde olduğu gibi benzer yetenekler sergiliyor,"

OpenAI yazdı.

ChatGPT-4 Önceki modellere göre daha büyük bir boyuta sahiptir, bu da daha büyük miktarda veri üzerinde eğitim aldığını ve model dosyasında daha fazla ağırlık içerdiğini ve bunun da işletimi için daha yüksek bir maliyete yol açtığını gösterir. En yeni AI dili, insan benzeri metinler üretebilir derin öğrenme ve büyük bir veri kümesi üzerinde önceden eğitilmiş olmak.

GPT-4 vardır diğer AI dillerine göre üstün performans gösterdi kısmen, yazılı olarak mevcut olmayabilecek görüntüler aracılığıyla ek bilgi ve ayrıntılara erişebilmesi nedeniyle çeşitli sınav ve testlerde.

Yeni GPT-4 model size çizimde tam olarak neyin tasvir edildiğini söyleyebilir, analiz edebilir ve hatta anlamını açıklayabilir. Demoda, GPT-4 iPhone'a VGA kablosunun bağlandığı görsel şakayı anlattı. Ayrıca, aşağıda kontrol edebileceğiniz "aşırı ütüleme"yi gösteren bir resimde neyin olağandışı olduğunu da açıklayabilir.

gpt-4 görüntüleri
Kaynak: OpenAI

Ancak bunun daha yararlı sonuçları da var GPT-4'in yeni keşfedilen bilgisi. Sunumda PGT-4'ün resimde gösterilen malzemelerden ne pişirilebileceğini söyleyebildiği gösterildi. Bu, gıda ürünleriniz varsa ve onlarla ne yapacağınıza dair hiçbir fikriniz yoksa modelin yemek pişirmenize yardımcı olabileceği anlamına gelir. Sahip olduğunuz yemeğin fotoğrafını çekin ve sohbet edin.GPT evinizde bulunan malzemelerden neler hazırlayabileceğinizi size anlatabilirim.

Bu görsel bilgiyi anlama ve yorumlama yeteneği, GPT-4 görsellere altyazı ekleme, görsel soru yanıtlama ve hatta içerik oluşturma gibi görevler için güçlü bir araç. Hem metin hem de görsel anlayışın bütünleştirilmesiyle, GPT-4 reklamcılık, tasarım ve e-ticaret gibi çeşitli endüstrilerde devrim yaratma ve insanların sıkıcı, sıradan görevleri yerine getirmesine yardımcı olma potansiyeline sahiptir.

Gelişmiş dil modeli ayrıca ekran görüntülerini ve metin, tablo, diyagram veya diğer görsel temsilleri içeren belgeleri 'anlar'. Örneğin, üç sayfalık bir araştırma makalesi yüklerseniz ve bunun özetlenmesine ve açıklanmasına ihtiyacınız varsa, GPT-4 bunu yapabilecek kapasitededir. 

Bloomberg sunucusu Jon Erlichman, elle çizilmiş bir tasarımı nasıl işlevsel bir web sitesine dönüştürebildiğini gösterdi.

Yeni teknoloji, görme engelli insanlar için çevreyi tarif etmek için kullanılabileceği gibi, bir hareket yardımcısı olarak da kullanılabilir. Bu amaçla, Open AI zaten adlı bir uygulama ile ortaklık kurmuştur. Benim gözlerim ol görme engellilere, örneğin market alışverişi yaparken bir şeye bakmaları gerektiğinde yardım eli uzatmak için tasarlanmıştır. Uygulama, "görebilen gönüllülerin ve profesyonellerin, kör ve az gören insanların daha bağımsız yaşamlar sürmelerine yardımcı olmak için büyük ve küçük görevleri çözmek için gözlerini ödünç vermelerine" izin veriyor. Şimdi, aynı zamanda tarafından desteklenen sanal bir gönüllü aracı sunuyor. OpenAI'S GPT-4.

Rağmen OpenAI'S GPT-4 şu anda metin ve görüntüleri giriş olarak işleme yeteneği sunuyor, model henüz ses ve video girişlerini işleyecek donanıma sahip değil. Bununla birlikte, bu yöntemlerin teknolojinin bir sonraki versiyonuna dahil edilebileceğine dair göstergeler var.

Daha fazla oku:

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Agne, metaverse, yapay zeka ve dünyadaki en son trendleri ve gelişmeleri takip eden bir gazetecidir. Web3 için endüstriler Metaverse Post. Hikaye anlatıcılığına olan tutkusu, onu bu alanlardaki uzmanlarla çok sayıda röportaj yapmaya ve her zaman heyecan verici ve ilgi çekici hikayeleri ortaya çıkarmaya yöneltti. Agne, edebiyat alanında lisans derecesine sahiptir ve seyahat, sanat ve kültür de dahil olmak üzere çok çeşitli konularda yazma konusunda geniş bir geçmişe sahiptir. Ayrıca hayvan hakları örgütünde gönüllü olarak editör olarak çalıştı ve burada hayvan refahı sorunları hakkında farkındalığın artmasına yardımcı oldu. Onunla iletişime geç [e-posta korumalı].

Daha fazla haber
Agne Cimerman
Agne Cimerman

Agne, metaverse, yapay zeka ve dünyadaki en son trendleri ve gelişmeleri takip eden bir gazetecidir. Web3 için endüstriler Metaverse Post. Hikaye anlatıcılığına olan tutkusu, onu bu alanlardaki uzmanlarla çok sayıda röportaj yapmaya ve her zaman heyecan verici ve ilgi çekici hikayeleri ortaya çıkarmaya yöneltti. Agne, edebiyat alanında lisans derecesine sahiptir ve seyahat, sanat ve kültür de dahil olmak üzere çok çeşitli konularda yazma konusunda geniş bir geçmişe sahiptir. Ayrıca hayvan hakları örgütünde gönüllü olarak editör olarak çalıştı ve burada hayvan refahı sorunları hakkında farkındalığın artmasına yardımcı oldu. Onunla iletişime geç [e-posta korumalı].

Hüküm Günü Geliyor: ABD Mahkemesi Adalet Bakanlığı'nın Savunmasını Değerlendirirken CZ'nin Kaderi Dengede

Changpeng Zhao bugün Seattle'daki bir ABD mahkemesinde cezayla karşı karşıya kalmaya hazırlanıyor.

bilmek Daha

Samourai Cüzdan Kurucuları, Darknet Anlaşmalarında 2 Milyar Dolarlık Kolaylık Sağlamakla Suçlanıyor

Samourai Cüzdan kurucularının tutuklanması, sektör için kayda değer bir gerilemeyi temsil ediyor ve ısrarcı tutumun altını çiziyor ...

bilmek Daha
Yenilikçi Teknoloji Topluluğumuza Katılın
Devamını Oku
Daha fazla
Nisan 2024'te Hack ve Dolandırıcılıklarda Tarihi Düşükler Görüldü, CertiK Mart Ayına Göre %141 Düşüş Bildirdi
Piyasalar Güvenlik Wiki Hikayeler ve İncelemeler Teknoloji
Nisan 2024'te Hack ve Dolandırıcılıklarda Tarihi Düşükler Görüldü, CertiK Mart Ayına Göre %141 Düşüş Bildirdi
Mayıs 1, 2024
Bitcoin Fiyatı Federal Reserve'ün Faiz Oranı Kararı Açıklaması Öncesinde Düşüyor, Analistler Potansiyel Piyasa Değişimi Konusunda Uyardı
Piyasalar Haber Raporu Teknoloji
Bitcoin Fiyatı Federal Reserve'ün Faiz Oranı Kararı Açıklaması Öncesinde Düşüyor, Analistler Potansiyel Piyasa Değişimi Konusunda Uyardı
Mayıs 1, 2024
PlayFi, Tak ve Çalıştır İçin MultiversX'i Entegre Ediyor Web3 Oyun Deneyimi
İşletme Haber Raporu Teknoloji
PlayFi, Tak ve Çalıştır İçin MultiversX'i Entegre Ediyor Web3 Oyun Deneyimi
Mayıs 1, 2024
Galxe, Gelişmiş Gizlilik ve Doğrulama Araçlarıyla Passport V2'yi Tanıtıyor Web3
Haber Raporu Teknoloji
Galxe, Gelişmiş Gizlilik ve Doğrulama Araçlarıyla Passport V2'yi Tanıtıyor Web3
30 Nisan 2024
CRYPTOMERIA LABS PTE. LTD.