Haber Raporu SMW Teknoloji
24 Nisan 2023

MiniGPT-4: Karmaşık Görüntü Açıklamaları için Yeni Yapay Zeka Modeli

Kısaca

MiniGPT-4 birleştiren bir yapay zeka modelidir. dili anlama ile görsel işleme.

Vicuna adında donmuş bir görsel kodlayıcı kullanıyor ve GPT-4, en son Geniş Dil Modeli OpenAI.

MiniGPT-4 doğru resim açıklamaları üretebilir, resimlere dayalı metinler yazabilir, resimlerde gösterilen sorunlara çözümler sunabilir ve hatta kullanıcılara bazı şeylerin nasıl yapılacağını fotoğraflara dayanarak öğretebilir.

Görsel içeriğin nasıl yorumlanacağını ve tanımlanacağını anlamak, e-ticaretten sosyal medyaya kadar geniş bir uygulama yelpazesi için gereklidir. Girmek MiniGPT-4, görsel işlemenin gücünü en son dil anlayışıyla birleştiren en son yapay zeka modeli. 

MiniGPT-4 Doğru görüntü açıklamaları oluşturmak, görüntülere dayalı hikayeler ve şiirler yazmak, resimlerde tasvir edilen sorunlara çözümler sunmak ve hatta kullanıcılara yemeğe göre nasıl yemek pişireceklerini öğretmek için donmuş bir görsel kodlayıcı ve tek bir projeksiyon katmanı aracılığıyla bağlanan büyük bir dil modeli kullanır fotoğraflar. 

MiniGPT-4: Karmaşık Görüntü Açıklamaları için Yeni Yapay Zeka Modeli
Mini aracılığıylaGPT-4

Model oldukça verimlidir ve görsel özellikleri donmuş büyük dil modeli Vicuna ile hizalayan doğrusal katmanı eğitmek için yalnızca 5 milyon görüntü-metin çiftinin hizalanmasını gerektirir. 

Vicuna üzerine inşa edilmiştir LLaMA ve karmaşık dilsel görevleri gerçekleştirebilir. GPT-4, en son Geniş Dil Modeli OpenAI, Mini'ye güç verirGPT-4. Multimodal doğası GPT-4 onu öncekilerden farklı kılarak video oyunları da dahil olmak üzere çeşitli uygulamalara uygun hale getiriyor. Chrome uzantılarıve karmaşık muhakeme soruları.

MiniGPT-4 benzer yetenekler gösterdi GPT-4ayrıntılı görsel açıklamaları oluşturmak ve elle yazılmış taslaklardan web siteleri oluşturmak gibi. Modelin dil çıktısını iyileştirmek amacıyla, konuşma şablonu kullanılarak daha fazla ince ayar yapılması için daha iyi bir veri kümesi seçildi. Bu, gelişmiş güvenilirlik ve genel kullanılabilirlik ile daha iyi dil üretimiyle sonuçlandı.

Modelin istisnai yetenekleri, iki aşamalı eğitim süreciMini'ye izin verenGPT görüntülerin doğru ve doğal dildeki açıklamalarını oluşturmak. İlk aşamada MiniGPT-4 Yukarıda belirtildiği gibi milyonlarca resim-metin çifti üzerinde eğitilerek nesneler, insanlar ve yerler hakkında bilgi edinmesine ve bunları kelimelerle anlatmasına olanak tanır. Bu ön eğitim yaklaşık 10 saat sürer ve dört adet A100 (80GB) GPU gerektirir. Bu aşamanın çıktısı, giriş görüntüsüne dayalı olarak görüş transformatörü tarafından üretilir.

Ancak ön eğitimin ilk aşaması, tekrarlanan ifadeler, parçalanmış cümleler veya alakasız içerik gibi tutarlılıktan yoksun çıktılar üretebilir. Bu sorunu çözmek için MiniGPT-4 modelin metin açıklamalarını daha doğru ve doğal olacak şekilde ayarlamak için daha küçük ancak yüksek kaliteli görüntü-metin çifti veri kümesinin kullanıldığı ikinci bir eğitim aşamasından geçer.

Mini, web sitesi düzenleri oluşturmaktan görsellerde gösterilen sorunlara çözüm sunmaya kadarGPT-4 Yapay zeka dünyasında ileriye doğru atılmış etkileyici bir adımdır ve bu yalnızca başlangıçtır.

Daha fazla oku:

Etiketler:

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Agne, metaverse, yapay zeka ve dünyadaki en son trendleri ve gelişmeleri takip eden bir gazetecidir. Web3 için endüstriler Metaverse Post. Hikaye anlatıcılığına olan tutkusu, onu bu alanlardaki uzmanlarla çok sayıda röportaj yapmaya ve her zaman heyecan verici ve ilgi çekici hikayeleri ortaya çıkarmaya yöneltti. Agne, edebiyat alanında lisans derecesine sahiptir ve seyahat, sanat ve kültür de dahil olmak üzere çok çeşitli konularda yazma konusunda geniş bir geçmişe sahiptir. Ayrıca hayvan hakları örgütünde gönüllü olarak editör olarak çalıştı ve burada hayvan refahı sorunları hakkında farkındalığın artmasına yardımcı oldu. Onunla iletişime geç [e-posta korumalı].

Daha fazla haber
Agne Cimerman
Agne Cimerman

Agne, metaverse, yapay zeka ve dünyadaki en son trendleri ve gelişmeleri takip eden bir gazetecidir. Web3 için endüstriler Metaverse Post. Hikaye anlatıcılığına olan tutkusu, onu bu alanlardaki uzmanlarla çok sayıda röportaj yapmaya ve her zaman heyecan verici ve ilgi çekici hikayeleri ortaya çıkarmaya yöneltti. Agne, edebiyat alanında lisans derecesine sahiptir ve seyahat, sanat ve kültür de dahil olmak üzere çok çeşitli konularda yazma konusunda geniş bir geçmişe sahiptir. Ayrıca hayvan hakları örgütünde gönüllü olarak editör olarak çalıştı ve burada hayvan refahı sorunları hakkında farkındalığın artmasına yardımcı oldu. Onunla iletişime geç [e-posta korumalı].

Volatilite Ortasında Bitcoin ETF'lerine Yönelik Kurumsal İştah Artıyor

13F başvuruları aracılığıyla yapılan açıklamalar, önemli kurumsal yatırımcıların Bitcoin ETF'leriyle uğraştığını ortaya koyuyor ve Bitcoin ETF'lerinin artan bir şekilde kabul edildiğinin altını çiziyor.

bilmek Daha

Hüküm Günü Geliyor: ABD Mahkemesi Adalet Bakanlığı'nın Savunmasını Değerlendirirken CZ'nin Kaderi Dengede

Changpeng Zhao bugün Seattle'daki bir ABD mahkemesinde cezayla karşı karşıya kalmaya hazırlanıyor.

bilmek Daha
Yenilikçi Teknoloji Topluluğumuza Katılın
Devamını Oku
Daha fazla
Espresso Systems, Toplamanın Birlikte Çalışabilirliğini Artırmak İçin AggLayer'ı Geliştirmek İçin Polygon Laboratuvarlarıyla İşbirliği Yapıyor
İşletme Haber Raporu Teknoloji
Espresso Systems, Toplamanın Birlikte Çalışabilirliğini Artırmak İçin AggLayer'ı Geliştirmek İçin Polygon Laboratuvarlarıyla İşbirliği Yapıyor
Mayıs 9, 2024
ZKP Destekli Altyapı Protokolü ZKBase Yol Haritasını Açıkladı, Mayıs Ayında Testnet Lansmanını Planlıyor
Haber Raporu Teknoloji
ZKP Destekli Altyapı Protokolü ZKBase Yol Haritasını Açıkladı, Mayıs Ayında Testnet Lansmanını Planlıyor
Mayıs 9, 2024
BLOCKCHANCE ve CONF3RENCE Almanya'nın En Büyükleri için Birleşiyor Web3 Dortmund'daki konferans
İşletme Piyasalar Yazılım Hikayeler ve İncelemeler Teknoloji
BLOCKCHANCE ve CONF3RENCE Almanya'nın En Büyükleri için Birleşiyor Web3 Dortmund'daki konferans
Mayıs 9, 2024
NuLink Bybit'te Başlıyor Web3 İDO Platformu. Abonelik Aşaması 13 Mayıs'a Kadar Uzatılıyor
Piyasalar Haber Raporu Teknoloji
NuLink Bybit'te Başlıyor Web3 İDO Platformu. Abonelik Aşaması 13 Mayıs'a Kadar Uzatılıyor
Mayıs 9, 2024
CRYPTOMERIA LABS PTE. LTD.