Haber Raporu Teknoloji
Mayıs 29, 2023

Google, AI Model Flamingo'ya YouTube Videoları için Açıklama Yazmayı Öğretti

Kısaca

Flamingo, kısa videoların arama yoluyla bulunmasının zor olması sorununu otomatik olarak açıklamalar oluşturarak çözer.

AI araştırma laboratuvarı Google DeepMind, gelişmiş YouTube'daki kısa videolar için açıklama yazabilen Flamingo adlı görsel bir dil modeli. Flamingo'nun ele aldığı sorun, açıklamada gerekli bilgilerin bulunmaması nedeniyle kısa videoların arama yoluyla bulunmasının genellikle zor olmasıdır. Flamingo modeli, kolay aramayı sağlamak için "perde arkasında" kullanılan video barındırma sitelerinde otomatik olarak milyonlarca kısa video klip için metinler oluşturarak bu sorunu çözmektedir. Video yazarları meta verileri görmese de, izleyicilerin kısa videoları bulmasına ve gezinmesine yardımcı olur. Şu anda Flamingo, uzun süredir yeni klipler üzerinde çalışıyor ve YouTube'a yüklenen eski videoları işliyor.

Google, AI Model Flamingo'ya YouTube Videoları için Açıklama Yazmayı Öğretti
derinmind.com

Geçmişte Google, insanların arama çubuğunu kullanarak videoların içinde bilgi aramasını sağlayan bir algoritma sunmuştu. Son zamanlarda TwelveLabs, benzer bir gelişme için yatırımcılardan 12 milyon dolar topladı. Bu araçlar video için yeni fırsatlar yaratıyor içerik oluşturucuları erişimlerini ve görünürlüklerini artırmak için. Arama sürecini ve kısa biçimli içeriğin keşfedilmesini iyileştirmek ve basitleştirmek için yapay zekadan yararlanan DeepMind ve benzeri girişimler, videoda devrim yaratıyor Akış hizmetleri. Daha akıllı ve verimli arama teknolojilerinin geliştirilmesine katkıda bulunarak, izleyicilerin kendilerini gerçekten ilgilendiren içeriği bulmasını daha da kolaylaştırıyorlar.

Yapay zeka, arama teknolojilerinin yükseltilmesinde önemli bir rol oynuyor. Yapay zekadan yararlanan Flamingo modeli, içeriği tarayıp seri hale getirebilir ve kullanıcıların gezinmesine yardımcı olmak için içeriği özetleyen metinler oluşturabilir. Flamingo modeli, videonun işitsel ve görsel içeriğine dayalı olarak bir video klibin metinsel açıklamalarını oluşturmak için derin sinir ağlarını kullanır. Kısa biçimli içeriğin işitsel ve görsel bileşenlerini yakalayabilir ve bunları kullanıcıların araması ve erişmesi kolay bir özete dönüştürebilir.

AI kullanımı, kullanıcılar için açıklama eklerken içerik oluşturucuların manuel çabalarında gözden kaçabilecek önemli bilgilerin belirlenmesine yardımcı olabilir. Her ayrıntıyı manuel olarak yakalamak için harcanan zaman alıcı çaba, özellikle YouTube gibi platformlara yüklenen kısa biçimli video içeriğinin sürekli akışı söz konusu olduğunda her zaman pratik değildir. Bu, belirli kısa biçimli içeriği ararken kullanıcının kafa karışıklığına ve hayal kırıklığına yol açabilir. Bununla birlikte, Flamingo gibi görsel dil modellerinin kullanılmasıyla, kolay erişim için bir özet sağlamak üzere meta veriler otomatik olarak oluşturulabilir, böylece zamandan tasarruf edilir ve arama süreci daha verimli ve doğru hale getirilir.

Flamingo, Açık Uçlu Görevler İçin Son Teknoloji Görsel Dil Modelleri Oluşturuyor

En önemli detaylar, tek bir görsel dil modeli olan Flamingo'nun tanıtılmasıdır (VLM), çok çeşitli açık uçlu çok modlu görevlerde birkaç adımlı öğrenmede yeni bir teknoloji durumu ortaya koyuyor. Flamingo, tek bir görsel dil modelidir (VLM)defigeniş bir yelpazedeki açık uçlu çok modlu faaliyetlerde birkaç adımlık öğrenme. Bir alır istemi Girdi olarak serpiştirilmiş resimler, videolar ve metinden oluşur ve ilgili dilin çıktısını alır. Flamingo'nun görsel ve metin arayüzü, büyük dil modellerinde olduğu gibi (LLM'ler), modeli çok modlu bir hedefe ulaşmaya yönlendirebilir. Modele yeni bir görüntü veya video ile bir soru sorulabilir ve ardından birkaç örnek görsel girdi çifti ve Flamingo'nun isteminde oluşturulan beklenen metin yanıtları verilerek bir yanıt oluşturulabilir.

Flamingo, büyük dil modellerini güçlü görsel temsillerle birleştiren ve makine öğrenimi amacıyla açıklamalı herhangi bir veri kullanmadan yalnızca web'den gelen tamamlayıcı büyük ölçekli çok modlu verilerin bir karışımı üzerinde eğitilen görsel bir dil modelidir. Görev başına en az dört örnek verildiğinde önceki tüm birkaç adımlık öğrenme yaklaşımlarını geride bırakır ve her görev için bağımsız olarak ince ayarlanmış ve optimize edilmiş yöntemlerden daha iyi performans gösterir ve göreve özgü çok sayıda büyüklük sırasını kullanır. Ayrıca, modelin, cinsiyet ve ten rengiyle ilgili resimlere altyazı ekleme ve oluşturulan altyazıları, metnin toksisitesini değerlendiren Google'ın Perspective API'si aracılığıyla çalıştırma gibi, mevcut kıyaslamalarının ötesinde niteliksel yeteneklerini de test etti. Flamingo, modeli değiştirmeden bu örneklere ve diğer görevlere anında verimli bir şekilde uyum sağlamayı mümkün kılar ve kullanıma hazır çok modlu diyalog yeteneklerini gösterir.

Flamingo, göreve özgü minimum örneklerle görüntü ve video anlama görevlerine uygulanabilen genel amaçlı bir model ailesidir. Göreve özgü minimum örnekle görüntü ve video anlama görevlerine uygulanabilen etkili ve verimli bir genel amaçlı model ailesidir. Flamingo'nun yetenekleri, görsel asistan gibi daha iyi yorumlanabilirlik ve heyecan verici yeni uygulamalar sağlayabilen öğrenilmiş görsel dil modelleri ile zengin etkileşimlere giden yolu açıyor.

AI hakkında daha fazlasını okuyun:

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Daha fazla haber
Damir Yalalov
Damir Yalalov

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Hot Stories
Bültenimize Katılın.
En Yeni Haberler

Volatilite Ortasında Bitcoin ETF'lerine Yönelik Kurumsal İştah Artıyor

13F başvuruları aracılığıyla yapılan açıklamalar, önemli kurumsal yatırımcıların Bitcoin ETF'leriyle uğraştığını ortaya koyuyor ve Bitcoin ETF'lerinin artan bir şekilde kabul edildiğinin altını çiziyor.

bilmek Daha

Hüküm Günü Geliyor: ABD Mahkemesi Adalet Bakanlığı'nın Savunmasını Değerlendirirken CZ'nin Kaderi Dengede

Changpeng Zhao bugün Seattle'daki bir ABD mahkemesinde cezayla karşı karşıya kalmaya hazırlanıyor.

bilmek Daha
Yenilikçi Teknoloji Topluluğumuza Katılın
Devamını Oku
Daha fazla
Injective, inEVM'ye Yeniden Bağlantı Güvenliği Getirmek İçin AltLayer ile Güçlerini Birleştiriyor
İşletme Haber Raporu Teknoloji
Injective, inEVM'ye Yeniden Bağlantı Güvenliği Getirmek İçin AltLayer ile Güçlerini Birleştiriyor
Mayıs 3, 2024
Masa, MASA Borç Verme Havuzunu Tanıtmak İçin Teller ile İşbirliği Yapıyor, Temelde USDC Borçlanmasını Sağlıyor
Piyasalar Haber Raporu Teknoloji
Masa, MASA Borç Verme Havuzunu Tanıtmak İçin Teller ile İşbirliği Yapıyor, Temelde USDC Borçlanmasını Sağlıyor
Mayıs 3, 2024
Velodrome Önümüzdeki Haftalarda Superchain Beta Sürümünü Piyasaya Sürüyor ve OP Yığın Katmanı 2 Blok Zincirlerine Genişliyor
Piyasalar Haber Raporu Teknoloji
Velodrome Önümüzdeki Haftalarda Superchain Beta Sürümünü Piyasaya Sürüyor ve OP Yığın Katmanı 2 Blok Zincirlerine Genişliyor
Mayıs 3, 2024
CARV, Veri Katmanını Merkezi Olmayan Hale Getirmek ve Ödülleri Dağıtmak İçin Aethir ile Ortaklığını Duyurdu
İşletme Haber Raporu Teknoloji
CARV, Veri Katmanını Merkezi Olmayan Hale Getirmek ve Ödülleri Dağıtmak İçin Aethir ile Ortaklığını Duyurdu
Mayıs 3, 2024
CRYPTOMERIA LABS PTE. LTD.