Haber Raporu Teknoloji
15 Mart, 2023

Facebook, AI Transformers'ın Performansını İkiye Katlamak İçin Yeni Bir Yöntem Geliştiriyor

Kısaca

Facebook, trafo mimarisine dayalı yapay zeka trafolarının performansını ikiye katlamak için yeni bir yöntem geliştirdi.

Yeni yöntem, farklı blokların işlenmesi arasındaki boşluklarda en benzer yamaları bulur ve hesaplama karmaşıklığını azaltmak için bunları birleştirir.

facebook geliştirdi Yeni yöntem AI transformatörlerinin performansını iki katına çıkarmak için. yöntem trafo mimarisine dayalı ve özellikle kitaplar, makaleler ve bloglar gibi uzun biçimli metinler için tasarlanmıştır. Yeni AI transformatörünün amacı, performansını iyileştirmektir. trafo tabanlı modeller uzun dizileri işlemede daha verimli ve etkili hale getirerek uzun biçimli metin üzerinde. AI trafosunun sonuçları çok umut verici ve bu yeni yöntemin, trafo tabanlı modellerin çeşitli görevlerdeki performansını iyileştirmeye yardımcı olma şansı var.

Bu yeni yöntemin, dil çevirisi, özetleme ve soru yanıtlama sistemleri gibi doğal dil işleme görevleri üzerinde önemli bir etkiye sahip olması bekleniyor. Ayrıca, daha uzun ve daha karmaşık metinleri işleyebilen daha gelişmiş AI modellerinin geliştirilmesine yol açması bekleniyor.

Facebook, AI transformatörlerinin performansını ikiye katlamak için yeni bir yöntem geliştirdi
Daha fazla oku: 10+ En İyi AI Fotoğraf Editörü 2023: Çevrimiçi ve Ücretsiz

Görüntüyü işlemek için, modern dönüştürücüler görüntüyü yamalar halinde keser (genellikle kareler: aşağıdaki gif'e bakın) ve ardından bu parçacıkların her biri bir "belirteç" ile temsil edilen temsilleri üzerinde çalışır. Transformatörler, bildiğimiz gibi, bu simge parçalarından ne kadar çok varsa (bu hem metinler hem de resimler için geçerlidir) daha yavaş çalışır ve en yaygın transformatör ikinci dereceden bir ilişkiye sahiptir. Yani, daha fazla belirteç eklendikçe işlem daha yavaş hale gelir. Bu sorunu ele almak için araştırmacılar, görüntü işleme için gereken belirteç sayısını azaltmak için hiyerarşik ve uyarlanabilir havuzlama gibi çeşitli teknikler önerdiler. Bu yöntemler, hesaplama maliyetini en aza indirirken çıktı kalitesini korumayı amaçlar.

Yeni yöntem, farklı blokların işlenmesi arasındaki boşluklarda en benzer yamaları bulur ve hesaplama karmaşıklığını azaltmak için bunları birleştirir. Birleştirilmiş belirteçlerin payı bir hiperparametredir; ne kadar yüksekse, kalite o kadar düşük ama aynı zamanda hızlanma da o kadar yüksek olur. Deneyler, belirteçlerin yaklaşık %40'ını %0.1-0.4'lük bir kalite kaybıyla birleştirmenin ve iki kat hızlanma elde etmenin (böylece daha az bellek tüketmenin) mümkün olduğunu gösteriyor. Bu yeni yöntem, görüntü işlemenin hesaplama karmaşıklığını azaltmak için umut verici bir çözümdür ve nihai çıktının kalitesinden ödün vermeden daha hızlı ve daha verimli işlemeye izin verebilir.

Hangi yamaları birleştirdiğimizi görselleştirdiğimizde, 1) birbirine yakın olduklarını ve 2) aynı nesneyi tanımladıklarını görebiliriz (GIF'te aynı renkteki alanlara bakın). Yani, hiçbir önemli bilgi kaybolmaz; nesne, modelin "görüş alanında" kalır. Bu, dönüştürücüde ne kadar sonra uygulanırsa, o kadar çok belirteç birleştirilir (çünkü bunlar, görüntünün içeriğini iyi tanımlayan üst düzey temsillerdir).

Yaratıcılığa ve bir şeyin nasıl çalıştığını anlamaya dayalı bu tür mühendislik yaklaşımları çok çekici görünüyor. Ayrıca Meta'nın geliştiricileri, oradaki işleri hızlandırmak için StableDiffusion'a daha fazlasını getirme sözü veriyor. Transformatörler her yerde olduğu için, bu tür hilelerin çok çeşitli modellerde hızla uygulanabilmesi harika. Bu, mühendislik çözümlerinin çeşitli endüstrilerde geniş bir etkiye sahip olma potansiyelini göstermektedir. Bu gelişmelerin nasıl olduğunu görmek ilginç olacak. trafo modelleri zaman içinde gelişmeye ve gelişmeye devam edecektir.

  • Meta AI ve Paperswithcode bilimsel metinler üzerine eğitilmiş, daha doğru ve daha hızlı tahminler sağlayan ilk 120B modeli Galactica'yı piyasaya sürdü. Galactica'nın amacı, araştırmacıların önemli olanı alakasız olandan ayırmasına yardımcı olmaktır.

Daha fazla ilgili haber okuyun:

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Daha fazla haber
Damir Yalalov
Damir Yalalov

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Hot Stories
Bültenimize Katılın.
En Yeni Haberler

Volatilite Ortasında Bitcoin ETF'lerine Yönelik Kurumsal İştah Artıyor

13F başvuruları aracılığıyla yapılan açıklamalar, önemli kurumsal yatırımcıların Bitcoin ETF'leriyle uğraştığını ortaya koyuyor ve Bitcoin ETF'lerinin artan bir şekilde kabul edildiğinin altını çiziyor.

bilmek Daha

Hüküm Günü Geliyor: ABD Mahkemesi Adalet Bakanlığı'nın Savunmasını Değerlendirirken CZ'nin Kaderi Dengede

Changpeng Zhao bugün Seattle'daki bir ABD mahkemesinde cezayla karşı karşıya kalmaya hazırlanıyor.

bilmek Daha
Yenilikçi Teknoloji Topluluğumuza Katılın
Devamını Oku
Daha fazla
Injective, inEVM'ye Yeniden Bağlantı Güvenliği Getirmek İçin AltLayer ile Güçlerini Birleştiriyor
İşletme Haber Raporu Teknoloji
Injective, inEVM'ye Yeniden Bağlantı Güvenliği Getirmek İçin AltLayer ile Güçlerini Birleştiriyor
Mayıs 3, 2024
Masa, MASA Borç Verme Havuzunu Tanıtmak İçin Teller ile İşbirliği Yapıyor, Temelde USDC Borçlanmasını Sağlıyor
Piyasalar Haber Raporu Teknoloji
Masa, MASA Borç Verme Havuzunu Tanıtmak İçin Teller ile İşbirliği Yapıyor, Temelde USDC Borçlanmasını Sağlıyor
Mayıs 3, 2024
Velodrome Önümüzdeki Haftalarda Superchain Beta Sürümünü Piyasaya Sürüyor ve OP Yığın Katmanı 2 Blok Zincirlerine Genişliyor
Piyasalar Haber Raporu Teknoloji
Velodrome Önümüzdeki Haftalarda Superchain Beta Sürümünü Piyasaya Sürüyor ve OP Yığın Katmanı 2 Blok Zincirlerine Genişliyor
Mayıs 3, 2024
CARV, Veri Katmanını Merkezi Olmayan Hale Getirmek ve Ödülleri Dağıtmak İçin Aethir ile Ortaklığını Duyurdu
İşletme Haber Raporu Teknoloji
CARV, Veri Katmanını Merkezi Olmayan Hale Getirmek ve Ödülleri Dağıtmak İçin Aethir ile Ortaklığını Duyurdu
Mayıs 3, 2024
CRYPTOMERIA LABS PTE. LTD.