Facebook, AI Transformers'ın Performansını İkiye Katlamak İçin Yeni Bir Yöntem Geliştiriyor
Kısaca
Facebook, trafo mimarisine dayalı yapay zeka trafolarının performansını ikiye katlamak için yeni bir yöntem geliştirdi.
Yeni yöntem, farklı blokların işlenmesi arasındaki boşluklarda en benzer yamaları bulur ve hesaplama karmaşıklığını azaltmak için bunları birleştirir.
facebook geliştirdi Yeni yöntem AI transformatörlerinin performansını iki katına çıkarmak için. yöntem trafo mimarisine dayalı ve özellikle kitaplar, makaleler ve bloglar gibi uzun biçimli metinler için tasarlanmıştır. Yeni AI transformatörünün amacı, performansını iyileştirmektir. trafo tabanlı modeller uzun dizileri işlemede daha verimli ve etkili hale getirerek uzun biçimli metin üzerinde. AI trafosunun sonuçları çok umut verici ve bu yeni yöntemin, trafo tabanlı modellerin çeşitli görevlerdeki performansını iyileştirmeye yardımcı olma şansı var.
Bu yeni yöntemin, dil çevirisi, özetleme ve soru yanıtlama sistemleri gibi doğal dil işleme görevleri üzerinde önemli bir etkiye sahip olması bekleniyor. Ayrıca, daha uzun ve daha karmaşık metinleri işleyebilen daha gelişmiş AI modellerinin geliştirilmesine yol açması bekleniyor.
Daha fazla oku: 10+ En İyi AI Fotoğraf Editörü 2023: Çevrimiçi ve Ücretsiz |
Görüntüyü işlemek için, modern dönüştürücüler görüntüyü yamalar halinde keser (genellikle kareler: aşağıdaki gif'e bakın) ve ardından bu parçacıkların her biri bir "belirteç" ile temsil edilen temsilleri üzerinde çalışır. Transformatörler, bildiğimiz gibi, bu simge parçalarından ne kadar çok varsa (bu hem metinler hem de resimler için geçerlidir) daha yavaş çalışır ve en yaygın transformatör ikinci dereceden bir ilişkiye sahiptir. Yani, daha fazla belirteç eklendikçe işlem daha yavaş hale gelir. Bu sorunu ele almak için araştırmacılar, görüntü işleme için gereken belirteç sayısını azaltmak için hiyerarşik ve uyarlanabilir havuzlama gibi çeşitli teknikler önerdiler. Bu yöntemler, hesaplama maliyetini en aza indirirken çıktı kalitesini korumayı amaçlar.
Yeni yöntem, farklı blokların işlenmesi arasındaki boşluklarda en benzer yamaları bulur ve hesaplama karmaşıklığını azaltmak için bunları birleştirir. Birleştirilmiş belirteçlerin payı bir hiperparametredir; ne kadar yüksekse, kalite o kadar düşük ama aynı zamanda hızlanma da o kadar yüksek olur. Deneyler, belirteçlerin yaklaşık %40'ını %0.1-0.4'lük bir kalite kaybıyla birleştirmenin ve iki kat hızlanma elde etmenin (böylece daha az bellek tüketmenin) mümkün olduğunu gösteriyor. Bu yeni yöntem, görüntü işlemenin hesaplama karmaşıklığını azaltmak için umut verici bir çözümdür ve nihai çıktının kalitesinden ödün vermeden daha hızlı ve daha verimli işlemeye izin verebilir.
Yaratıcılığa ve bir şeyin nasıl çalıştığını anlamaya dayalı bu tür mühendislik yaklaşımları çok çekici görünüyor. Ayrıca Meta'nın geliştiricileri, oradaki işleri hızlandırmak için StableDiffusion'a daha fazlasını getirme sözü veriyor. Transformatörler her yerde olduğu için, bu tür hilelerin çok çeşitli modellerde hızla uygulanabilmesi harika. Bu, mühendislik çözümlerinin çeşitli endüstrilerde geniş bir etkiye sahip olma potansiyelini göstermektedir. Bu gelişmelerin nasıl olduğunu görmek ilginç olacak. trafo modelleri zaman içinde gelişmeye ve gelişmeye devam edecektir.
- Meta AI ve Paperswithcode bilimsel metinler üzerine eğitilmiş, daha doğru ve daha hızlı tahminler sağlayan ilk 120B modeli Galactica'yı piyasaya sürdü. Galactica'nın amacı, araştırmacıların önemli olanı alakasız olandan ayırmasına yardımcı olmaktır.
Daha fazla ilgili haber okuyun:
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.
Daha fazla haberDamir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.