Haber Raporu Teknoloji
Eylül 21, 2023

DALL-E 3 Sürümü Güçleniyor OpenAIEtkisi, Ayrılma Midjourney ve Stable Diffusion arkasında

Kısaca

DALL-E 3, sorunsuz bir şekilde entegre olacak şekilde ayarlanmıştır GPT-4için özel olarak tasarlanmış ChatGPT+ aboneler.

DALL-E 3, isimleri açıkça anıldığında tanınmış kişilerin görsellerini yeniden oluşturmaktan kaçınır.

DALL-E 3'e erişim için zaman çizelgesi Ekim ayına ayarlandı.

OpenAI son yaratımını tanıttı: DALL-E3. Önceki modellerden farklı olarak DALL-E 3, harfler ve parmaklar gibi karmaşık vücut ayrıntıları gibi konuları ele alarak ayrıntıların iyileştirilmesine odaklanıyor. Sonuç? Karmaşık istemlere veya geçici çözümlere ihtiyaç duymadan, estetik açıdan hoş görüntüler dizisi.

DALL-E 3 Sürümü Güçleniyor OpenAIEtkisi, Ayrılma Midjourney ve Stable Diffusion arkasında

Bu sürümün kapsamlı uygulama ayrıntıları, makaleler veya API'lerle birlikte gelmediğini unutmamak önemlidir. Bunun yerine DALL-E 3, sorunsuz bir şekilde entegre olacak şekilde ayarlanmıştır. GPT-4için özel olarak tasarlanmış ChatGPT+ aboneler.

Bu gelişme, yapay zeka ortamında sarsıcı bir değişim olmayabilir, aksine modeller arasındaki işbirliğinde ileriye doğru atılmış bir adım olabilir. Birçoğu bir sonrakinin olacağını tahmin ediyor Stable Diffusion model daha da fazla gelişmişlik ve sanatsal çekicilik sunacak.

Bağlama koymak için, OpenAIAI görüntü oluşturma yolculuğu oldukça zorluydu:

  • 2021: 1 milyar parametreli bir model olan DALL-E 12, sınırlı bilgilerle tanıtıldı.
  • 2021: 2 milyar parametreli bir model olan GLIDE, açık kaynaklı 300 milyon parametreli modellerle birlikte tanıtıldı.
  • 2022: DALL-E 2, unCLIP kağıdı ve API ile birlikte 2 milyar parametreyle geldi.
  • 2023: DALL-E 3 girişini yaptı ve ayrıntılar biraz gizemli olsa da bir şey açık: GPT-4 için ChatGPT+ aboneler.

Şu an itibariyle DALL-E 3'ün görselleri biraz kısıtlı kalıyor. En son teknolojiyle (SOTA) kod temeli, blog yazısı veya ayrıntılı karşılaştırma yoktur. OpenAI kartlarını göğsüne yakın tutuyor gibi görünüyor.

DALL-E 3 Sürümü Güçleniyor OpenAIEtkisi, Ayrılma Midjourney ve Stable Diffusion arkasında

Modelin önceki modellere kıyasla nüanslar ve ayrıntılar konusunda daha derin bir anlayışa sahip olduğu öne sürülüyor. Bu, yaratıcı konseptlerinizi son derece hassas görüntülere dönüştürmenin daha sorunsuz bir süreç olması beklendiği anlamına gelir.

DALL-E 3'ün ilgi çekici vaatlerinden biri de ChatGPT. Bu, kullanıcıların karmaşık istemler oluşturmakla uğraşmalarına gerek kalmayacağı anlamına gelir; kısa bir açıklama yeterli olacaktır ChatGPT sizin adınıza ustaca ayrıntılı istemler oluşturmak.

OpenAI aynı zamanda uzun yönlendirmelerde bağlamın önemini de vurgulamıştır. DALL-E 3, ayrıntıyı benimseyecek ve onu kapsamlı istemlerde açıklanan bağlama daha uyumlu hale getirecek şekilde tasarlanmıştır.

Ancak her yeni yapay zeka modelinde olduğu gibi burada da bilinmeyen bir unsur var. İlk bakışlar umut verici görünse de, gerçek turnusol testi uzun süreli kullanımla birlikte gelecektir. Verimliliği ve çalışma hızıyla ilgili sorular devam ediyor.

DALL-E 3'ün çok aşamalı bir yayılma süreci olması muhtemeldir. GPT-4 metin kodlayıcı olarak görev yapar. Bu kurulumun karmaşık mekaniği gizlilik içinde kalabilir.

DALL-E 3'e erişim için zaman çizelgesi başlangıçta Ekim ayına ayarlandı. ChatGPT Artı ve ChatGPT Kurumsal kullanıcıBundan sonra araştırmacılar için daha geniş bir erişim olasılığı var.

İlgili bağlantılar: OpenAIAltman, AI Risklerini Tartışmak İçin ABD Senatosunda

Nüansları ve Sansür DALL-E 3'ün

DALL-E 3'ün gelişiminin ana odak noktası, yeteneklerinin kısıtlanması konusundaki titiz süreçti. Bu, belirli içerik türlerini hariç tutmak için tasarlanmış sıkı hizalama ve filtreleri içeriyordu. Örneğin model, ünlü kişilerin resimlerini oluşturmayı, ünlü sanatçıların tarzında sanat eserlerini kopyalamayı veya güvensiz olduğu düşünülen herhangi bir içerik oluşturmayı katı bir şekilde reddediyor. OpenAI'nin ayırt edici standartları. Bu stratejik yaklaşım yalnızca sınırlamalarla ilgili değildir; bu, şirketi potansiyel hukuki karışıklıklardan korumayı amaçlayan proaktif bir önlemdir.

Ancak bu filtrelerin ve hizalamaların ötesinde bazı ilgi çekici gözlemler gün ışığına çıkıyor. DALL-E 3, fotogerçekçi içerik üretme konusunda belirli bir zayıflık sergiliyor gibi görünüyor. Gerçek fotoğrafları kusursuz bir şekilde taklit eden görüntüler üretmek yerine, çıktı farklı bir stilize kalite taşır. Bu yapay zeka yapımı resimler neredeyse işlenmiş ve hafif plastik bir görünüm sergiliyor. Açıkça "fotoğraf" kelimesi sorulduğunda bile sonuç, karakteristik stilizasyonunda sağlam kalır.

İstem #1
İstem #1: Islak kumda yuvalanmış bir keşiş yengecinin yakın çekim fotoğrafı, yakınında deniz köpüğü ve kabuğunun ayrıntıları ve kumun dokusu vurgulanmıştır.
İstem #2
İstem #2: Rahat bir oturma odasında canlı sarı muz şeklinde bir kanepe oturuyor ve kıvrımı bir yığın renkli minderi kucaklıyor. Ahşap zeminde desenli bir halı eklektik bir çekicilik katıyor ve köşede bir saksı bitkisi pencereden süzülen güneş ışığına doğru uzanıyor.
İstem #3
İstem 3: Okyanus tabanında bulunan eski bir gemi enkazının fotoğrafı. Deniz bitkileri ahşap yapıyı ele geçirdi ve balıklar bu boşlukların içinde ve dışında yüzüyor. Batık hazineler ve eski toplar etrafa dağılmış, geçmişe bir bakış sağlıyor.

Bu özelliklere rağmen DALL-E 3'ün dikkate değer bir potansiyele dair bir fikir sunduğunu belirtmekte fayda var. Yarattıkları arasında bazı örnekler fotoğraflarla çarpıcı bir benzerlik sergiliyor. Bu görüntülerin simüle edilmiş gerçekçiliğinin, özellikle su altındayken aynı nesnenin gerçek bir fotoğrafının nasıl görüneceğiyle tam olarak aynı hizada olmayabileceğini akılda tutmak.

İlgili bağlantılar: Microsoft, DALL-E 2 tabanlı ilk profesyonel Metinden Görüntüye aracı olan Designer'ı tanıttı

DALL-E 3 Özellikleri ve Detayları

Bu yeni modelin gerçekte neler sunduğunu anlamak için biraz zaman ayırıp pikselleri inceleyelim ve satır aralarını okuyalım.

Stilizasyon Sanatı: Göz atmak OpenAI'in Instagram hesabı, zarif stilizasyonla karakterize edilen çok sayıda sanat eserini fark edeceksiniz. Etkileyici bir dizi soyut kompozisyon ve tasarım olmasına rağmen model, fotogerçekçi içerik üretmekten uzak duruyor gibi görünüyor. Burada vurgu gerçeği taklit etmek değil, estetik ve yaratıcılıktır.

Sanatsal Kısıtlamalar: DALL-E 3 öncekinden farklı bir yol izliyor. Yaşayan sanatçıların tarzında görüntüler yaratmayı inatla reddediyor; bu, belirli sanatçıların tarzlarını taklit edebilecek DALL-E 2'den keskin bir ayrılık. Bu, yaratıcı toplulukta, tıpkı ılımlı bir karşılamaya benzer şekilde, kaşları kaldırabilir. Stable Diffusion 2.0

Sanatçıları Güçlendirmek: Sanatçı haklarına saygı çerçevesinde, OpenAI sanatçıların çalışmalarını gelecekteki DALL-E sürümlerinden hariç tutmasına olanak tanır. Sanatçılar, haklarına sahip oldukları bir görseli göndererek, bu görselin model çıktısından hariç tutulmasını talep edebilirler. DALL-E'nin gelecekteki yinelemeleri, buna benzer içerik üretmekten kaçınacaktır. sanatçının tarzı.

Güvenlik ve Sansür: OpenAIGüvenlik konusundaki paranoyası açıkça ortada. Modelin güvenliğini test etmek için harici "kırmızı ekipler" ile işbirliği yaptılar ve modele müstehcen veya zararlı içeriğe yol açabilecek belirli kelimeleri göz ardı etmeyi öğretmek için girdi sınıflandırıcıları kullandılar. DALL-E 3, görüntüleri yeniden oluşturmaktan kaçınır halka açık figürler isimleri açıkça anıldığında. Ünlülerin bu kategoriye girip girmediği belirsizliğini koruyor ve bu da oluşturulan yüzlerin kalitesini potansiyel olarak etkiliyor.

Filigranlar ve İzleme: "Yapay zeka tarafından oluşturulan görüntüleri" izlemek için etiketlerin yerleştirilmesine ilişkin bir ipucu var; bu, oluşturulan içeriğin daha iyi izlenmesine ve potansiyel olarak filigranlanmasına yönelik bir adım olduğunu gösteriyor.

Metin ve Eller Geliştirildi: OpenAI rakipler arasında yaygın bir iddia olan gelişmiş metin oluşturma ve elle oluşturmanın çığırtkanlığını yapıyor. Gerçek test, özenle seçilmiş örneklerin ötesindeki gerçek çıktıda yatmaktadır.

Uzamsal Anlama: DALL-E 3, istemlerde açıklanan mekansal ilişkileri anlamada mükemmeldir. Bu, modelin karmaşık açılar ve kompozisyonlar oluşturma yeteneğini artırıyor, ancak kullanıcılar bu vaadin daha somut kanıtlarını bekliyor.

İstemlerin Gücü: İşin özü DALL-E3 hızlı yeteneklerinde ve entegrasyonunda yatmaktadır. ChatGPT. Hızlı tasarımın otomasyonunu, hızını ve basitleştirilmesini vaat ediyor. Buradaki eğilim şu yönde: chatGPT istemler oluşturma, belirsiz fikirleri veya ilkel yönlendirmeleri anlamlı olanlara dönüştürmek. DALL-E 3'ün gelişmiş bağlamsal anlayışı, süreci kolaylaştırarak kullanıcıların ayrıntıya değil amaca odaklanmasına olanak tanır.

Keşfedilmemiş Bölgeler: İç boyama, dış boyama, üretken dolgu ve 3 boyutlu modelleme gibi konular tartışmada özellikle eksik kaldı. Bu özelliklerin bulunmaması, özellikle çok yönlü modellere alışkın olan kullanıcılar için bir sınırlama olabilir.

Erişim Ayrıntıları: DALL-E 3 kullanılabilir olacak şekilde ayarlandı ChatGPT Plus ve Enterprise müşterileri Ekim başında. Ancak kredilerin tahsisine ilişkin ayrıntılar ChatGPT Ayrıca kullanıcılar ve ilgili maliyetler belirsizliğini koruyor. Erişim API aracılığıyla sağlanacaktır ve OpenAI Labs platformu "sonbaharın sonlarında."

Entegrasyon Becerisi: DALL-E, iş ortağı ve Microsoft ürünlerine sorunsuz bir şekilde entegre edilecek şekilde ayarlanmıştır. Sunumların, illüstrasyonların, tasarımların, logoların tamamı bağlam içinde ve desteğiyle güçlendirilmiş olarak oluşturulmasına tanık olmayı bekleyin. ChatGPT. Bu entegrasyonun ana akım haline gelmesi bekleniyor ve rakipler için önemli bir zorluk teşkil ediyor. Google, Bard'ıyla ve İdeogram.

Yüksek Lisans ve Görsel İçeriğin Yakınsaması: En ilgi çekici yön, Büyük Dil Modelleri (LLM'ler) ile görsel içerik oluşturma modellerinin yakınsamasıdır. Bu, karmaşık istem mühendisliğinden fikirlerin daha erişilebilir bir dilde ifade edilmesine geçiş anlamına gelir. Yapay zeka, bu ifadelerden bağlam ve fikirleri derleyerek karşı konulması zor yaratıcı olanaklar sunacak.

İlgili bağlantılar: Yapay Zeka Sanat Üreticileri için En İyi 50 Metinden Görüntüye İstemi Midjourney ve DALL-E

DALL-E 3: Yapay Zeka Görüntü Üretiminde Yeni Bir Lider Olun

OpenAIDALL-E 3'ü entegre etme kararı ChatGPT Ekosistem stratejik bir hamledir. Bu entegrasyon, DALL-E 3'ün 100 milyon aktif kullanıcıdan oluşan geniş bir kullanıcı veritabanına erişmesini sağlar. Bu adım, DALL-E 3'ün erişilebilirliğini önemli ölçüde artırır ve popülerliğini artırma potansiyeline sahiptir.

Şu anda, Midjourney ve Stable Diffusion övünmek 15 milyon kayıtlı kullanıcı. Ancak bu entegrasyonla DALL-E 3, on kat daha büyük bir kullanıcı tabanına, yani 100 milyon kullanıcıya erişim kazanacak. Bu, ChatGPT Artı abonelik Uygun bir fiyat noktasında bir sohbet robotuna, analitik araçlara ve görüntü oluşturmaya erişim sunduğu için plan daha da çekici hale geliyor.

Entegrasyon yalnızca mevcut kullanıcılar için avantajlı olmakla kalmıyor, aynı zamanda yeni kullanıcılar için de güçlü bir mıknatıs görevi görüyor. Genişletir OpenAI ekosistemin erişimi ve popülerliği, yapay zeka tarafından oluşturulan içerik çözümleri arayan bireylerin ilgisini çekiyor.

Bu stratejik hamle gelişmeye hazırlanıyor OpenAIgeliri ve diğer temel ölçümler. Şirketin yatırımcıları, özellikle yakın zamanda yaşanan gelişmelerin ışığında, bu gelişmeyi muhtemelen olumlu değerlendireceklerdir. Trafik hacminde %20 azalma yaz boyunca.

ChatGPT Web Trafiği Eylül'de %20 Düştü ve Düşmeye Devam Ediyor

Daha fazla ilgili konu okuyun:

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Daha fazla haber
Damir Yalalov
Damir Yalalov

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

DOGE Çılgınlığı: Dogecoin'in (DOGE) Son Zamanlardaki Değer Artışını Analiz Etmek

Kripto para endüstrisi hızla genişliyor ve meme paraları önemli bir yükselişe hazırlanıyor. Dogecoin (DOGE),...

bilmek Daha

Metaevrende Yapay Zeka Tarafından Üretilen İçeriğin Evrimi

Üretken AI içeriğinin ortaya çıkışı, sanal ortamdaki en büyüleyici gelişmelerden biridir ...

bilmek Daha
Yenilikçi Teknoloji Topluluğumuza Katılın
Devamını Oku
Daha fazla
Bu Haftanın En İyi Fırsatları, Yapay Zeka, BT Alanında Büyük Yatırımlar, Web3ve Kripto (22-26.04)
özet İşletme Piyasalar Teknoloji
Bu Haftanın En İyi Fırsatları, Yapay Zeka, BT Alanında Büyük Yatırımlar, Web3ve Kripto (22-26.04)
26 Nisan 2024
Vitalik Buterin PoW'un Merkezileştirilmesi Hakkında Yorum Yaptı ve PoS'a Kadar Bunun Geçici Bir Aşama Olduğunu Not Etti
Haber Raporu Teknoloji
Vitalik Buterin PoW'un Merkezileştirilmesi Hakkında Yorum Yaptı ve PoS'a Kadar Bunun Geçici Bir Aşama Olduğunu Not Etti
26 Nisan 2024
Offchain Labs, Optimism'in OP Stack'in Dolandırıcılık Kanıtlarında İki Kritik Güvenlik Açığı Keşfediyor
Haber Raporu Software Teknoloji
Offchain Labs, Optimism'in OP Stack'in Dolandırıcılık Kanıtlarında İki Kritik Güvenlik Açığı Keşfediyor
26 Nisan 2024
Dymension'ın RollApps'ten Likiditeyi Köprülemeye Yönelik Açık Pazarı eIBC Mainnet'te Başlatılıyor
Haber Raporu Teknoloji
Dymension'ın RollApps'ten Likiditeyi Köprülemeye Yönelik Açık Pazarı eIBC Mainnet'te Başlatılıyor 
26 Nisan 2024
CRYPTOMERIA LABS PTE. LTD.