01 Mei 2023

DeepFloyd and Beyond: Menjelajahi Seni AI Terbaru bersama CEO NightCafe Studio

Diterbitkan: 01 Mei 2023 pukul 7:00 Diperbarui: 02 Juni 2023 pukul 2:49

Diedit dan diperiksa faktanya: 01 Mei 2023 pukul 7

Singkatnya

Selama wawancara eksklusif, CEO NightCafe Studio memberikan wawasan dan perspektif berharga tentang seni yang dihasilkan AI.

Angus Russell memperkenalkan DeepFloyd – algoritma baru yang dikembangkan oleh mitra NightCafe Studio, Stability AI, yang beroperasi dalam ruang piksel dan menggunakan Large Language Model (LLM) untuk menghasilkan gambar.

Studio Kafe Malam adalah Generator Seni AI yang memungkinkan pengguna membuat karya seni yang memukau dan futuristik dalam hitungan detik dengan bantuan kecerdasan buatan. Ditemukan oleh Angus Russel empat tahun lalu, NightCafe Studio lahir dari rasa frustrasi Angus sendiri karena tidak dapat menemukan karya seni yang selaras dengannya. Didorong oleh pengetahuan bahwa ada algoritme transfer gaya, dia mencari situs web yang memungkinkannya membuat karya seni yang dipersonalisasi melalui transfer gaya dan mencetaknya.

Yang membuatnya kecewa, dia tidak dapat menemukan platform seperti itu. Namun, kemunduran ini memicu ide inovatif dalam dirinya. Dia memutuskan untuk membuat aplikasi transfer gaya saraf untuk membuat seni yang dihasilkan AI, dan dia memasangnya di Reddit.

NightCafe Studio berasal dari platform pembuatan teks-ke-gambar, menjadikannya yang pertama dari jenisnya. Fitur unik ini menghasilkan lonjakan pendapatan dan basis pengguna yang signifikan. Sejak saat itu, platform tersebut tetap berada di garis depan AI generatif, menarik komunitas besar penggemar yang senang menggunakan generator untuk membuat karya seni yang memukau. Saat ini, NightCafe Studio secara luas dianggap sebagai salah satu generator gambar AI paling populer dan inovatif yang tersedia.

Selama wawancara dengan Angus Russell, kami mengeksplorasi manfaat dan keterbatasan seni yang dihasilkan AI, meningkatnya penggunaan kecerdasan buatan di dunia seni, dan algoritme pembuatan gambar AI terbaru, DeepFloyd.

studio kafe malam — Sydney Opera House: Salah satu gambar buatan AI pertama Angus

Munculnya Seni yang Dihasilkan AI

Dalam dekade terakhir, industri seni telah menyaksikan infiltrasi AI dan pembelajaran mesin (ML) secara bertahap. Teknologi mutakhir ini telah memperkenalkan beberapa konsep baru yang menarik, seperti Deepfakes dan DALL-E, yang telah mendapatkan perhatian yang signifikan di seluruh dunia. Saat ini, industri seni tidak dapat mengabaikan dampak AI yang sangat besar, yang kini memicu revolusi yang telah lama tertunda di sektor ini.

Angus membahas bagaimana NightCafe Studio mengalami lonjakan pertumbuhan selama perilisan Stable Diffusion, model teks-ke-gambar yang digunakan perusahaannya pada hari peluncuran. Sejak saat itu, penghalang masuk untuk membuat alat serupa telah diturunkan karena sumber terbuka algoritme dan kode sampel.

Pendiri NightCafe Studio percaya bahwa menciptakan seni AI bukan hanya tentang produk akhir tetapi juga tentang proses pembuatannya. Dia melihatnya sebagai bentuk terapi dan relaksasi, memungkinkan orang mengekspresikan diri dengan cara yang unik dan kreatif. Banyak orang yang tidak pernah menganggap diri mereka kreatif telah menemukan kemampuan artistik mereka melalui gambar yang dihasilkan AI. Filosofi ini tercermin dalam antarmuka pengguna platform, yang dirancang agar ramah pengguna dan dapat diakses oleh seniman dari semua tingkat keahlian.

Di NightCafe Studio saja, sudah ada dua hingga tiga juta pengguna per bulan, yang menghasilkan sekitar satu juta gambar per hari. Stability AI, sebuah perusahaan AI generatif sumber terbuka, menyatakan bahwa mereka memiliki lebih dari 10 juta pengguna yang aktif setiap hari segera setelah peluncuran Stable Diffusion.

Rekomendasi: 10+ Generator Seni AI Terbaik tahun 2023: Midjourney, DALL-E, Kafe Malam, Artbreeder

DeepFloyd IF: Algoritma Generasi Gambar AI Pengubah Game Baru

NightCafe Studio menerapkan algoritma baru dengan Stability AI bernama DeepFloyd, yang menjanjikan untuk merevolusi cara kami menghasilkan gambar dengan kecerdasan buatan.

DeepFloyd, yang saat ini dalam versi beta, adalah model teks-ke-gambar baru yang dapat menghasilkan gambar yang mengesankan dari deskripsi bahasa alami. Ini didasarkan pada arsitektur baru yang menggabungkan model bahasa besar dengan tiga model difusi. Terinspirasi oleh Imagen, model serupa yang dikembangkan oleh Google Research tetapi tidak pernah dirilis ke publik.

Model dapat menghasilkan gambar yang jelas dan koheren dengan teks dan objek dalam berbagai hubungan spasial, yang merupakan tugas yang menantang bagi sebagian besar model teks-ke-gambar lainnya. Hal ini dicapai dengan menggunakan model bahasa besar T5-XXL-1.1 sebagai pembuat enkode teks dan sejumlah besar lapisan perhatian silang teks-gambar yang menyediakan aliansi prompt dan gambar yang lebih baik.

DeepFloyd juga dapat membuat gambar dengan rasio aspek non-standar dan memiliki tingkat fotorealisme yang tinggi. Selain itu, ini memungkinkan terjemahan gambar-ke-gambar zero-shot, yang berarti bahwa gaya, pola, dan detail gambar keluaran dapat dimodifikasi dengan tetap mempertahankan bentuk dasar gambar sumber tanpa perlu penyesuaian halus.

Algoritme baru beroperasi dengan cara yang berbeda dari Stable Diffusion. DeepFloyd menggunakan ruang piksel dan Large Language Model (LLM). Stable Diffusion menggunakan ruang laten dan model CLIP tetap. DeepFloyd juga menggunakan beberapa proses difusi untuk membuat gambar Stable Diffusion hanya menggunakan satu saja.

DeepFloyd adalah nama kelompok riset yang membangun algoritma tersebut, dan algoritma itu sendiri disebut IF. Kelompok riset mencakup banyak orang yang sama yang menciptakan GPT-3pendahulunya, GPT-2, dan model bahasa canggih sebelumnya yang disebut RuGPT.

Beberapa spekulasi menunjukkan bahwa nama IF mungkin terinspirasi oleh lagu Pink Floyd dengan nama yang sama, seperti yang diisyaratkan oleh bios media sosial grup penelitian algoritma.

Baca lebih lanjut tentang algoritme di sini.

studio kafe malam deepfloyd — Gambar dihasilkan dengan DeepFloyd IF. Sumber: Stability AI

Membandingkan Batasan Seni AI dan Seni Digital

Salah satu batasan utama AI adalah teks, meskipun DeepFloyd mengatasi masalah ini. Keterbatasan lainnya adalah sulitnya mendapatkan gambar persis seperti yang dibayangkan, apalagi tanpa dorongan ahli. AI juga tidak memiliki kemampuan untuk memahami dan menafsirkan konteks budaya dan sosial yang membentuk seni manusia. Oleh karena itu, seni yang dihasilkan oleh AI terkadang dapat menghasilkan karya yang terkesan tidak pada tempatnya atau tidak sensitif terhadap budaya.

Namun, gambar yang dihasilkan AI masih bisa menjadi indah dan terkadang bahkan lebih baik dari ide aslinya, selama pengguna bersedia terkejut, kata Angus. Selain itu, ada cara untuk memodifikasinya gambar yang dihasilkan menggunakan algoritma AI atau Photoshop. Meskipun mendapatkan gambaran yang tepat saat ini merupakan bidang penelitian aktif, kemajuan signifikan telah dicapai. Akan segera dimungkinkan untuk memiliki kendali penuh atas setiap aspek gambar.

AI mengandalkan gambar dan seni yang ada di web sebagai inspirasi, tetapi hanya yang dilatih. Algoritma yang berbeda, seperti Midjourney, DALL-E, dan Stable Diffusion, dilatih pada kumpulan data yang berbeda, yang berarti performanya mungkin lebih baik pada jenis gambar tertentu.

Baru-baru ini, para peneliti telah menyelidiki dampak penghapusan gambar berkualitas rendah dari kumpulan data pelatihan untuk meningkatkan hasil AI. Dengan memfilter gambar berkualitas rendah ini, kumpulan data yang dihasilkan mungkin menjadi lebih kecil tetapi kualitasnya lebih tinggi, sehingga memberikan hasil yang lebih baik tanpa meningkatkan ukuran model AI atau memerlukan perangkat keras yang lebih mahal. Angus berbagi bahwa pendekatan ini merupakan cara yang menjanjikan untuk meningkatkan kualitas gambar yang dihasilkan AI tanpa bergantung pada model yang lebih besar dan lebih intensif sumber daya.

Satu masalah dengan AI dalam seni adalah bahwa hal itu dapat merendahkan karya seniman manusia, yang menghabiskan banyak waktu untuk menciptakan seni, sementara AI mampu menghasilkan seni dalam hitungan detik. Namun, ada kualitas tak berwujud tertentu pada seni manusia yang mungkin sulit direplikasi oleh AI, seperti kedalaman dan kompleksitas emosional yang sering hadir dalam karya-karya buatan manusia. NightCafe Studio percaya AI bukan tentang menciptakan seni untuk tujuan komersial dan lebih banyak tentang kenikmatan proses kreatif itu sendiri.

“Akan selalu ada nilai dalam seni buatan manusia karena mewakili usaha dan keterampilan senimannya, sedangkan seni yang dihasilkan AI tidak memiliki nilai intrinsik yang sama,”
Kata Angus.

Masalah etika seputar AI dalam seni adalah penggunaan gambar publik untuk melatih algoritme AI yang mungkin bukan milik perusahaan yang melatih AI tersebut. Meskipun saat ini tidak ada undang-undang yang dilanggar, hal ini menimbulkan pertanyaan tentang persetujuan dan privasi. Perusahaan sumber terbuka menyukainya OpenAI dan DALL-E berupaya menjadikan prosesnya lebih etis, namun hal ini masih menjadi pertanyaan terbuka. Mungkin akan ada peraturan di masa depan mengenai penggunaan gambar untuk melatih AI dalam bidang seni.

Terlepas dari kekhawatiran ini, Angus yakin proses AI dalam seni pada dasarnya tidak berbeda dengan seniman manusia yang mengambil inspirasi dari karya seniman lain. AI tahu seperti apa benda itu dan mengingat sedikit tentang gambar, seperti halnya manusia. Lebih baik membuatnya kembali dari awal.

Baca lebih lanjut:

Tags:

Penolakan tanggung jawab

Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.

Tentang Penulis

Agne adalah jurnalis yang meliput tren dan perkembangan terbaru di metaverse, AI, dan Web3 industri untuk Metaverse Post. Kecintaannya pada bercerita telah membawanya melakukan banyak wawancara dengan para ahli di bidang tersebut, selalu berusaha mengungkap cerita yang menarik dan memikat. Agne memegang gelar Sarjana Sastra dan memiliki latar belakang luas dalam menulis tentang berbagai topik termasuk perjalanan, seni, dan budaya. Dia juga menjadi sukarelawan sebagai editor di organisasi hak-hak hewan, di mana dia membantu meningkatkan kesadaran tentang masalah kesejahteraan hewan. Hubungi dia di [email dilindungi].

lebih artikel

Agne Cimerman