temuduga Art SMW
Semoga 01, 2023

DeepFloyd and Beyond: Meneroka Yang Terkini dalam Seni AI dengan Ketua Pegawai Eksekutif NightCafe Studio

Secara ringkas

Semasa temu bual eksklusif, Ketua Pegawai Eksekutif NightCafe Studio memberikan pandangan dan perspektif berharga tentang seni yang dijana AI.

Angus Russell memperkenalkan DeepFloyd – algoritma baharu yang dibangunkan oleh rakan kongsi NightCafe Studio, Stability AI, yang beroperasi dalam ruang piksel dan menggunakan Model Bahasa Besar (LLM) untuk menjana imej.

Studio NightCafe ialah Penjana Seni AI yang membolehkan pengguna mencipta seni yang menakjubkan dan futuristik dalam beberapa saat dengan bantuan kecerdasan buatan. Diasaskan oleh Angus Russell empat tahun lalu, NightCafe Studio lahir daripada kekecewaan Angus sendiri kerana tidak dapat mencari karya seni yang bergema dengannya. Didorong oleh pengetahuan bahawa algoritma pemindahan gaya wujud, dia mencari tapak web yang membolehkannya mencipta seni diperibadikan melalui pemindahan gaya dan mencetaknya. 

Untuk kekecewaannya, dia tidak dapat mencari platform sedemikian. Namun, kemunduran ini mencetuskan idea inovatif dalam dirinya. Dia memutuskan untuk mencipta aplikasi pemindahan gaya saraf untuk mencipta seni yang dijana AI, dan dia meletakkannya di Reddit.

NightCafe Studio berasal sebagai platform penjanaan teks ke imej, menjadikannya yang pertama seumpamanya. Ciri unik ini membawa lonjakan ketara dalam kedua-dua hasil dan pangkalan pengguna. Sejak itu, platform itu kekal di barisan hadapan AI generatif, menarik komuniti besar peminat yang gemar menggunakan penjana untuk mencipta karya seni yang menakjubkan. Hari ini, NightCafe Studio dianggap secara meluas sebagai salah satu penjana imej AI yang paling popular dan inovatif yang tersedia.

Semasa temu bual dengan Angus Russell, kami meneroka faedah dan batasan seni yang dijana AI, peningkatan penggunaan kecerdasan buatan dalam dunia seni dan algoritma penjanaan imej AI terkini, DeepFloyd.

studio kafe malam
Sydney Opera House: Salah satu imej pertama Angus yang dijana AI

Kemunculan Seni yang dijana AI

Dalam dekad yang lalu, industri seni telah menyaksikan penyusupan AI dan pembelajaran mesin (ML) secara beransur-ansur. Teknologi canggih ini telah memperkenalkan beberapa konsep baharu yang menarik, seperti Deepfakes dan SLAB, yang telah mendapat perhatian penting di seluruh dunia. Hari ini, industri seni tidak mampu untuk mengabaikan kesan besar AI, yang kini mencetuskan revolusi yang telah lama tertunggak dalam sektor itu.

Angus membincangkan bagaimana NightCafe Studio mengalami lonjakan pertumbuhan semasa pengeluaran Stable Diffusion, model teks kepada imej yang disiarkan secara langsung oleh syarikatnya pada hari pelancaran. Sejak itu, halangan kepada kemasukan untuk mencipta alat yang serupa telah diturunkan disebabkan oleh sumber terbuka algoritma dan kod sampel.

Pengasas NightCafe Studio percaya bahawa mencipta seni AI bukan hanya mengenai produk akhir tetapi juga mengenai proses menciptanya. Dia melihatnya sebagai satu bentuk terapi dan kelonggaran, membolehkan orang ramai mengekspresikan diri mereka dengan cara yang unik dan kreatif. Ramai orang yang tidak pernah menganggap diri mereka kreatif telah menemui kebolehan artistik mereka melalui imej yang dijana AI. Falsafah ini dicerminkan dalam antara muka pengguna platform, yang direka bentuk untuk mesra pengguna dan boleh diakses oleh artis dari semua peringkat kemahiran. 

Di NightCafe Studio sahaja, sudah ada antara dua hingga tiga juta pengguna sebulan, menjana kira-kira sejuta imej setiap hari. Stability AI, sebuah syarikat AI generatif sumber terbuka, dinyatakan bahawa mereka mempunyai lebih 10 juta pengguna yang aktif setiap hari sejurus selepas pelancaran Stable Diffusion.

Lawatan: 10+ Penjana Seni AI Terbaik 2023: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: Algoritma Penjanaan Imej AI yang Mengubah Permainan Baharu

NightCafe Studio sedang melaksanakan algoritma baharu oleh Stability AI dipanggil DeepFloyd, yang menjanjikan untuk merevolusikan cara kami menjana imej dengan kecerdasan buatan.

DeepFloyd, yang kini dalam versi beta, ialah model teks-ke-imej baharu yang boleh menjana imej yang mengagumkan daripada huraian bahasa semula jadi. Ia berdasarkan seni bina novel yang menggabungkan model bahasa yang besar dengan tiga model resapan. Ia diilhamkan oleh Imagen, model serupa yang dibangunkan oleh Google Research tetapi tidak pernah dikeluarkan kepada umum.

Model ini boleh menjana imej yang jelas dan koheren dengan teks dan objek dalam pelbagai perhubungan spatial, yang merupakan tugas yang mencabar untuk kebanyakan model teks-ke-imej yang lain. Ini dicapai menggunakan model bahasa besar T5-XXL-1.1 sebagai pengekod teks dan sejumlah besar lapisan perhatian silang imej teks yang menyediakan pakatan segera dan imej yang lebih baik. 

DeepFloyd juga boleh mencipta imej dengan nisbah aspek bukan standard dan mempunyai tahap fotorealisme yang tinggi. Selain itu, ia membenarkan terjemahan imej-ke-imej tangkapan sifar, yang bermaksud gaya, corak dan butiran imej keluaran boleh diubah suai sambil mengekalkan bentuk asas imej sumber tanpa memerlukan penalaan halus.

Algoritma baharu beroperasi dengan cara yang berbeza daripada Stable Diffusion. DeepFloyd menggunakan ruang piksel dan Model Bahasa Besar (LLM), sedangkan Stable Diffusion menggunakan ruang terpendam dan model CLIP tetap. DeepFloyd juga menggunakan pelbagai proses resapan untuk mencipta imej, manakala Stable Diffusion hanya menggunakan satu sahaja.

DeepFloyd ialah nama kumpulan penyelidikan yang membina algoritma, dan algoritma itu sendiri dipanggil IF. Kumpulan penyelidikan termasuk ramai orang yang sama yang mencipta GPT-3pendahulunya, GPT-2, dan model bahasa terkini yang dipanggil RuGPT.

Beberapa spekulasi mencadangkan bahawa nama IF mungkin diilhamkan oleh lagu Pink Floyd dengan nama yang sama, seperti yang dibayangkan oleh bios media sosial kumpulan penyelidikan algoritma.

Baca lebih lanjut mengenai algoritma disini.

studio kafe malam deepfloyd
Imej yang dijana dengan DeepFloyd IF. Sumber: Stability AI

Membandingkan Had Seni AI dan Seni Digital

Salah satu batasan AI utama ialah teks, walaupun DeepFloyd menangani isu ini. Had lain ialah kesukaran untuk mendapatkan imej tepat seperti yang dibayangkan, terutamanya tanpa dorongan pakar. AI juga tidak mempunyai keupayaan untuk memahami dan mentafsir konteks budaya dan sosial yang membentuk seni manusia. Oleh itu, seni yang dijana AI kadangkala boleh menghasilkan karya yang kelihatan tidak kena pada tempatnya atau tidak sensitif dari segi budaya.

Walau bagaimanapun, imej yang dijana AI masih boleh menjadi cantik dan kadangkala lebih baik daripada idea asal, selagi pengguna terbuka untuk terkejut, kata Angus. Selain itu, terdapat cara untuk mengubah suai imej yang dihasilkan menggunakan algoritma AI atau Photoshop. Walaupun mendapatkan imej yang tepat pada masa ini merupakan bidang penyelidikan aktif, kemajuan ketara sedang dibuat. Tidak lama lagi mungkin untuk mempunyai kawalan penuh ke atas setiap aspek imej. 

AI bergantung pada imej dan seni yang wujud di web sebagai inspirasi, tetapi hanya imej yang telah dilatih. Algoritma yang berbeza, seperti Midjourney, DALL-E dan Stable Diffusion, dilatih pada set data yang berbeza, yang bermakna mereka mungkin berprestasi lebih baik pada jenis imej tertentu. 

Baru-baru ini, penyelidik telah menyiasat kesan mengalih keluar imej berkualiti rendah daripada set data latihan untuk meningkatkan hasil AI. Dengan menapis imej berkualiti rendah ini, set data yang terhasil mungkin menjadi lebih kecil tetapi lebih berkualiti, membawa kepada hasil yang lebih baik tanpa meningkatkan saiz model AI atau memerlukan perkakasan yang lebih mahal. Angus berkongsi bahawa pendekatan ini mewakili cara yang menjanjikan untuk meningkatkan kualiti imej yang dijana AI tanpa bergantung pada model yang lebih besar dan lebih intensif sumber.

Satu isu dengan AI dalam seni ialah ia mungkin merendahkan nilai kerja artis manusia, yang menghabiskan banyak masa mencipta seni, manakala AI mampu menjana seni dalam beberapa saat. Walau bagaimanapun, terdapat kualiti tidak ketara tertentu pada seni manusia yang mungkin sukar untuk ditiru oleh AI, seperti kedalaman dan kerumitan emosi yang sering terdapat dalam karya ciptaan manusia. NightCafe Studio percaya AI kurang tentang mencipta seni untuk tujuan komersial dan lebih banyak tentang keseronokan proses kreatif itu sendiri.

"Akan sentiasa ada nilai dalam seni buatan manusia kerana ia mewakili usaha dan kemahiran artis, manakala seni yang dihasilkan AI tidak mempunyai nilai intrinsik yang sama,"

Angus berkata.

Isu etika yang mengelilingi AI dalam seni ialah penggunaan imej awam untuk melatih algoritma AI yang mungkin bukan milik syarikat yang melatih AI. Walaupun pada masa ini tiada undang-undang yang dilanggar, ia menimbulkan persoalan tentang persetujuan dan privasi. Syarikat sumber terbuka seperti OpenAI dan DALL-E sedang berusaha untuk menjadikan proses itu lebih beretika, tetapi ia tetap menjadi persoalan terbuka. Mungkin terdapat peraturan masa depan mengenai penggunaan imej untuk melatih AI dalam seni.

Walaupun kebimbangan ini, Angus percaya proses AI dalam seni pada asasnya tidak berbeza daripada artis manusia yang mendapat inspirasi daripada karya artis lain. AI mengetahui rupa perkara dan mengingati sedikit tentang imej, sama seperti manusia. Ia lebih baik untuk mencipta semula mereka dari awal.

Baca lebih lanjut:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Agne ialah seorang wartawan yang membuat liputan tentang trend dan perkembangan terkini dalam metaverse, AI, dan Web3 industri untuk Metaverse Post. Keghairahannya untuk bercerita telah menyebabkan dia menjalankan banyak temu bual dengan pakar dalam bidang ini, sentiasa berusaha untuk mendedahkan cerita yang menarik dan menarik. Agne memegang ijazah Sarjana Muda dalam kesusasteraan dan mempunyai latar belakang yang luas dalam penulisan tentang pelbagai topik termasuk perjalanan, seni dan budaya. Dia juga menawarkan diri sebagai editor untuk organisasi hak haiwan, di mana dia membantu meningkatkan kesedaran tentang isu kebajikan haiwan. Hubungi dia [e-mel dilindungi].

lebih banyak artikel
Agne Cimerman
Agne Cimerman

Agne ialah seorang wartawan yang membuat liputan tentang trend dan perkembangan terkini dalam metaverse, AI, dan Web3 industri untuk Metaverse Post. Keghairahannya untuk bercerita telah menyebabkan dia menjalankan banyak temu bual dengan pakar dalam bidang ini, sentiasa berusaha untuk mendedahkan cerita yang menarik dan menarik. Agne memegang ijazah Sarjana Muda dalam kesusasteraan dan mempunyai latar belakang yang luas dalam penulisan tentang pelbagai topik termasuk perjalanan, seni dan budaya. Dia juga menawarkan diri sebagai editor untuk organisasi hak haiwan, di mana dia membantu meningkatkan kesedaran tentang isu kebajikan haiwan. Hubungi dia [e-mel dilindungi].

Selera Institusi Berkembang Terhadap Bitcoin ETF Di Tengah-tengah Kemeruapan

Pendedahan melalui pemfailan 13F mendedahkan pelabur institusi terkenal yang berkecimpung dalam Bitcoin ETF, menekankan penerimaan yang semakin meningkat terhadap ...

Mengetahui lebih lanjut

Hari Penghukuman Tiba: Nasib CZ Bergantung Seimbang apabila Mahkamah AS Mempertimbangkan Rayuan DOJ

Changpeng Zhao bersedia untuk menghadapi hukuman di mahkamah AS di Seattle hari ini.

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Untuk Lebih Lanjut
Baca lagi
Injektif Menyertai Pasukan Dengan AltLayer Untuk Membawa Keselamatan Restaking Kepada inEVM
Perniagaan Laporan Berita Teknologi
Injektif Menyertai Pasukan Dengan AltLayer Untuk Membawa Keselamatan Restaking Kepada inEVM
Semoga 3, 2024
Masa Bekerjasama Dengan Juruwang Untuk Memperkenalkan Kumpulan Pinjaman MASA, Membolehkan Pinjaman USDC Di Pangkalan
pasaran Laporan Berita Teknologi
Masa Bekerjasama Dengan Juruwang Untuk Memperkenalkan Kumpulan Pinjaman MASA, Membolehkan Pinjaman USDC Di Pangkalan
Semoga 3, 2024
Velodrome Melancarkan Versi Beta Superchain Dalam Minggu Akan Datang Dan Berkembang Merentasi OP Stack Layer 2 Blockchains
pasaran Laporan Berita Teknologi
Velodrome Melancarkan Versi Beta Superchain Dalam Minggu Akan Datang Dan Berkembang Merentasi OP Stack Layer 2 Blockchains
Semoga 3, 2024
CARV Mengumumkan Perkongsian Dengan Aethir Untuk Memusnahkan Lapisan Datanya Dan Mengedarkan Ganjaran
Perniagaan Laporan Berita Teknologi
CARV Mengumumkan Perkongsian Dengan Aethir Untuk Memusnahkan Lapisan Datanya Dan Mengedarkan Ganjaran
Semoga 3, 2024