Pakikipanayam Sining SMW
Mayo 01, 2023

DeepFloyd and Beyond: Exploring the Latest in AI Art with NightCafe Studio CEO

Sa madaling sabi

Sa isang eksklusibong panayam, ang CEO ng NightCafe Studio ay nagbigay ng mahahalagang insight at pananaw sa sining na binuo ng AI.

Ipinakilala ni Angus Russell ang DeepFloyd – isang bagong algorithm na binuo ng partner ng NightCafe Studio, Stability AI, na gumagana sa pixel space at gumagamit ng Large Language Model (LLM) upang makabuo ng mga larawan.

NightCafe Studio ay isang AI Art Generator na nagbibigay-daan sa mga user na lumikha ng nakamamanghang at futuristic na sining sa ilang segundo sa tulong ng artificial intelligence. Itinatag ni Angus Russell apat na taon na ang nakararaan, isinilang ang NightCafe Studio dahil sa sariling pagkabigo ni Angus sa hindi niya mahanap na mga art piece na sumasalamin sa kanya. Dahil sa kaalaman na umiral ang mga algorithm sa paglilipat ng istilo, naghanap siya ng isang website na magbibigay-daan sa kanya na lumikha ng personalized na sining sa pamamagitan ng paglipat ng istilo at i-print ito. 

Sa kanyang pagkabigo, hindi siya makahanap ng ganoong plataporma. Gayunpaman, ang pag-urong na ito ay nagdulot ng isang makabagong ideya sa kanya. Nagpasya siyang lumikha ng neural style transfer app para sa paglikha ng sining na binuo ng AI, at inilagay niya ito sa Reddit.

Nagmula ang NightCafe Studio bilang isang platform ng pagbuo ng text-to-image, na ginagawa itong una sa uri nito. Ang natatanging feature na ito ay nagdulot ng malaking pagtaas sa kita at user base. Simula noon, ang platform ay nanatili sa unahan ng generative AI, na umaakit sa isang malaking komunidad ng mga mahilig na natutuwa sa paggamit ng generator upang lumikha ng nakamamanghang artwork. Ngayon, malawak na itinuturing ang NightCafe Studio bilang isa sa pinakasikat at makabagong AI image generator na magagamit.

Sa isang panayam kay Angus Russell, tinuklas namin ang mga benepisyo at limitasyon ng sining na binuo ng AI, ang dumaraming paggamit ng artificial intelligence sa mundo ng sining, at ang pinakabagong AI image generation algorithm, ang DeepFloyd.

studio ng nightcafe
Sydney Opera House: Isa sa mga unang larawang binuo ng AI ni Angus

Ang Pag-usbong ng AI-generated Art

Sa nakalipas na dekada, nasaksihan ng industriya ng sining ang unti-unting pagpasok ng AI at machine learning (ML). Ang mga makabagong teknolohiyang ito ay nagpakilala ng ilang kamangha-manghang mga bagong konsepto, gaya ng Deepfakes at TILAD, na nakakuha ng makabuluhang atensyon sa buong mundo. Ngayon, hindi kayang balewalain ng industriya ng sining ang napakalaking epekto ng AI, na ngayon ay nagpapalitaw ng matagal nang rebolusyon sa sektor.

Tinalakay ni Angus kung paano nakaranas ang NightCafe Studio ng mga spike sa paglago sa panahon ng pagpapalabas ng Stable Diffusion, isang text-to-image na modelo kung saan naging live ang kanyang kumpanya sa araw ng paglulunsad. Simula noon, ang hadlang sa pagpasok para sa paglikha ng mga katulad na tool ay ibinaba dahil sa open-sourcing ng mga algorithm at sample code.

Naniniwala ang tagapagtatag ng NightCafe Studio na ang paglikha ng AI art ay hindi lamang tungkol sa panghuling produkto kundi tungkol din sa proseso ng paglikha nito. Nakikita niya ito bilang isang paraan ng therapy at pagpapahinga, na nagpapahintulot sa mga tao na ipahayag ang kanilang sarili sa natatangi at malikhaing paraan. Maraming tao na hindi kailanman itinuturing na malikhain ang nakatuklas ng kanilang mga kakayahan sa sining sa pamamagitan ng mga larawang binuo ng AI. Ang pilosopiyang ito ay makikita sa user interface ng platform, na idinisenyo upang maging user-friendly at naa-access sa mga artist sa lahat ng antas ng kasanayan. 

Sa NightCafe Studio lamang, mayroon nang sa pagitan ng dalawa at tatlong milyong user bawat buwan, na bumubuo ng humigit-kumulang isang milyong larawan bawat araw. Stability AI, isang open-source generative AI company, naglalagay na mayroon silang mahigit 10 milyong user na aktibo araw-araw sa ilang sandali matapos ang paglunsad ng Stable Diffusion.

Inirerekomenda: 10+ Pinakamahusay na AI Art Generator ng 2023: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: Ang Bagong Algorithm ng Pagbuo ng Larawan ng AI na Nagbabago ng Laro

Ang NightCafe Studio ay nagpapatupad ng bagong algorithm sa pamamagitan ng Stability AI tinatawag DeepFloyd, na nangangako na baguhin ang paraan kung paano tayo bumubuo ng mga larawan gamit ang artificial intelligence.

Ang DeepFloyd, na kasalukuyang nasa beta, ay isang bagong text-to-image na modelo na maaaring makabuo ng mga kahanga-hangang larawan mula sa mga natural na paglalarawan ng wika. Ito ay batay sa isang nobelang arkitektura na pinagsasama ang isang malaking modelo ng wika na may tatlong mga modelo ng pagsasabog. Ito ay inspirasyon ng Imagen, isang katulad na modelo na binuo ng Google Research ngunit hindi kailanman inilabas sa publiko.

Ang modelo ay maaaring bumuo ng malinaw at magkakaugnay na mga imahe na may teksto at mga bagay sa iba't ibang spatial na relasyon, na isang mapaghamong gawain para sa karamihan ng iba pang mga modelo ng text-to-image. Ito ay nakakamit gamit ang malaking modelo ng wika na T5-XXL-1.1 bilang isang text encoder at isang malaking halaga ng mga layer ng cross-attention ng text-image na nagbibigay ng mas mahusay na prompt at image alliance. 

Ang DeepFloyd ay maaari ding lumikha ng mga larawan na may hindi karaniwang aspect ratio at may mataas na antas ng photorealism. Bilang karagdagan, nagbibigay-daan ito para sa zero-shot na image-to-image na mga pagsasalin, na nangangahulugan na ang estilo, pattern, at mga detalye ng isang output na imahe ay maaaring mabago habang pinapanatili ang pangunahing anyo ng pinagmulang imahe nang hindi nangangailangan ng fine-tuning.

Ang bagong algorithm ay gumagana sa ibang paraan kaysa sa Stable Diffusion. Gumagamit ang DeepFloyd ng pixel space at isang Large Language Model (LLM), samantalang Stable Diffusion gumagamit ng latent space at isang nakapirming CLIP na modelo. Gumagamit din ang DeepFloyd ng maraming proseso ng pagsasabog upang lumikha ng mga imahe, habang Stable Diffusion gumagamit lamang ng isa.

Ang DeepFloyd ay ang pangalan ng pangkat ng pananaliksik na bumuo ng algorithm, at ang algorithm mismo ay tinatawag na IF. Kasama sa pangkat ng pananaliksik ang marami sa parehong mga tao na lumikha GPT-3ang nauna, GPT-2, at isang dating state-of-the-art na modelo ng wika na tinatawag na RuGPT.

Ang ilang mga haka-haka ay nagmumungkahi na ang pangalan na IF ay maaaring inspirasyon ng isang Pink Floyd na kanta na may parehong pangalan, tulad ng ipinahiwatig ng mga bios ng social media ng grupo ng pananaliksik sa algorithm.

Magbasa pa tungkol sa algorithm dito.

studio ng deepfloyd nightcafe
Mga larawang nabuo gamit ang DeepFloyd IF. Pinagmulan: Stability AI

Paghahambing ng Mga Limitasyon ng AI Art at Digital Art

Ang isa sa mga pangunahing limitasyon ng AI ay teksto, bagaman tinatalakay ng DeepFloyd ang isyung ito. Ang isa pang limitasyon ay ang kahirapan sa pagkuha ng isang imahe nang eksakto tulad ng naisip, lalo na nang walang pag-udyok ng eksperto. Kulang din ang AI sa kakayahang maunawaan at bigyang-kahulugan ang kultural at panlipunang konteksto na humuhubog sa sining ng tao. Samakatuwid, kung minsan ang sining na binuo ng AI ay maaaring gumawa ng mga gawa na tila wala sa lugar o hindi sensitibo sa kultura.

Gayunpaman, ang mga imaheng binuo ng AI ay maaari pa ring maging maganda at kung minsan ay mas mahusay kaysa sa orihinal na ideya, hangga't ang gumagamit ay bukas na mabigla, sabi ni Angus. Bukod, may mga paraan para baguhin ang nakabuo ng mga larawan gamit ang mga AI algorithm o Photoshop. Habang ang pagkuha ng eksaktong imahe ay kasalukuyang bahagi ng aktibong pananaliksik, makabuluhang pag-unlad ang ginagawa. Malapit nang maging posible na magkaroon ng ganap na kontrol sa bawat aspeto ng isang imahe. 

Umaasa ang AI sa mga larawan at sining na umiiral sa web bilang inspirasyon, ngunit sa mga pinagsanayan lang nito. Iba't ibang mga algorithm, tulad ng Midjourney, DALL-E, at Stable Diffusion, ay sinanay sa iba't ibang set ng data, na nangangahulugang maaari silang gumanap nang mas mahusay sa mga partikular na uri ng mga larawan. 

Kamakailan, sinisiyasat ng mga mananaliksik ang epekto ng pag-alis ng mga larawang mababa ang kalidad mula sa mga set ng data ng pagsasanay upang mapabuti ang mga resulta ng AI. Sa pamamagitan ng pag-filter sa mga larawang ito na mababa ang kalidad, ang resultang set ng data ay maaaring maging mas maliit ngunit mas mataas ang kalidad, na humahantong sa mas mahusay na mga resulta nang hindi dinadagdagan ang laki ng mga modelo ng AI o nangangailangan ng mas mahal na hardware. Ibinahagi ni Angus na ang diskarte na ito ay kumakatawan sa isang promising na paraan upang mapabuti ang kalidad ng AI-generated na mga imahe nang hindi umaasa sa mas malaki at mas maraming resource-intensive na modelo.

Ang isang isyu sa AI sa sining ay maaaring masiraan ng halaga ang gawain ng mga artista ng tao, na gumugugol ng maraming oras sa paglikha ng sining, habang ang AI ay nakakagawa ng sining sa loob ng ilang segundo. Gayunpaman, mayroong isang tiyak na hindi nasasalat na kalidad sa sining ng tao na maaaring mahirap para sa AI na gayahin, tulad ng emosyonal na lalim at pagiging kumplikado na kadalasang makikita sa mga gawang nilikha ng tao. Naniniwala ang NightCafe Studio na ang AI ay hindi gaanong tungkol sa paglikha ng sining para sa komersyal na layunin at higit pa tungkol sa kasiyahan sa mismong proseso ng creative.

"Palaging may halaga sa gawa ng tao na sining dahil kinakatawan nito ang pagsisikap at kasanayan ng artist, samantalang ang sining na binuo ng AI ay walang parehong intrinsic na halaga,"

Sabi ni Angus.

Ang isang etikal na isyu na nakapalibot sa AI sa sining ay ang pampublikong paggamit ng imahe upang sanayin ang mga algorithm ng AI na maaaring hindi kabilang sa kumpanyang nagsasanay sa AI. Bagama't sa kasalukuyan ay walang mga batas na nilabag, ito ay nagtataas ng mga tanong tungkol sa pahintulot at privacy. Mga open-source na kumpanya tulad ng OpenAI at DALL-E ay nagtatrabaho sa paggawa ng proseso na mas etikal, ngunit ito ay nananatiling isang bukas na tanong. Maaaring may mga regulasyon sa hinaharap tungkol sa paggamit ng mga larawan upang sanayin ang AI sa sining.

Sa kabila ng mga alalahanin na ito, naniniwala si Angus na ang proseso ng AI sa sining ay hindi pangunahing naiiba sa mga artist ng tao na kumukuha ng inspirasyon mula sa trabaho ng ibang mga artist. Alam ng AI kung ano ang hitsura ng mga bagay at naaalala ang mga piraso tungkol sa mga larawan, tulad ng ginagawa ng mga tao. Mas mainam na likhain muli ang mga ito mula sa simula.

Magbasa nang higit pa:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Agne ay isang mamamahayag na sumasaklaw sa pinakabagong mga uso at pag-unlad sa metaverse, AI, at Web3 mga industriya para sa Metaverse Post. Ang kanyang hilig sa pagkukuwento ay nagbunsod sa kanya na magsagawa ng maraming panayam sa mga eksperto sa mga larangang ito, na laging naghahangad na tumuklas ng mga kapana-panabik at nakakaakit na mga kuwento. Si Agne ay mayroong Bachelor's degree sa panitikan at may malawak na background sa pagsulat tungkol sa malawak na hanay ng mga paksa kabilang ang paglalakbay, sining, at kultura. Nagboluntaryo din siya bilang isang editor para sa organisasyon ng mga karapatang panghayop, kung saan tumulong siya na itaas ang kamalayan tungkol sa mga isyu sa kapakanan ng hayop. Makipag-ugnayan sa kanya sa [protektado ng email].

Mas marami pang artikulo
Agne Cimerman
Agne Cimerman

Si Agne ay isang mamamahayag na sumasaklaw sa pinakabagong mga uso at pag-unlad sa metaverse, AI, at Web3 mga industriya para sa Metaverse Post. Ang kanyang hilig sa pagkukuwento ay nagbunsod sa kanya na magsagawa ng maraming panayam sa mga eksperto sa mga larangang ito, na laging naghahangad na tumuklas ng mga kapana-panabik at nakakaakit na mga kuwento. Si Agne ay mayroong Bachelor's degree sa panitikan at may malawak na background sa pagsulat tungkol sa malawak na hanay ng mga paksa kabilang ang paglalakbay, sining, at kultura. Nagboluntaryo din siya bilang isang editor para sa organisasyon ng mga karapatang panghayop, kung saan tumulong siya na itaas ang kamalayan tungkol sa mga isyu sa kapakanan ng hayop. Makipag-ugnayan sa kanya sa [protektado ng email].

Ang Institutional Appetite ay Lumalaki Patungo sa Bitcoin ETFs Sa gitna ng Volatility

Ang mga pagsisiwalat sa pamamagitan ng 13F filing ay nagpapakita ng mga kilalang institusyonal na mamumuhunan na nakikipag-ugnayan sa mga Bitcoin ETF, na binibigyang-diin ang lumalaking pagtanggap ng ...

Malaman Higit Pa

Dumating na ang Araw ng Pagsentensiya: Ang Kapalaran ni CZ ay Nagbabalanse habang Isinasaalang-alang ng Korte ng US ang Panawagan ng DOJ

Si Changpeng Zhao ay handang harapin ang sentensiya sa korte ng US sa Seattle ngayon.

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Pinagsama-sama ng Injective ang AltLayer Upang Magdala ng Restaking Security Sa inEVM
Negosyo Ulat sa Balita Teknolohiya
Pinagsama-sama ng Injective ang AltLayer Upang Magdala ng Restaking Security Sa inEVM
Mayo 3, 2024
Nakipagtulungan ang Masa Sa Teller Upang Ipakilala ang MASA Lending Pool, Pinapagana ang USDC Borrowing On Base
markets Ulat sa Balita Teknolohiya
Nakipagtulungan ang Masa Sa Teller Upang Ipakilala ang MASA Lending Pool, Pinapagana ang USDC Borrowing On Base
Mayo 3, 2024
Inilunsad ng Velodrome ang Superchain Beta na Bersyon Sa Mga Paparating na Linggo At Lumalawak sa OP Stack Layer 2 Blockchain
markets Ulat sa Balita Teknolohiya
Inilunsad ng Velodrome ang Superchain Beta na Bersyon Sa Mga Paparating na Linggo At Lumalawak sa OP Stack Layer 2 Blockchain
Mayo 3, 2024
Inanunsyo ng CARV ang Pakikipagsosyo Sa Aethir Upang I-desentralisa ang Layer ng Data Nito At Ipamahagi ang Mga Gantimpala
Negosyo Ulat sa Balita Teknolohiya
Inanunsyo ng CARV ang Pakikipagsosyo Sa Aethir Upang I-desentralisa ang Layer ng Data Nito At Ipamahagi ang Mga Gantimpala
Mayo 3, 2024
CRYPTOMERIA LABS PTE. LTD.