Wywiad Sztuka SMW
01 maja 2023 r.

DeepFloyd i nie tylko: odkrywanie najnowszych dzieł AI z dyrektorem generalnym NightCafe Studio

W skrócie

Podczas ekskluzywnego wywiadu dyrektor generalny NightCafe Studio przedstawił cenne spostrzeżenia i spojrzenie na sztukę generowaną przez sztuczną inteligencję.

Angus Russell przedstawił DeepFloyd – nowy algorytm opracowany przez partnera NightCafe Studio, Stability AI, który działa w przestrzeni pikseli i wykorzystuje model dużego języka (LLM) do generowania obrazów.

Studio Nocnej Kawiarni to AI Art Generator, który pozwala użytkownikom tworzyć oszałamiające i futurystyczne dzieła sztuki w ciągu kilku sekund przy pomocy sztucznej inteligencji. Założony przez Angusa Russella Cztery lata temu NightCafe Studio narodziło się z frustracji Angusa, który nie mógł znaleźć dzieł sztuki, które mu odpowiadały. Wiedząc, że istnieją algorytmy transferu stylów, szukał strony internetowej, która umożliwiłaby mu tworzenie spersonalizowanych dzieł sztuki poprzez transfer stylów i drukowanie ich. 

Ku swemu rozczarowaniu nie mógł znaleźć takiej platformy. Jednak to niepowodzenie wywołało w nim nowatorski pomysł. Postanowił stworzyć aplikację do przenoszenia stylów neuronowych do tworzenia grafiki generowanej przez sztuczną inteligencję i umieścił ją na Reddit.

NightCafe Studio powstało jako platforma do generowania tekstu na obraz, co czyni go pierwszym w swoim rodzaju. Ta unikalna funkcja spowodowała znaczny wzrost zarówno przychodów, jak i bazy użytkowników. Od tego czasu platforma pozostaje w czołówce generatywnej sztucznej inteligencji, przyciągając dużą społeczność entuzjastów, którzy uwielbiają używać generatora do tworzenia oszałamiających dzieł sztuki. Obecnie NightCafe Studio jest powszechnie uważane za jeden z najpopularniejszych i najbardziej innowacyjnych dostępnych generatorów obrazów AI.

Podczas wywiadu z Angusem Russellem zbadaliśmy zalety i ograniczenia sztuki generowanej przez sztuczną inteligencję, rosnące wykorzystanie sztucznej inteligencji w świecie sztuki oraz najnowszy algorytm generowania obrazów AI, DeepFloyd.

pracownia nocnej kawiarni
Sydney Opera House: Jeden z pierwszych obrazów Angusa wygenerowanych przez sztuczną inteligencję

Pojawienie się sztuki generowanej przez sztuczną inteligencję

W ostatniej dekadzie przemysł artystyczny był świadkiem stopniowej infiltracji sztucznej inteligencji i uczenia maszynowego (ML). Te najnowocześniejsze technologie wprowadziły kilka fascynujących nowych koncepcji, takich jak Deepfake i DALL-E, które zyskały znaczną uwagę na całym świecie. Dziś branża artystyczna nie może sobie pozwolić na ignorowanie ogromnego wpływu sztucznej inteligencji, która wywołuje od dawna oczekiwaną rewolucję w tym sektorze.

Angus omówił, w jaki sposób NightCafe Studio doświadczyło skoków wzrostu podczas wydawania Stable Diffusion, model zamiany tekstu na obraz, który jego firma uruchomiła w dniu premiery. Od tego czasu bariera wejścia dla tworzenia podobnych narzędzi została obniżona dzięki otwartemu pozyskiwaniu algorytmów i przykładowych kodów.

Założyciel NightCafe Studio wierzy, że tworzenie sztuki AI to nie tylko produkt końcowy, ale także proces jego tworzenia. Postrzega to jako formę terapii i relaksu, pozwalającą ludziom wyrazić siebie w wyjątkowy i kreatywny sposób. Wiele osób, które nigdy nie uważały się za kreatywne, odkryło swoje zdolności artystyczne dzięki obrazom generowanym przez sztuczną inteligencję. Ta filozofia znajduje odzwierciedlenie w interfejsie użytkownika platformy, który został zaprojektowany tak, aby był przyjazny dla użytkownika i dostępny dla artystów na wszystkich poziomach umiejętności. 

W samym NightCafe Studio jest już od dwóch do trzech milionów użytkowników miesięcznie, generujących około miliona obrazów dziennie. Stability AI, firma zajmująca się generatywną sztuczną inteligencją typu open source, stwierdził, że mieli ponad 10 milionów użytkowników, którzy byli aktywni codziennie krótko po uruchomieniu Stable Diffusion.

Polecamy: Ponad 10 najlepszych generatorów grafiki AI w 2023 r.: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: nowy algorytm generowania obrazu AI, który zmienia reguły gry

NightCafe Studio wdraża nowy algorytm wg Stability AI nazywa DeepFloyd, który obiecuje zrewolucjonizować sposób generowania obrazów za pomocą sztucznej inteligencji.

DeepFloyd, który jest obecnie w fazie beta, to nowy model zamiany tekstu na obraz, który może generować imponujące obrazy z opisów w języku naturalnym. Opiera się na nowatorskiej architekturze, która łączy duży model językowy z trzema modelami rozpowszechniania. Jest inspirowany Imagen, podobnym modelem opracowanym przez Google Research, ale nigdy nie udostępnionym publicznie.

Model może generować wyraźne i spójne obrazy z tekstem i obiektami w różnych relacjach przestrzennych, co jest trudnym zadaniem dla większości innych modeli typu tekst-obraz. Osiąga się to za pomocą dużego modelu językowego T5-XXL-1.1 jako kodera tekstu i znacznej liczby warstw wzajemnej uwagi tekst-obraz, które zapewniają lepsze podpowiedzi i sojusz obrazów. 

DeepFloyd może również tworzyć obrazy o niestandardowych proporcjach i ma wysoki stopień fotorealizmu. Ponadto pozwala na translację typu zero-shot z obrazu na obraz, co oznacza, że ​​styl, wzory i szczegóły obrazu wyjściowego można modyfikować przy zachowaniu podstawowej formy obrazu źródłowego bez potrzeby dostrajania.

Nowy algorytm działa w inny sposób niż Stable Diffusion. DeepFloyd wykorzystuje przestrzeń pikselową i model dużego języka (LLM). Stable Diffusion wykorzystuje ukrytą przestrzeń i stały model CLIP. DeepFloyd wykorzystuje również wiele procesów dyfuzji do tworzenia obrazów Stable Diffusion korzysta tylko z jednego.

DeepFloyd to nazwa grupy badawczej, która zbudowała algorytm, a sam algorytm nosi nazwę IF. W grupie badawczej znajduje się wiele tych samych osób, które tworzyły GPT-3poprzednik, GPT-2oraz poprzedni, najnowocześniejszy model języka o nazwie RuGPT.

Niektóre spekulacje sugerują, że nazwa IF może być inspirowana piosenką Pink Floyd o tej samej nazwie, na co wskazuje biografia społecznościowa grupy badawczej zajmującej się algorytmami.

Przeczytaj więcej o algorytmie tutaj.

studio z kawiarnią nocną Deepfloyd
Obrazy wygenerowane za pomocą DeepFloyd IF. Źródło: Stability AI

Porównanie ograniczeń AI Art i sztuki cyfrowej

Jednym z głównych ograniczeń AI jest tekst, chociaż DeepFloyd rozwiązuje ten problem. Kolejnym ograniczeniem jest trudność uzyskania obrazu dokładnie takiego, jak oczekiwano, szczególnie bez podpowiedzi eksperta. Sztuczna inteligencja nie jest również w stanie zrozumieć i zinterpretować konteksty kulturowe i społeczne kształtujące sztukę ludzką. Dlatego sztuka generowana przez sztuczną inteligencję może czasami tworzyć dzieła, które wydają się nie na miejscu lub niewrażliwe kulturowo.

Jednak obrazy wygenerowane przez sztuczną inteligencję mogą nadal być piękne, a czasami nawet lepsze od pierwotnego pomysłu, o ile użytkownik jest otwarty na zaskoczenie, powiedział Angus. Poza tym istnieją sposoby modyfikacji pliku generowane obrazy przy użyciu algorytmów AI lub Photoshopa. Chociaż uzyskanie dokładnego obrazu jest obecnie przedmiotem aktywnych badań, poczyniono znaczne postępy. Być może wkrótce możliwa będzie pełna kontrola nad każdym aspektem obrazu. 

Sztuczna inteligencja opiera się na obrazach i grafikach, które istnieją w sieci jako inspiracji, ale tylko na tych, na których została przeszkolona. Różne algorytmy, np Midjourney, DALL-E i Stable Diffusion, są trenowane na różnych zestawach danych, co oznacza, że ​​mogą działać lepiej na określonych typach obrazów. 

Niedawno naukowcy badali wpływ usuwania obrazów o niskiej jakości z zestawów danych treningowych na poprawę wyników sztucznej inteligencji. Dzięki odfiltrowaniu tych obrazów o niskiej jakości wynikowy zestaw danych może stać się mniejszy, ale o wyższej jakości, co prowadzi do lepszych wyników bez zwiększania rozmiaru modeli AI lub konieczności stosowania droższego sprzętu. Angus powiedział, że to podejście stanowi obiecujący sposób na poprawę jakości obrazów generowanych przez sztuczną inteligencję bez polegania na większych i bardziej zasobochłonnych modelach.

Jednym z problemów związanych ze sztuczną inteligencją w sztuce jest to, że może ona zdewaluować pracę ludzkich artystów, którzy spędzają dużo czasu na tworzeniu sztuki, podczas gdy sztuczna inteligencja jest w stanie wygenerować sztukę w ciągu kilku sekund. Istnieje jednak pewna nieuchwytna jakość sztuki ludzkiej, która może być trudna do odtworzenia przez sztuczną inteligencję, na przykład emocjonalna głębia i złożoność często obecne w dziełach stworzonych przez człowieka. NightCafe Studio wierzy, że sztuczna inteligencja nie polega na tworzeniu sztuki w celach komercyjnych, a bardziej na czerpaniu przyjemności z samego procesu twórczego.

„Sztuka stworzona przez człowieka zawsze będzie miała wartość, ponieważ reprezentuje wysiłek i umiejętności artysty, podczas gdy sztuka generowana przez sztuczną inteligencję nie ma takiej samej wewnętrznej wartości”

- powiedział Angus.

Kwestią etyczną związaną ze sztuczną inteligencją w sztuce jest publiczne wykorzystanie wizerunku do szkolenia algorytmów sztucznej inteligencji, które mogą nie należeć do firmy szkolącej sztuczną inteligencję. Chociaż obecnie nie ma żadnych naruszeń prawa, rodzi to pytania dotyczące zgody i prywatności. Firmy open-source, np OpenAI i DALL-E pracują nad uczynieniem tego procesu bardziej etycznym, ale pozostaje to kwestią otwartą. W przyszłości mogą obowiązywać przepisy dotyczące wykorzystania obrazów do szkolenia sztucznej inteligencji w sztuce.

Pomimo tych obaw Angus uważa, że ​​proces sztucznej inteligencji w sztuce nie różni się zasadniczo od ludzkich artystów czerpiących inspirację z prac innych artystów. Sztuczna inteligencja wie, jak rzeczy wyglądają i zapamiętuje fragmenty obrazów, tak jak ludzie. Po prostu lepiej jest odtworzyć je od podstaw.

Czytaj więcej:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Agne jest dziennikarką, która zajmuje się najnowszymi trendami i wydarzeniami w metaverse, sztucznej inteligencji i Web3 branże dla Metaverse Post. Jej pasja do opowiadania historii skłoniła ją do przeprowadzenia licznych wywiadów z ekspertami w tych dziedzinach, zawsze starając się odkryć ekscytujące i wciągające historie. Agne posiada tytuł licencjata z literatury i rozległe doświadczenie w pisaniu na różne tematy, w tym podróże, sztukę i kulturę. Zgłosiła się także jako wolontariuszka jako redaktorka do organizacji praw zwierząt, gdzie pomagała podnosić świadomość na temat kwestii związanych z dobrostanem zwierząt. Skontaktuj się z nią [email chroniony].

Więcej artykułów
Agnieszka Cimerman
Agnieszka Cimerman

Agne jest dziennikarką, która zajmuje się najnowszymi trendami i wydarzeniami w metaverse, sztucznej inteligencji i Web3 branże dla Metaverse Post. Jej pasja do opowiadania historii skłoniła ją do przeprowadzenia licznych wywiadów z ekspertami w tych dziedzinach, zawsze starając się odkryć ekscytujące i wciągające historie. Agne posiada tytuł licencjata z literatury i rozległe doświadczenie w pisaniu na różne tematy, w tym podróże, sztukę i kulturę. Zgłosiła się także jako wolontariuszka jako redaktorka do organizacji praw zwierząt, gdzie pomagała podnosić świadomość na temat kwestii związanych z dobrostanem zwierząt. Skontaktuj się z nią [email chroniony].

Apetyt instytucjonalny na ETFy Bitcoin rośnie w obliczu zmienności

Ujawnienia zawarte w zgłoszeniach 13F ujawniają, że znaczący inwestorzy instytucjonalni parają się funduszami ETF Bitcoin, co podkreśla rosnącą akceptację…

Dowiedz się więcej

Nadchodzi dzień wyroku: los CZ wisi na włosku, gdy amerykański sąd rozpatruje skargę Departamentu Sprawiedliwości

Changpeng Zhao stanie dziś przed amerykańskim sądem w Seattle wyrokiem skazującym.

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
Injective łączy siły z AltLayer, aby zapewnić bezpieczeństwo ponownego stakowania w inEVM
Biznes Raport aktualności Technologia
Injective łączy siły z AltLayer, aby zapewnić bezpieczeństwo ponownego stakowania w inEVM
3 maja 2024 r.
Masa współpracuje z Tellerem, aby wprowadzić pulę pożyczek MASA, umożliwiającą zaciąganie pożyczek w USDC
rynki Raport aktualności Technologia
Masa współpracuje z Tellerem, aby wprowadzić pulę pożyczek MASA, umożliwiającą zaciąganie pożyczek w USDC
3 maja 2024 r.
Velodrome wprowadza wersję beta Superchain w nadchodzących tygodniach i rozszerza się na łańcuchy bloków warstwy 2 stosu OP
rynki Raport aktualności Technologia
Velodrome wprowadza wersję beta Superchain w nadchodzących tygodniach i rozszerza się na łańcuchy bloków warstwy 2 stosu OP
3 maja 2024 r.
CARV ogłasza partnerstwo z firmą Aethir w celu decentralizacji warstwy danych i dystrybucji nagród
Biznes Raport aktualności Technologia
CARV ogłasza partnerstwo z firmą Aethir w celu decentralizacji warstwy danych i dystrybucji nagród
3 maja 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.