인터뷰 미술 SMW
2023 년 5 월 01 일

DeepFloyd와 그 너머: NightCafe Studio CEO와 함께 최신 AI 아트 탐색

요컨대

독점 인터뷰에서 NightCafe Studio의 CEO는 AI 생성 예술에 대한 귀중한 통찰력과 관점을 제공했습니다.

Angus Russell은 NightCafe Studio의 파트너가 개발한 새로운 알고리즘인 DeepFloyd를 소개했습니다. Stability AI, 픽셀 공간에서 작동하고 LLM(Large Language Model)을 사용하여 이미지를 생성합니다.

나이트카페 스튜디오 사용자가 인공 지능의 도움을 받아 몇 초 만에 놀랍고 미래적인 예술을 만들 수 있는 AI 예술 생성기입니다. 의해 설립 된 앵거스 러셀 XNUMX년 전, NightCafe Studio는 앵거스 자신과 공감할 수 있는 예술 작품을 찾을 수 없다는 좌절감에서 탄생했습니다. 스타일 전송 알고리즘이 존재한다는 지식에 힘입어 그는 스타일 전송을 통해 개인화된 예술을 만들고 인쇄할 수 있는 웹사이트를 검색했습니다. 

실망스럽게도 그는 그러한 플랫폼을 찾을 수 없었습니다. 그러나이 좌절은 그에게 혁신적인 아이디어를 불러 일으켰습니다. 그는 AI로 생성된 아트를 만들기 위한 신경 스타일 전송 앱을 만들기로 결정하고 Reddit에 올렸습니다.

NightCafe Studio는 최초의 텍스트-이미지 생성 플랫폼으로 시작되었습니다. 이 고유한 기능은 수익과 사용자 기반 모두에서 상당한 급증을 가져왔습니다. 그 이후로 이 플랫폼은 제너레이티브 AI의 선두에 서서 제너레이터를 사용하여 멋진 예술 작품을 만드는 것을 좋아하는 대규모 매니아 커뮤니티를 끌어들였습니다. 오늘날 NightCafe Studio는 사용 가능한 가장 인기 있고 혁신적인 AI 이미지 생성기 중 하나로 널리 알려져 있습니다.

Angus Russell과의 인터뷰에서 AI 생성 예술의 이점과 한계, 예술계에서 증가하는 인공 지능 사용, 최신 AI 이미지 생성 알고리즘인 DeepFloyd에 대해 살펴보았습니다.

나이트카페 스튜디오
시드니 오페라 하우스: Angus의 최초 AI 생성 이미지 중 하나

인공지능 예술의 등장

지난 XNUMX년 동안 예술 산업은 AI와 기계 학습(ML)의 점진적 침투를 목격했습니다. 이러한 최첨단 기술은 Deepfakes 및 DALL-E, 전 세계적으로 상당한 주목을 받았습니다. 오늘날 예술 산업은 AI의 막대한 영향을 무시할 수 없으며, 이는 이제 이 분야에서 오랫동안 지연된 혁명을 촉발하고 있습니다.

Angus는 NightCafe Studio가 Stable Diffusion, 그의 회사가 출시일에 함께 실행한 텍스트-이미지 모델입니다. 그 이후로 알고리즘과 샘플 코드의 오픈 소싱으로 인해 유사한 도구를 만들기 위한 진입 장벽이 낮아졌습니다.

NightCafe Studio의 창립자는 AI 아트를 만드는 것이 최종 제품에 관한 것이 아니라 그것을 만드는 과정에 관한 것이라고 믿습니다. 그는 그것을 치료와 이완의 한 형태로 보고 사람들이 독특하고 창의적인 방식으로 자신을 표현할 수 있도록 합니다. 자신이 창의적이라고 생각하지 않았던 많은 사람들이 AI가 생성한 이미지를 통해 자신의 예술적 능력을 발견했습니다. 이 철학은 사용자 친화적이고 모든 기술 수준의 아티스트가 액세스할 수 있도록 설계된 플랫폼의 사용자 인터페이스에 반영되어 있습니다. 

NightCafe Studio에서만 이미 매달 XNUMX만에서 XNUMX만 명의 사용자가 있으며 매일 약 XNUMX만 개의 이미지를 생성합니다. Stability AI오픈소스 제너레이티브 AI 기업 , 정해진 출시 직후 매일 활동하는 사용자가 천만 명이 넘었습니다. Stable Diffusion.

권장 사항 : 10년 최고의 AI 아트 제너레이터 2023개 이상: Midjourney, 달이, 나이트카페, 아트브리더

DeepFloyd IF: 판도를 바꾸는 새로운 AI 이미지 생성 알고리즘

NightCafe Studio는 다음을 통해 새로운 알고리즘을 구현합니다. Stability AI 라는 딥플로이드, 인공 지능으로 이미지를 생성하는 방법을 혁신할 것을 약속합니다.

현재 베타 버전인 DeepFloyd는 자연어 설명에서 인상적인 이미지를 생성할 수 있는 새로운 텍스트-이미지 모델입니다. 이것은 대규모 언어 모델을 세 가지 확산 모델과 결합하는 새로운 아키텍처를 기반으로 합니다. Google Research에서 개발했지만 대중에게 공개되지 않은 유사한 모델인 Imagen에서 영감을 받았습니다.

이 모델은 다양한 공간 관계에 있는 텍스트 및 개체로 명확하고 일관된 이미지를 생성할 수 있으며, 이는 대부분의 다른 텍스트-이미지 모델에서 어려운 작업입니다. 이것은 큰 언어 모델 T5-XXL-1.1을 텍스트 인코더로 사용하고 더 나은 프롬프트와 이미지 연합을 제공하는 상당한 양의 텍스트-이미지 교차 주의 레이어를 사용하여 달성됩니다. 

DeepFloyd는 또한 비표준 종횡비로 이미지를 생성할 수 있으며 높은 수준의 포토리얼리즘을 제공합니다. 또한 제로 샷 이미지 대 이미지 변환이 가능하므로 미세 조정 없이 원본 이미지의 기본 형태를 유지하면서 출력 이미지의 스타일, 패턴 및 세부 사항을 수정할 수 있습니다.

새로운 알고리즘은 이전과는 다른 방식으로 작동합니다. Stable Diffusion. DeepFloyd는 픽셀 공간과 LLM(Large Language Model)을 사용하는 반면 Stable Diffusion 잠재 공간과 고정 CLIP 모델을 사용합니다. DeepFloyd는 또한 여러 확산 프로세스를 사용하여 이미지를 생성합니다. Stable Diffusion 하나만 사용합니다.

DeepFloyd는 알고리즘을 구축한 연구그룹의 이름이며, 알고리즘 자체를 IF라고 합니다. 연구 그룹에는 다음을 만든 동일한 사람들이 많이 포함되어 있습니다. GPT-3의 전임자, GPT-2, 그리고 Ru라는 이전의 최첨단 언어 모델GPT.

일부 추측에 따르면 IF라는 이름은 알고리즘 연구 그룹의 소셜 미디어 약력에서 암시된 것처럼 같은 이름의 Pink Floyd 노래에서 영감을 받았을 수 있습니다.

알고리즘에 대해 자세히 알아보기 여기에서 지금 확인해 보세요..

딥플로이드 나이트카페 스튜디오
DeepFloyd IF로 생성된 이미지. 원천: Stability AI

AI 예술의 한계와 디지털 예술의 비교

AI의 주요 제한 사항 중 하나는 텍스트이지만 DeepFloyd는 이 문제를 해결합니다. 또 다른 한계는 특히 전문가의 지시 없이는 구상한 대로 정확하게 이미지를 얻는 것이 어렵다는 것입니다. AI는 사물을 이해하고 해석하는 능력도 부족하다. 인간 예술을 형성하는 문화적, 사회적 맥락. 따라서 AI가 생성한 예술 작품은 때로는 어울리지 않거나 문화적으로 둔감해 보이는 작품을 생산할 수도 있습니다.

그러나 AI가 생성한 이미지는 사용자가 놀랄 수 있는 한 여전히 아름답고 때로는 원래 아이디어보다 더 나을 수 있다고 Angus는 말했습니다. 그 외에도 수정하는 방법이 있는데 AI 알고리즘이나 Photoshop을 사용하여 생성된 이미지. 정확한 이미지를 얻는 것은 현재 활발한 연구 분야이지만 상당한 진전이 이루어지고 있습니다. 곧 이미지의 모든 측면을 완전히 제어하는 ​​것이 가능할 수도 있습니다. 

AI는 영감으로 웹에 존재하는 이미지와 예술에 의존하지만 훈련된 이미지와 예술에만 의존합니다. 다음과 같은 다양한 알고리즘 Midjourney, DALL-E 및 Stable Diffusion는 서로 다른 데이터 세트에서 학습되므로 특정 유형의 이미지에서 더 잘 수행될 수 있습니다. 

최근 연구원들은 AI 결과를 개선하기 위해 훈련 데이터 세트에서 저품질 ​​이미지를 제거하는 효과를 조사했습니다. 이러한 저품질 이미지를 필터링하면 결과 데이터 세트는 더 작아지지만 더 높은 품질이 될 수 있으므로 AI 모델의 크기를 늘리거나 더 비싼 하드웨어를 요구하지 않고도 더 나은 결과를 얻을 수 있습니다. Angus는 이 접근 방식이 더 크고 리소스 집약적인 모델에 의존하지 않고 AI 생성 이미지의 품질을 개선할 수 있는 유망한 방법임을 나타냅니다.

예술에서 AI의 한 가지 문제는 예술을 만드는 데 많은 시간을 소비하는 인간 예술가의 작품을 평가절하할 수 있는 반면 AI는 몇 초 만에 예술을 생성할 수 있다는 것입니다. 그러나 인간 예술에는 종종 인간이 만든 작품에 나타나는 감정적 깊이와 복잡성과 같이 AI가 복제하기 어려울 수 있는 무형의 특성이 있습니다. NightCafe Studio는 AI가 상업적 목적을 위한 예술 창작보다는 창작 과정 자체의 즐거움에 더 가깝다고 생각합니다.

"예술가의 노력과 기술을 나타내기 때문에 인간이 만든 예술에는 항상 가치가 있지만 AI로 생성된 예술은 본질적인 가치가 없습니다."

앵거스가 말했다.

예술에서 AI를 둘러싼 윤리적 문제는 AI를 교육하는 회사에 속하지 않을 수 있는 AI 알고리즘을 교육하기 위해 공개 이미지를 사용하는 것입니다. 현재 위반한 법률은 없지만 동의 및 개인 정보 보호에 대한 질문이 제기됩니다. 같은 오픈소스 기업 OpenAI 및 DALL-E는 프로세스를 보다 윤리적으로 만들기 위해 노력하고 있지만 여전히 미해결 문제로 남아 있습니다. 예술에서 AI를 훈련하기 위한 이미지 사용에 관한 향후 규정이 있을 수 있습니다.

이러한 우려에도 불구하고 Angus는 예술에서의 AI 프로세스가 다른 아티스트의 작업에서 영감을 얻는 인간 아티스트와 근본적으로 다르지 않다고 생각합니다. AI는 사람처럼 사물이 어떻게 생겼는지 알고 이미지에 대한 정보를 기억합니다. 처음부터 다시 만드는 것이 더 낫습니다.

더 읽기 :

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Agne는 메타버스, AI, Web3 산업 Metaverse Post. 스토리텔링에 대한 그녀의 열정으로 인해 그녀는 이 분야의 전문가들과 수많은 인터뷰를 진행했으며 항상 흥미롭고 매력적인 이야기를 발견하기 위해 노력했습니다. Agne는 문학 학사 학위를 보유하고 있으며 여행, 예술, 문화를 포함한 광범위한 주제에 대한 글쓰기에 대한 광범위한 배경을 가지고 있습니다. 그녀는 또한 동물 권리 단체의 편집자로 자원 봉사하여 동물 복지 문제에 대한 인식을 높이는 데 도움을 주었습니다. 그녀에게 연락하세요 [이메일 보호].

더 많은 기사
아그네 시메르만
아그네 시메르만

Agne는 메타버스, AI, Web3 산업 Metaverse Post. 스토리텔링에 대한 그녀의 열정으로 인해 그녀는 이 분야의 전문가들과 수많은 인터뷰를 진행했으며 항상 흥미롭고 매력적인 이야기를 발견하기 위해 노력했습니다. Agne는 문학 학사 학위를 보유하고 있으며 여행, 예술, 문화를 포함한 광범위한 주제에 대한 글쓰기에 대한 광범위한 배경을 가지고 있습니다. 그녀는 또한 동물 권리 단체의 편집자로 자원 봉사하여 동물 복지 문제에 대한 인식을 높이는 데 도움을 주었습니다. 그녀에게 연락하세요 [이메일 보호].

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

변동성 속에서 비트코인 ​​ETF를 향한 기관의 선호도 증가

13F 서류를 통한 공개를 통해 주목할만한 기관 투자자들이 비트코인 ​​ETF에 손을 대고 있음이 드러났으며, 이는 비트코인 ​​ETF에 대한 수용이 증가하고 있음을 강조합니다.

현장 사진

선고일이 다가왔습니다: 미국 법원이 DOJ의 주장을 고려함에 따라 CZ의 운명이 균형을 이루고 있습니다.

자오창펑(Changpeng Zhao)은 오늘 시애틀의 미국 법원에서 선고를 받을 예정이다.

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
Injective는 AltLayer와 힘을 합쳐 inEVM에 재스테이킹 보안을 도입했습니다.
근무지에서 발생 뉴스 보도 Technology
Injective는 AltLayer와 힘을 합쳐 inEVM에 재스테이킹 보안을 도입했습니다.
2024 년 5 월 3 일
Masa는 텔러와 협력하여 MASA 대출 풀을 도입하고 USDC에서 베이스 대출을 활성화합니다.
시장 뉴스 보도 Technology
Masa는 텔러와 협력하여 MASA 대출 풀을 도입하고 USDC에서 베이스 대출을 활성화합니다.
2024 년 5 월 3 일
Velodrome은 앞으로 몇 주 안에 Superchain 베타 버전을 출시하고 OP 스택 레이어 2 블록체인으로 확장합니다.
시장 뉴스 보도 Technology
Velodrome은 앞으로 몇 주 안에 Superchain 베타 버전을 출시하고 OP 스택 레이어 2 블록체인으로 확장합니다.
2024 년 5 월 3 일
CARV, 데이터 계층을 분산화하고 보상을 분배하기 위해 Aethir와의 파트너십 발표
근무지에서 발생 뉴스 보도 Technology
CARV, 데이터 계층을 분산화하고 보상을 분배하기 위해 Aethir와의 파트너십 발표
2024 년 5 월 3 일
CRYPTOMERIA LABS PTE. LTD.