สัมภาษณ์ ศิลปะ เอสเอ็มดับบลิว
May 01, 2023

DeepFloyd and Beyond: สำรวจศิลปะ AI ล่าสุดกับ NightCafe Studio CEO

ในบทสรุป

ในระหว่างการสัมภาษณ์พิเศษ CEO ของ NightCafe Studio ได้ให้ข้อมูลเชิงลึกและมุมมองอันมีค่าเกี่ยวกับงานศิลปะที่สร้างโดย AI

Angus Russell เปิดตัว DeepFloyd ซึ่งเป็นอัลกอริธึมใหม่ที่พัฒนาโดยหุ้นส่วนของ NightCafe Studio Stability AIที่ทำงานในพื้นที่พิกเซลและใช้โมเดลภาษาขนาดใหญ่ (LLM) เพื่อสร้างรูปภาพ

ไนท์คาเฟ่ สตูดิโอ เป็นเครื่องกำเนิดศิลปะ AI ที่ช่วยให้ผู้ใช้สร้างงานศิลปะที่น่าทึ่งและล้ำยุคในไม่กี่วินาทีด้วยความช่วยเหลือของปัญญาประดิษฐ์ ก่อตั้งโดย แองกัส รัสเซล เมื่อ XNUMX ปีก่อน NightCafe Studio เกิดจากความหงุดหงิดของแองกัสที่ไม่สามารถหาชิ้นงานศิลปะที่โดนใจเขาได้ ด้วยความรู้ที่ว่าอัลกอริทึมการถ่ายโอนสไตล์มีอยู่จริง เขาจึงค้นหาเว็บไซต์ที่ช่วยให้เขาสร้างงานศิลปะที่ปรับเปลี่ยนในแบบของคุณผ่านการถ่ายโอนสไตล์และพิมพ์ออกมา 

ด้วยความผิดหวัง เขาไม่สามารถหาแท่นดังกล่าวได้ อย่างไรก็ตาม ความพ่ายแพ้นี้ได้จุดประกายความคิดสร้างสรรค์ในตัวเขา เขาตัดสินใจสร้างแอพถ่ายโอนสไตล์ประสาทสำหรับสร้างงานศิลปะที่สร้างโดย AI และเขานำมันขึ้นบน Reddit

NightCafe Studio ถือกำเนิดขึ้นในฐานะแพลตฟอร์มสร้างข้อความเป็นรูปภาพ ทำให้เป็นแพลตฟอร์มแรกในประเภทนี้ คุณลักษณะเฉพาะนี้ทำให้รายได้และฐานผู้ใช้เพิ่มขึ้นอย่างมาก ตั้งแต่นั้นมา แพลตฟอร์มดังกล่าวก็ยังคงเป็นแนวหน้าของ AI เจนเนอเรทีฟ ดึงดูดชุมชนขนาดใหญ่ของผู้ที่ชื่นชอบการใช้เจเนอเรเตอร์เพื่อสร้างงานศิลปะที่น่าทึ่ง ปัจจุบัน NightCafe Studio ได้รับการยอมรับอย่างกว้างขวางว่าเป็นหนึ่งในเครื่องกำเนิดภาพ AI ที่ได้รับความนิยมและเป็นนวัตกรรมใหม่ที่สุด

ในระหว่างการสัมภาษณ์กับ Angus Russell เราได้สำรวจประโยชน์และข้อจำกัดของงานศิลปะที่สร้างโดย AI การใช้ปัญญาประดิษฐ์ที่เพิ่มขึ้นในโลกศิลปะ และ DeepFloyd อัลกอริธึมการสร้างภาพ AI ล่าสุด

ไนท์คาเฟ่สตูดิโอ
Sydney Opera House: หนึ่งในภาพที่สร้างโดย AI แรกของแองกัส

การเกิดขึ้นของศิลปะที่สร้างโดย AI

ในทศวรรษที่ผ่านมา อุตสาหกรรมศิลปะได้เห็นการแทรกซึมของ AI และการเรียนรู้ของเครื่อง (ML) อย่างค่อยเป็นค่อยไป เทคโนโลยีล้ำสมัยเหล่านี้ได้นำเสนอแนวคิดใหม่ๆ ที่น่าสนใจ เช่น Deepfakes และ DALL-Eซึ่งได้รับความสนใจอย่างมากทั่วโลก ทุกวันนี้ อุตสาหกรรมศิลปะไม่สามารถเพิกเฉยต่อผลกระทบอันยิ่งใหญ่ของ AI ซึ่งขณะนี้กำลังก่อให้เกิดการปฏิวัติในภาคส่วนนี้เป็นเวลานาน

แองกัสกล่าวถึงวิธีที่ NightCafe Studio เติบโตอย่างก้าวกระโดดระหว่างการเปิดตัว Stable Diffusionซึ่งเป็นโมเดลแปลงข้อความเป็นภาพที่บริษัทของเขาเผยแพร่ในวันเปิดตัว ตั้งแต่นั้นมา อุปสรรคในการเข้าสู่การสร้างเครื่องมือที่คล้ายกันได้ลดลงเนื่องจากการเปิดแหล่งที่มาของอัลกอริทึมและโค้ดตัวอย่าง

ผู้ก่อตั้ง NightCafe Studio เชื่อว่าการสร้างงานศิลปะ AI ไม่ใช่แค่ผลิตภัณฑ์ขั้นสุดท้าย แต่ยังเกี่ยวกับกระบวนการสร้างมันด้วย เขามองว่ามันเป็นการบำบัดและการผ่อนคลายรูปแบบหนึ่ง ทำให้ผู้คนสามารถแสดงออกถึงตัวตนในรูปแบบที่เป็นเอกลักษณ์และสร้างสรรค์ หลายคนที่ไม่เคยคิดว่าตัวเองมีความคิดสร้างสรรค์ได้ค้นพบความสามารถทางศิลปะของตนผ่านภาพที่ AI สร้างขึ้น ปรัชญานี้สะท้อนให้เห็นในส่วนติดต่อผู้ใช้ของแพลตฟอร์ม ซึ่งออกแบบมาให้ใช้งานง่ายและเข้าถึงได้สำหรับศิลปินทุกระดับทักษะ 

เฉพาะใน NightCafe Studio มีผู้ใช้ระหว่างสองถึงสามล้านคนต่อเดือน สร้างภาพประมาณล้านภาพต่อวัน Stability AIบริษัทโอเพ่นซอร์สกำเนิด AI ระบุ พวกเขามีผู้ใช้มากกว่า 10 ล้านคนที่ใช้งานทุกวันหลังจากเปิดตัวได้ไม่นาน Stable Diffusion.

ที่แนะนำ: 10+ สุดยอด AI Art Generator ประจำปี 2023: Midjourney, DALL-E , NightCafe , Artbreeder

DeepFloyd IF: อัลกอริทึมการสร้างภาพ AI ที่พลิกเกมใหม่

NightCafe Studio กำลังใช้อัลกอริธึมใหม่โดย Stability AI ที่เรียกว่า ดีฟฟลอยด์ซึ่งสัญญาว่าจะปฏิวัติวิธีที่เราสร้างภาพด้วยปัญญาประดิษฐ์

DeepFloyd ซึ่งขณะนี้อยู่ในรุ่นเบต้า เป็นโมเดลข้อความเป็นรูปภาพใหม่ที่สามารถสร้างภาพที่น่าประทับใจจากคำอธิบายภาษาธรรมชาติ มันขึ้นอยู่กับสถาปัตยกรรมใหม่ที่รวมโมเดลภาษาขนาดใหญ่เข้ากับโมเดลการแพร่กระจายสามแบบ ได้รับแรงบันดาลใจจาก Imagen ซึ่งเป็นโมเดลที่คล้ายกันซึ่งพัฒนาโดย Google Research แต่ไม่เคยเผยแพร่สู่สาธารณะ

แบบจำลองสามารถสร้างภาพที่ชัดเจนและสอดคล้องกันกับข้อความและวัตถุในความสัมพันธ์เชิงพื้นที่ต่างๆ ซึ่งเป็นงานที่ท้าทายสำหรับแบบจำลองข้อความเป็นภาพอื่นๆ ส่วนใหญ่ สิ่งนี้ทำได้โดยใช้โมเดลภาษาขนาดใหญ่ T5-XXL-1.1 เป็นตัวเข้ารหัสข้อความและเลเยอร์การข้ามความสนใจของข้อความและรูปภาพจำนวนมากที่ให้การโต้ตอบและรูปภาพที่ดีกว่า 

DeepFloyd ยังสามารถสร้างภาพที่มีอัตราส่วนภาพที่ไม่เป็นมาตรฐานและมีความเหมือนจริงในระดับสูง นอกจากนี้ยังช่วยให้สามารถแปลแบบภาพต่อภาพแบบ Zero-shot ซึ่งหมายความว่าสไตล์ รูปแบบ และรายละเอียดของภาพที่ส่งออกสามารถแก้ไขได้ในขณะที่รักษารูปแบบพื้นฐานของภาพต้นฉบับโดยไม่จำเป็นต้องปรับละเอียด

อัลกอริทึมใหม่ทำงานในวิธีที่แตกต่างจาก Stable Diffusion. DeepFloyd ใช้พื้นที่พิกเซลและโมเดลภาษาขนาดใหญ่ (LLM) ในขณะที่ Stable Diffusion ใช้พื้นที่แฝงและโมเดล CLIP คงที่ DeepFloyd ยังใช้กระบวนการแพร่หลายขั้นตอนเพื่อสร้างภาพในขณะที่ Stable Diffusion ใช้เพียงตัวเดียว

DeepFloyd เป็นชื่อของกลุ่มวิจัยที่สร้างอัลกอริทึม และตัวอัลกอริทึมเองเรียกว่า IF กลุ่มวิจัยประกอบด้วยบุคคลเดียวกันหลายคนที่สร้าง GPT-3บรรพบุรุษของ GPT-2และโมเดลภาษาล้ำสมัยก่อนหน้านี้ที่เรียกว่า RuGPT.

การคาดเดาบางอย่างชี้ให้เห็นว่าชื่อ IF อาจได้รับแรงบันดาลใจจากเพลงของ Pink Floyd ที่มีชื่อเดียวกัน ตามที่บอกเป็นนัยโดยประวัติโซเชียลมีเดียของกลุ่มวิจัยอัลกอริทึม

อ่านเพิ่มเติมเกี่ยวกับอัลกอริทึม  โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.

ดีฟฟลอยด์ ไนท์คาเฟ่ สตูดิโอ
รูปภาพที่สร้างด้วย DeepFloyd IF แหล่งที่มา: Stability AI

การเปรียบเทียบข้อจำกัดของ AI Art และ Digital Art

ข้อจำกัดด้าน AI ที่สำคัญประการหนึ่งคือข้อความ แม้ว่า DeepFloyd จะจัดการปัญหานี้ก็ตาม ข้อจำกัดอีกประการหนึ่งคือความยากในการได้ภาพตรงตามที่จินตนาการไว้ โดยเฉพาะอย่างยิ่งหากไม่ได้รับคำแนะนำจากผู้เชี่ยวชาญ AI ยังขาดความสามารถในการเข้าใจและตีความ บริบททางวัฒนธรรมและสังคมที่หล่อหลอมศิลปะของมนุษย์. ดังนั้น บางครั้งงานศิลปะที่สร้างโดย AI จึงสามารถผลิตผลงานที่ดูไม่เข้าที่หรือไร้ความรู้สึกทางวัฒนธรรมได้

อย่างไรก็ตาม รูปภาพที่สร้างโดย AI ยังคงสวยงามและบางครั้งก็ดีกว่าแนวคิดดั้งเดิม ตราบใดที่ผู้ใช้เปิดใจรับความประหลาดใจ Angus กล่าว นอกจากนี้ยังมีวิธีแก้ไข สร้างภาพโดยใช้อัลกอริธึม AI หรือ Photoshop. แม้ว่าการได้ภาพที่แน่ชัดในปัจจุบันเป็นหัวข้อหนึ่งของการวิจัยเชิงรุก แต่ก็มีความก้าวหน้าที่สำคัญอยู่ ในไม่ช้า อาจสามารถควบคุมทุกแง่มุมของภาพได้อย่างเต็มที่ 

AI อาศัยรูปภาพและงานศิลปะที่มีอยู่ในเว็บเป็นแรงบันดาลใจ แต่เฉพาะที่ได้รับการฝึกฝนมาเท่านั้น อัลกอริทึมต่างๆ เช่น Midjourney, ดัล-อี และ Stable Diffusionได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลที่แตกต่างกัน ซึ่งหมายความว่าอาจทำงานได้ดีขึ้นกับภาพบางประเภท 

เมื่อเร็ว ๆ นี้ นักวิจัยกำลังตรวจสอบผลกระทบของการลบภาพคุณภาพต่ำออกจากชุดข้อมูลการฝึกอบรมเพื่อปรับปรุงผลลัพธ์ของ AI ด้วยการกรองภาพคุณภาพต่ำเหล่านี้ ชุดข้อมูลที่ได้อาจมีขนาดเล็กลงแต่คุณภาพสูงขึ้น ซึ่งนำไปสู่ผลลัพธ์ที่ดีขึ้นโดยไม่ต้องเพิ่มขนาดของโมเดล AI หรือต้องใช้ฮาร์ดแวร์ที่มีราคาแพงกว่า แองกัสแบ่งปันว่าแนวทางนี้เป็นวิธีที่มีแนวโน้มดีในการปรับปรุงคุณภาพของรูปภาพที่สร้างโดย AI โดยไม่ต้องอาศัยโมเดลขนาดใหญ่และใช้ทรัพยากรมาก

ปัญหาอย่างหนึ่งของ AI ในงานศิลปะคืออาจลดคุณค่าของงานของศิลปินที่เป็นมนุษย์ซึ่งใช้เวลามากมายในการสร้างสรรค์งานศิลปะ ในขณะที่ AI สามารถสร้างงานศิลปะได้ในเวลาไม่กี่วินาที อย่างไรก็ตาม มีคุณภาพบางอย่างที่จับต้องไม่ได้สำหรับงานศิลปะของมนุษย์ซึ่งอาจเป็นเรื่องยากสำหรับ AI ในการทำซ้ำ เช่น ความลึกซึ้งทางอารมณ์และความซับซ้อนที่มักปรากฏอยู่ในผลงานที่มนุษย์สร้างขึ้น NightCafe Studio เชื่อว่า AI นั้นไม่ได้เกี่ยวกับการสร้างงานศิลปะเพื่อวัตถุประสงค์ทางการค้า แต่ให้ความสำคัญกับความเพลิดเพลินในกระบวนการสร้างสรรค์มากกว่า

“งานศิลปะที่มนุษย์สร้างขึ้นจะมีคุณค่าเสมอ เพราะมันแสดงถึงความพยายามและทักษะของศิลปิน ในขณะที่งานศิลปะที่สร้างโดย AI จะไม่มีคุณค่าที่แท้จริงเช่นเดียวกัน”

แองกัสกล่าว

ปัญหาด้านจริยธรรมเกี่ยวกับ AI ในงานศิลปะคือการใช้ภาพสาธารณะเพื่อฝึกอัลกอริทึม AI ซึ่งอาจไม่ใช่ของบริษัทที่ฝึก AI แม้ว่าในขณะนี้จะไม่มีกฎหมายใดฝ่าฝืน แต่ก็ทำให้เกิดคำถามเกี่ยวกับความยินยอมและความเป็นส่วนตัว บริษัทโอเพ่นซอร์สเช่น OpenAI และ DALL-E กำลังพยายามทำให้กระบวนการมีจริยธรรมมากขึ้น แต่ก็ยังเป็นคำถามที่เปิดอยู่ อาจมีข้อบังคับในอนาคตเกี่ยวกับการใช้ภาพเพื่อฝึกฝน AI ในงานศิลปะ

แม้จะมีความกังวลเหล่านี้ แองกัสเชื่อว่ากระบวนการของ AI ในงานศิลปะนั้นไม่ได้แตกต่างโดยพื้นฐานจากการที่ศิลปินที่เป็นมนุษย์ได้รับแรงบันดาลใจจากผลงานของศิลปินคนอื่นๆ AI รู้ว่าสิ่งต่างๆ มีลักษณะอย่างไรและจดจำส่วนต่างๆ ของภาพได้เหมือนกับที่มนุษย์ทำ เป็นการดีกว่าที่จะสร้างใหม่ตั้งแต่เริ่มต้น

อ่านเพิ่มเติม:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

Agne เป็นนักข่าวที่รายงานข่าวเกี่ยวกับแนวโน้มล่าสุดและการพัฒนาใน metaverse, AI และ Web3 อุตสาหกรรมสำหรับ Metaverse Post. ความหลงใหลในการเล่าเรื่องของเธอทำให้เธอต้องสัมภาษณ์ผู้เชี่ยวชาญในสาขาเหล่านี้หลายครั้ง โดยพยายามค้นหาเรื่องราวที่น่าตื่นเต้นและมีส่วนร่วมอยู่เสมอ แอกเน่สำเร็จการศึกษาระดับปริญญาตรีสาขาวรรณคดีและมีพื้นฐานกว้างขวางในการเขียนเกี่ยวกับหัวข้อต่างๆ มากมาย รวมถึงการท่องเที่ยว ศิลปะ และวัฒนธรรม เธอยังได้อาสาเป็นบรรณาธิการให้กับองค์กรสิทธิสัตว์ ซึ่งเธอช่วยสร้างความตระหนักรู้เกี่ยวกับปัญหาสวัสดิภาพสัตว์ ติดต่อเธอได้ที่ [ป้องกันอีเมล].

บทความอื่น ๆ
แอกเน่ ซิเมอร์แมน
แอกเน่ ซิเมอร์แมน

Agne เป็นนักข่าวที่รายงานข่าวเกี่ยวกับแนวโน้มล่าสุดและการพัฒนาใน metaverse, AI และ Web3 อุตสาหกรรมสำหรับ Metaverse Post. ความหลงใหลในการเล่าเรื่องของเธอทำให้เธอต้องสัมภาษณ์ผู้เชี่ยวชาญในสาขาเหล่านี้หลายครั้ง โดยพยายามค้นหาเรื่องราวที่น่าตื่นเต้นและมีส่วนร่วมอยู่เสมอ แอกเน่สำเร็จการศึกษาระดับปริญญาตรีสาขาวรรณคดีและมีพื้นฐานกว้างขวางในการเขียนเกี่ยวกับหัวข้อต่างๆ มากมาย รวมถึงการท่องเที่ยว ศิลปะ และวัฒนธรรม เธอยังได้อาสาเป็นบรรณาธิการให้กับองค์กรสิทธิสัตว์ ซึ่งเธอช่วยสร้างความตระหนักรู้เกี่ยวกับปัญหาสวัสดิภาพสัตว์ ติดต่อเธอได้ที่ [ป้องกันอีเมล].

Hot Stories
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

ความอยากอาหารของสถาบันเติบโตขึ้นสู่ Bitcoin ETFs ท่ามกลางความผันผวน

การเปิดเผยผ่านการยื่นเอกสาร 13F เผยให้เห็นนักลงทุนสถาบันที่มีชื่อเสียงกำลังเล่น Bitcoin ETFs ซึ่งตอกย้ำถึงการยอมรับที่เพิ่มขึ้นของ ...

รู้เพิ่มเติม

วันพิพากษามาถึง: ชะตากรรมของ CZ แขวนอยู่ในสมดุลขณะที่ศาลสหรัฐฯ พิจารณาคำร้องของ DOJ

ฉางเผิง จ้าว เตรียมเผชิญโทษจำคุกในศาลสหรัฐฯ ในเมืองซีแอตเทิลวันนี้

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
Injective ผนึกกำลัง AltLayer เพื่อนำการรักษาความปลอดภัยกลับมาสู่ inEVM
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
Injective ผนึกกำลัง AltLayer เพื่อนำการรักษาความปลอดภัยกลับมาสู่ inEVM
May 3, 2024
Masa ร่วมมือกับ Teller เพื่อแนะนำกลุ่มการให้ยืมของ MASA ซึ่งช่วยให้สามารถกู้ยืม USDC บนฐานได้
ตลาด รายงานข่าว เทคโนโลยี
Masa ร่วมมือกับ Teller เพื่อแนะนำกลุ่มการให้ยืมของ MASA ซึ่งช่วยให้สามารถกู้ยืม USDC บนฐานได้
May 3, 2024
Velodrome เปิดตัวเวอร์ชัน Superchain Beta ในอีกไม่กี่สัปดาห์ข้างหน้าและขยายข้ามบล็อคเชน OP Stack Layer 2
ตลาด รายงานข่าว เทคโนโลยี
Velodrome เปิดตัวเวอร์ชัน Superchain Beta ในอีกไม่กี่สัปดาห์ข้างหน้าและขยายข้ามบล็อคเชน OP Stack Layer 2
May 3, 2024
CARV ประกาศความร่วมมือกับ Aethir เพื่อกระจายอำนาจชั้นข้อมูลและแจกจ่ายรางวัล
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
CARV ประกาศความร่วมมือกับ Aethir เพื่อกระจายอำนาจชั้นข้อมูลและแจกจ่ายรางวัล
May 3, 2024
CRYPTOMERIA LABS PTE. บจก.