DeepFloyd and Beyond: สำรวจศิลปะ AI ล่าสุดกับ NightCafe Studio CEO
ในบทสรุป
ในระหว่างการสัมภาษณ์พิเศษ CEO ของ NightCafe Studio ได้ให้ข้อมูลเชิงลึกและมุมมองอันมีค่าเกี่ยวกับงานศิลปะที่สร้างโดย AI
Angus Russell เปิดตัว DeepFloyd ซึ่งเป็นอัลกอริธึมใหม่ที่พัฒนาโดยหุ้นส่วนของ NightCafe Studio Stability AIที่ทำงานในพื้นที่พิกเซลและใช้โมเดลภาษาขนาดใหญ่ (LLM) เพื่อสร้างรูปภาพ
ไนท์คาเฟ่ สตูดิโอ เป็นเครื่องกำเนิดศิลปะ AI ที่ช่วยให้ผู้ใช้สร้างงานศิลปะที่น่าทึ่งและล้ำยุคในไม่กี่วินาทีด้วยความช่วยเหลือของปัญญาประดิษฐ์ ก่อตั้งโดย แองกัส รัสเซล เมื่อ XNUMX ปีก่อน NightCafe Studio เกิดจากความหงุดหงิดของแองกัสที่ไม่สามารถหาชิ้นงานศิลปะที่โดนใจเขาได้ ด้วยความรู้ที่ว่าอัลกอริทึมการถ่ายโอนสไตล์มีอยู่จริง เขาจึงค้นหาเว็บไซต์ที่ช่วยให้เขาสร้างงานศิลปะที่ปรับเปลี่ยนในแบบของคุณผ่านการถ่ายโอนสไตล์และพิมพ์ออกมา
ด้วยความผิดหวัง เขาไม่สามารถหาแท่นดังกล่าวได้ อย่างไรก็ตาม ความพ่ายแพ้นี้ได้จุดประกายความคิดสร้างสรรค์ในตัวเขา เขาตัดสินใจสร้างแอพถ่ายโอนสไตล์ประสาทสำหรับสร้างงานศิลปะที่สร้างโดย AI และเขานำมันขึ้นบน Reddit
NightCafe Studio ถือกำเนิดขึ้นในฐานะแพลตฟอร์มสร้างข้อความเป็นรูปภาพ ทำให้เป็นแพลตฟอร์มแรกในประเภทนี้ คุณลักษณะเฉพาะนี้ทำให้รายได้และฐานผู้ใช้เพิ่มขึ้นอย่างมาก ตั้งแต่นั้นมา แพลตฟอร์มดังกล่าวก็ยังคงเป็นแนวหน้าของ AI เจนเนอเรทีฟ ดึงดูดชุมชนขนาดใหญ่ของผู้ที่ชื่นชอบการใช้เจเนอเรเตอร์เพื่อสร้างงานศิลปะที่น่าทึ่ง ปัจจุบัน NightCafe Studio ได้รับการยอมรับอย่างกว้างขวางว่าเป็นหนึ่งในเครื่องกำเนิดภาพ AI ที่ได้รับความนิยมและเป็นนวัตกรรมใหม่ที่สุด
ในระหว่างการสัมภาษณ์กับ Angus Russell เราได้สำรวจประโยชน์และข้อจำกัดของงานศิลปะที่สร้างโดย AI การใช้ปัญญาประดิษฐ์ที่เพิ่มขึ้นในโลกศิลปะ และ DeepFloyd อัลกอริธึมการสร้างภาพ AI ล่าสุด
การเกิดขึ้นของศิลปะที่สร้างโดย AI
ในทศวรรษที่ผ่านมา อุตสาหกรรมศิลปะได้เห็นการแทรกซึมของ AI และการเรียนรู้ของเครื่อง (ML) อย่างค่อยเป็นค่อยไป เทคโนโลยีล้ำสมัยเหล่านี้ได้นำเสนอแนวคิดใหม่ๆ ที่น่าสนใจ เช่น Deepfakes และ DALL-Eซึ่งได้รับความสนใจอย่างมากทั่วโลก ทุกวันนี้ อุตสาหกรรมศิลปะไม่สามารถเพิกเฉยต่อผลกระทบอันยิ่งใหญ่ของ AI ซึ่งขณะนี้กำลังก่อให้เกิดการปฏิวัติในภาคส่วนนี้เป็นเวลานาน
แองกัสกล่าวถึงวิธีที่ NightCafe Studio เติบโตอย่างก้าวกระโดดระหว่างการเปิดตัว Stable Diffusionซึ่งเป็นโมเดลแปลงข้อความเป็นภาพที่บริษัทของเขาเผยแพร่ในวันเปิดตัว ตั้งแต่นั้นมา อุปสรรคในการเข้าสู่การสร้างเครื่องมือที่คล้ายกันได้ลดลงเนื่องจากการเปิดแหล่งที่มาของอัลกอริทึมและโค้ดตัวอย่าง
ผู้ก่อตั้ง NightCafe Studio เชื่อว่าการสร้างงานศิลปะ AI ไม่ใช่แค่ผลิตภัณฑ์ขั้นสุดท้าย แต่ยังเกี่ยวกับกระบวนการสร้างมันด้วย เขามองว่ามันเป็นการบำบัดและการผ่อนคลายรูปแบบหนึ่ง ทำให้ผู้คนสามารถแสดงออกถึงตัวตนในรูปแบบที่เป็นเอกลักษณ์และสร้างสรรค์ หลายคนที่ไม่เคยคิดว่าตัวเองมีความคิดสร้างสรรค์ได้ค้นพบความสามารถทางศิลปะของตนผ่านภาพที่ AI สร้างขึ้น ปรัชญานี้สะท้อนให้เห็นในส่วนติดต่อผู้ใช้ของแพลตฟอร์ม ซึ่งออกแบบมาให้ใช้งานง่ายและเข้าถึงได้สำหรับศิลปินทุกระดับทักษะ
เฉพาะใน NightCafe Studio มีผู้ใช้ระหว่างสองถึงสามล้านคนต่อเดือน สร้างภาพประมาณล้านภาพต่อวัน Stability AIบริษัทโอเพ่นซอร์สกำเนิด AI ระบุ พวกเขามีผู้ใช้มากกว่า 10 ล้านคนที่ใช้งานทุกวันหลังจากเปิดตัวได้ไม่นาน Stable Diffusion.
DeepFloyd IF: อัลกอริทึมการสร้างภาพ AI ที่พลิกเกมใหม่
NightCafe Studio กำลังใช้อัลกอริธึมใหม่โดย Stability AI ที่เรียกว่า ดีฟฟลอยด์ซึ่งสัญญาว่าจะปฏิวัติวิธีที่เราสร้างภาพด้วยปัญญาประดิษฐ์
DeepFloyd ซึ่งขณะนี้อยู่ในรุ่นเบต้า เป็นโมเดลข้อความเป็นรูปภาพใหม่ที่สามารถสร้างภาพที่น่าประทับใจจากคำอธิบายภาษาธรรมชาติ มันขึ้นอยู่กับสถาปัตยกรรมใหม่ที่รวมโมเดลภาษาขนาดใหญ่เข้ากับโมเดลการแพร่กระจายสามแบบ ได้รับแรงบันดาลใจจาก Imagen ซึ่งเป็นโมเดลที่คล้ายกันซึ่งพัฒนาโดย Google Research แต่ไม่เคยเผยแพร่สู่สาธารณะ
แบบจำลองสามารถสร้างภาพที่ชัดเจนและสอดคล้องกันกับข้อความและวัตถุในความสัมพันธ์เชิงพื้นที่ต่างๆ ซึ่งเป็นงานที่ท้าทายสำหรับแบบจำลองข้อความเป็นภาพอื่นๆ ส่วนใหญ่ สิ่งนี้ทำได้โดยใช้โมเดลภาษาขนาดใหญ่ T5-XXL-1.1 เป็นตัวเข้ารหัสข้อความและเลเยอร์การข้ามความสนใจของข้อความและรูปภาพจำนวนมากที่ให้การโต้ตอบและรูปภาพที่ดีกว่า
DeepFloyd ยังสามารถสร้างภาพที่มีอัตราส่วนภาพที่ไม่เป็นมาตรฐานและมีความเหมือนจริงในระดับสูง นอกจากนี้ยังช่วยให้สามารถแปลแบบภาพต่อภาพแบบ Zero-shot ซึ่งหมายความว่าสไตล์ รูปแบบ และรายละเอียดของภาพที่ส่งออกสามารถแก้ไขได้ในขณะที่รักษารูปแบบพื้นฐานของภาพต้นฉบับโดยไม่จำเป็นต้องปรับละเอียด
อัลกอริทึมใหม่ทำงานในวิธีที่แตกต่างจาก Stable Diffusion. DeepFloyd ใช้พื้นที่พิกเซลและโมเดลภาษาขนาดใหญ่ (LLM) ในขณะที่ Stable Diffusion ใช้พื้นที่แฝงและโมเดล CLIP คงที่ DeepFloyd ยังใช้กระบวนการแพร่หลายขั้นตอนเพื่อสร้างภาพในขณะที่ Stable Diffusion ใช้เพียงตัวเดียว
DeepFloyd เป็นชื่อของกลุ่มวิจัยที่สร้างอัลกอริทึม และตัวอัลกอริทึมเองเรียกว่า IF กลุ่มวิจัยประกอบด้วยบุคคลเดียวกันหลายคนที่สร้าง GPT-3บรรพบุรุษของ GPT-2และโมเดลภาษาล้ำสมัยก่อนหน้านี้ที่เรียกว่า RuGPT.
การคาดเดาบางอย่างชี้ให้เห็นว่าชื่อ IF อาจได้รับแรงบันดาลใจจากเพลงของ Pink Floyd ที่มีชื่อเดียวกัน ตามที่บอกเป็นนัยโดยประวัติโซเชียลมีเดียของกลุ่มวิจัยอัลกอริทึม
อ่านเพิ่มเติมเกี่ยวกับอัลกอริทึม โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.
การเปรียบเทียบข้อจำกัดของ AI Art และ Digital Art
ข้อจำกัดด้าน AI ที่สำคัญประการหนึ่งคือข้อความ แม้ว่า DeepFloyd จะจัดการปัญหานี้ก็ตาม ข้อจำกัดอีกประการหนึ่งคือความยากในการได้ภาพตรงตามที่จินตนาการไว้ โดยเฉพาะอย่างยิ่งหากไม่ได้รับคำแนะนำจากผู้เชี่ยวชาญ AI ยังขาดความสามารถในการเข้าใจและตีความ บริบททางวัฒนธรรมและสังคมที่หล่อหลอมศิลปะของมนุษย์. ดังนั้น บางครั้งงานศิลปะที่สร้างโดย AI จึงสามารถผลิตผลงานที่ดูไม่เข้าที่หรือไร้ความรู้สึกทางวัฒนธรรมได้
อย่างไรก็ตาม รูปภาพที่สร้างโดย AI ยังคงสวยงามและบางครั้งก็ดีกว่าแนวคิดดั้งเดิม ตราบใดที่ผู้ใช้เปิดใจรับความประหลาดใจ Angus กล่าว นอกจากนี้ยังมีวิธีแก้ไข สร้างภาพโดยใช้อัลกอริธึม AI หรือ Photoshop. แม้ว่าการได้ภาพที่แน่ชัดในปัจจุบันเป็นหัวข้อหนึ่งของการวิจัยเชิงรุก แต่ก็มีความก้าวหน้าที่สำคัญอยู่ ในไม่ช้า อาจสามารถควบคุมทุกแง่มุมของภาพได้อย่างเต็มที่
AI อาศัยรูปภาพและงานศิลปะที่มีอยู่ในเว็บเป็นแรงบันดาลใจ แต่เฉพาะที่ได้รับการฝึกฝนมาเท่านั้น อัลกอริทึมต่างๆ เช่น Midjourney, ดัล-อี และ Stable Diffusionได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลที่แตกต่างกัน ซึ่งหมายความว่าอาจทำงานได้ดีขึ้นกับภาพบางประเภท
เมื่อเร็ว ๆ นี้ นักวิจัยกำลังตรวจสอบผลกระทบของการลบภาพคุณภาพต่ำออกจากชุดข้อมูลการฝึกอบรมเพื่อปรับปรุงผลลัพธ์ของ AI ด้วยการกรองภาพคุณภาพต่ำเหล่านี้ ชุดข้อมูลที่ได้อาจมีขนาดเล็กลงแต่คุณภาพสูงขึ้น ซึ่งนำไปสู่ผลลัพธ์ที่ดีขึ้นโดยไม่ต้องเพิ่มขนาดของโมเดล AI หรือต้องใช้ฮาร์ดแวร์ที่มีราคาแพงกว่า แองกัสแบ่งปันว่าแนวทางนี้เป็นวิธีที่มีแนวโน้มดีในการปรับปรุงคุณภาพของรูปภาพที่สร้างโดย AI โดยไม่ต้องอาศัยโมเดลขนาดใหญ่และใช้ทรัพยากรมาก
ปัญหาอย่างหนึ่งของ AI ในงานศิลปะคืออาจลดคุณค่าของงานของศิลปินที่เป็นมนุษย์ซึ่งใช้เวลามากมายในการสร้างสรรค์งานศิลปะ ในขณะที่ AI สามารถสร้างงานศิลปะได้ในเวลาไม่กี่วินาที อย่างไรก็ตาม มีคุณภาพบางอย่างที่จับต้องไม่ได้สำหรับงานศิลปะของมนุษย์ซึ่งอาจเป็นเรื่องยากสำหรับ AI ในการทำซ้ำ เช่น ความลึกซึ้งทางอารมณ์และความซับซ้อนที่มักปรากฏอยู่ในผลงานที่มนุษย์สร้างขึ้น NightCafe Studio เชื่อว่า AI นั้นไม่ได้เกี่ยวกับการสร้างงานศิลปะเพื่อวัตถุประสงค์ทางการค้า แต่ให้ความสำคัญกับความเพลิดเพลินในกระบวนการสร้างสรรค์มากกว่า
“งานศิลปะที่มนุษย์สร้างขึ้นจะมีคุณค่าเสมอ เพราะมันแสดงถึงความพยายามและทักษะของศิลปิน ในขณะที่งานศิลปะที่สร้างโดย AI จะไม่มีคุณค่าที่แท้จริงเช่นเดียวกัน”
แองกัสกล่าว
ปัญหาด้านจริยธรรมเกี่ยวกับ AI ในงานศิลปะคือการใช้ภาพสาธารณะเพื่อฝึกอัลกอริทึม AI ซึ่งอาจไม่ใช่ของบริษัทที่ฝึก AI แม้ว่าในขณะนี้จะไม่มีกฎหมายใดฝ่าฝืน แต่ก็ทำให้เกิดคำถามเกี่ยวกับความยินยอมและความเป็นส่วนตัว บริษัทโอเพ่นซอร์สเช่น OpenAI และ DALL-E กำลังพยายามทำให้กระบวนการมีจริยธรรมมากขึ้น แต่ก็ยังเป็นคำถามที่เปิดอยู่ อาจมีข้อบังคับในอนาคตเกี่ยวกับการใช้ภาพเพื่อฝึกฝน AI ในงานศิลปะ
แม้จะมีความกังวลเหล่านี้ แองกัสเชื่อว่ากระบวนการของ AI ในงานศิลปะนั้นไม่ได้แตกต่างโดยพื้นฐานจากการที่ศิลปินที่เป็นมนุษย์ได้รับแรงบันดาลใจจากผลงานของศิลปินคนอื่นๆ AI รู้ว่าสิ่งต่างๆ มีลักษณะอย่างไรและจดจำส่วนต่างๆ ของภาพได้เหมือนกับที่มนุษย์ทำ เป็นการดีกว่าที่จะสร้างใหม่ตั้งแต่เริ่มต้น
อ่านเพิ่มเติม:
ข้อจำกัดความรับผิดชอบ
สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า
เกี่ยวกับผู้เขียน
Agne เป็นนักข่าวที่รายงานข่าวเกี่ยวกับแนวโน้มล่าสุดและการพัฒนาใน metaverse, AI และ Web3 อุตสาหกรรมสำหรับ Metaverse Post. ความหลงใหลในการเล่าเรื่องของเธอทำให้เธอต้องสัมภาษณ์ผู้เชี่ยวชาญในสาขาเหล่านี้หลายครั้ง โดยพยายามค้นหาเรื่องราวที่น่าตื่นเต้นและมีส่วนร่วมอยู่เสมอ แอกเน่สำเร็จการศึกษาระดับปริญญาตรีสาขาวรรณคดีและมีพื้นฐานกว้างขวางในการเขียนเกี่ยวกับหัวข้อต่างๆ มากมาย รวมถึงการท่องเที่ยว ศิลปะ และวัฒนธรรม เธอยังได้อาสาเป็นบรรณาธิการให้กับองค์กรสิทธิสัตว์ ซึ่งเธอช่วยสร้างความตระหนักรู้เกี่ยวกับปัญหาสวัสดิภาพสัตว์ ติดต่อเธอได้ที่ [ป้องกันอีเมล].
บทความอื่น ๆAgne เป็นนักข่าวที่รายงานข่าวเกี่ยวกับแนวโน้มล่าสุดและการพัฒนาใน metaverse, AI และ Web3 อุตสาหกรรมสำหรับ Metaverse Post. ความหลงใหลในการเล่าเรื่องของเธอทำให้เธอต้องสัมภาษณ์ผู้เชี่ยวชาญในสาขาเหล่านี้หลายครั้ง โดยพยายามค้นหาเรื่องราวที่น่าตื่นเต้นและมีส่วนร่วมอยู่เสมอ แอกเน่สำเร็จการศึกษาระดับปริญญาตรีสาขาวรรณคดีและมีพื้นฐานกว้างขวางในการเขียนเกี่ยวกับหัวข้อต่างๆ มากมาย รวมถึงการท่องเที่ยว ศิลปะ และวัฒนธรรม เธอยังได้อาสาเป็นบรรณาธิการให้กับองค์กรสิทธิสัตว์ ซึ่งเธอช่วยสร้างความตระหนักรู้เกี่ยวกับปัญหาสวัสดิภาพสัตว์ ติดต่อเธอได้ที่ [ป้องกันอีเมล].