Phỏng vấn Nghệ thuật SMW
01 Tháng Năm, 2023

DeepFloyd và hơn thế nữa: Khám phá nghệ thuật AI mới nhất với Giám đốc điều hành NightCafe Studio

Tóm lại

Trong một cuộc phỏng vấn độc quyền, Giám đốc điều hành của NightCafe Studio đã cung cấp những hiểu biết và quan điểm có giá trị về nghệ thuật do AI tạo ra.

Angus Russell đã giới thiệu DeepFloyd – một thuật toán mới được phát triển bởi đối tác của NightCafe Studio, Stability AI, hoạt động trong không gian pixel và sử dụng Mô hình ngôn ngữ lớn (LLM) để tạo hình ảnh.

ĐêmCafe Studio là một Trình tạo nghệ thuật AI cho phép người dùng tạo ra tác phẩm nghệ thuật tuyệt đẹp và tương lai trong vài giây với sự trợ giúp của trí tuệ nhân tạo. thành lập bởi angus russell bốn năm trước, NightCafe Studio ra đời từ sự thất vọng của chính Angus khi không thể tìm thấy những tác phẩm nghệ thuật gây được tiếng vang với anh. Được thúc đẩy bởi kiến ​​thức về sự tồn tại của các thuật toán chuyển kiểu, anh ấy đã tìm kiếm một trang web cho phép anh ấy tạo tác phẩm nghệ thuật được cá nhân hóa thông qua chuyển kiểu và in nó. 

Trước sự thất vọng của anh ấy, anh ấy không thể tìm thấy một nền tảng như vậy. Tuy nhiên, thất bại này đã khơi dậy một ý tưởng đổi mới trong anh. Anh ấy quyết định tạo một ứng dụng chuyển đổi phong cách thần kinh để tạo tác phẩm nghệ thuật do AI tạo ra và anh ấy đã đưa nó lên Reddit.

NightCafe Studio có nguồn gốc là một nền tảng tạo văn bản thành hình ảnh, khiến nó trở thành nền tảng đầu tiên thuộc loại này. Tính năng độc đáo này đã mang lại sự gia tăng đáng kể về cả doanh thu và cơ sở người dùng. Kể từ đó, nền tảng này vẫn đi đầu trong lĩnh vực AI sáng tạo, thu hút một cộng đồng lớn những người đam mê, những người thích sử dụng trình tạo để tạo ra tác phẩm nghệ thuật tuyệt đẹp. Ngày nay, NightCafe Studio được nhiều người coi là một trong những trình tạo hình ảnh AI sáng tạo và phổ biến nhất hiện có.

Trong cuộc phỏng vấn với Angus Russell, chúng tôi đã khám phá những lợi ích và hạn chế của nghệ thuật do AI tạo ra, việc sử dụng trí tuệ nhân tạo ngày càng tăng trong thế giới nghệ thuật và thuật toán tạo hình ảnh AI mới nhất, DeepFloyd.

studio quán cà phê đêm
Nhà hát Opera Sydney: Một trong những hình ảnh do AI tạo ra đầu tiên của Angus

Sự xuất hiện của nghệ thuật do AI tạo ra

Trong thập kỷ qua, ngành nghệ thuật đã chứng kiến ​​sự xâm nhập dần dần của AI và máy học (ML). Những công nghệ tiên tiến này đã giới thiệu một số khái niệm mới hấp dẫn, chẳng hạn như Deepfakes và DALL-E, đã thu hút được sự chú ý đáng kể trên toàn cầu. Ngày nay, ngành nghệ thuật không thể bỏ qua tác động to lớn của AI, hiện đang gây ra một cuộc cách mạng đã quá lâu trong lĩnh vực này.

Angus đã thảo luận về cách NightCafe Studio trải qua sự tăng trưởng đột biến trong quá trình phát hành Stable Diffusion, một mô hình chuyển văn bản thành hình ảnh mà công ty của anh ấy đã triển khai vào ngày ra mắt. Kể từ đó, rào cản đối với việc tạo ra các công cụ tương tự đã được hạ thấp do nguồn mở của các thuật toán và mã mẫu.

Người sáng lập NightCafe Studio tin rằng việc tạo ra nghệ thuật AI không chỉ là sản phẩm cuối cùng mà còn là quá trình tạo ra nó. Anh ấy coi đó là một hình thức trị liệu và thư giãn, cho phép mọi người thể hiện bản thân theo những cách độc đáo và sáng tạo. Nhiều người chưa bao giờ coi mình là người sáng tạo đã khám phá ra khả năng nghệ thuật của mình thông qua những hình ảnh do AI tạo ra. Triết lý này được phản ánh trong giao diện người dùng của nền tảng, được thiết kế thân thiện với người dùng và dễ tiếp cận đối với các nghệ sĩ thuộc mọi cấp độ kỹ năng. 

Chỉ riêng trên NightCafe Studio, đã có từ hai đến ba triệu người dùng mỗi tháng, tạo ra khoảng một triệu hình ảnh mỗi ngày. Stability AI, một công ty trí tuệ nhân tạo mã nguồn mở, quy định rằng họ đã có hơn 10 triệu người dùng hoạt động hàng ngày ngay sau khi ra mắt Stable Diffusion.

Đề nghị: Hơn 10 Trình tạo nghệ thuật AI tốt nhất năm 2023: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: Thuật toán tạo hình ảnh AI thay đổi cuộc chơi mới

NightCafe Studio đang triển khai một thuật toán mới bằng cách Stability AI gọi là DeepFloyd, hứa hẹn sẽ cách mạng hóa cách chúng ta tạo ảnh bằng trí tuệ nhân tạo.

DeepFloyd, hiện đang trong giai đoạn thử nghiệm, là một mô hình chuyển văn bản thành hình ảnh mới có thể tạo ra những hình ảnh ấn tượng từ các mô tả bằng ngôn ngữ tự nhiên. Nó dựa trên một kiến ​​trúc mới kết hợp một mô hình ngôn ngữ lớn với ba mô hình khuếch tán. Nó lấy cảm hứng từ Imagen, một mô hình tương tự do Google Research phát triển nhưng chưa bao giờ được phát hành ra công chúng.

Mô hình này có thể tạo ra các hình ảnh rõ ràng và mạch lạc với văn bản và các đối tượng trong các mối quan hệ không gian khác nhau, đây là một nhiệm vụ đầy thách thức đối với hầu hết các mô hình chuyển văn bản thành hình ảnh khác. Điều này đạt được bằng cách sử dụng mô hình ngôn ngữ lớn T5-XXL-1.1 làm bộ mã hóa văn bản và một số lượng đáng kể các lớp chú ý chéo hình ảnh văn bản cung cấp liên kết hình ảnh và lời nhắc tốt hơn. 

DeepFloyd cũng có thể tạo hình ảnh với tỷ lệ khung hình không chuẩn và có độ chân thực cao. Ngoài ra, nó cho phép dịch từ ảnh sang ảnh không ảnh, có nghĩa là kiểu, mẫu và chi tiết của ảnh đầu ra có thể được sửa đổi trong khi vẫn duy trì dạng cơ bản của ảnh nguồn mà không cần tinh chỉnh.

Thuật toán mới hoạt động theo một cách khác với Stable Diffusion. DeepFloyd sử dụng không gian pixel và Mô hình ngôn ngữ lớn (LLM), trong khi đó Stable Diffusion sử dụng không gian tiềm ẩn và mô hình CLIP cố định. DeepFloyd cũng sử dụng nhiều quy trình khuếch tán để tạo hình ảnh, trong khi Stable Diffusion chỉ sử dụng một cái duy nhất.

DeepFloyd là tên của nhóm nghiên cứu đã xây dựng thuật toán và bản thân thuật toán này được gọi là IF. Nhóm nghiên cứu bao gồm nhiều người đã tạo ra GPT-3tiền thân của, GPT-2và một mô hình ngôn ngữ tiên tiến trước đây có tên RuGPT.

Một số suy đoán cho rằng cái tên IF có thể được lấy cảm hứng từ một bài hát cùng tên của Pink Floyd, như được gợi ý trong tiểu sử mạng xã hội của nhóm nghiên cứu thuật toán.

Đọc thêm về thuật toán tại đây.

studio quán cà phê đêm deepfloyd
Hình ảnh được tạo bằng DeepFloyd IF. Nguồn: Stability AI

So sánh những hạn chế của nghệ thuật AI và nghệ thuật kỹ thuật số

Một trong những hạn chế lớn của AI là văn bản, mặc dù DeepFloyd đã giải quyết được vấn đề này. Một hạn chế khác là khó có được hình ảnh chính xác như hình dung, đặc biệt nếu không có sự nhắc nhở của chuyên gia. AI cũng thiếu khả năng hiểu và giải thích các bối cảnh văn hóa và xã hội định hình nghệ thuật của con người. Do đó, nghệ thuật do AI tạo ra đôi khi có thể tạo ra những tác phẩm có vẻ lạc lõng hoặc thiếu nhạy cảm về mặt văn hóa.

Tuy nhiên, Angus cho biết, hình ảnh do AI tạo ra vẫn có thể đẹp và đôi khi thậm chí còn đẹp hơn ý tưởng ban đầu, miễn là người dùng sẵn sàng ngạc nhiên. Ngoài ra còn có nhiều cách để sửa đổi hình ảnh được tạo bằng thuật toán AI hoặc Photoshop. Mặc dù việc có được một hình ảnh chính xác hiện đang là một lĩnh vực đang được nghiên cứu tích cực nhưng vẫn đang có những tiến bộ đáng kể. Có thể sẽ sớm có toàn quyền kiểm soát mọi khía cạnh của hình ảnh. 

AI dựa vào những hình ảnh và tác phẩm nghệ thuật tồn tại trên web để làm nguồn cảm hứng, nhưng chỉ những thứ mà nó được đào tạo. Các thuật toán khác nhau, chẳng hạn như Midjourney, DALL-E và Stable Diffusion, được đào tạo trên các tập dữ liệu khác nhau, có nghĩa là chúng có thể hoạt động tốt hơn trên các loại hình ảnh cụ thể. 

Gần đây, các nhà nghiên cứu đang điều tra tác động của việc loại bỏ hình ảnh chất lượng thấp khỏi tập dữ liệu đào tạo để cải thiện kết quả AI. Bằng cách lọc ra những hình ảnh chất lượng thấp này, tập dữ liệu thu được có thể trở nên nhỏ hơn nhưng có chất lượng cao hơn, dẫn đến kết quả tốt hơn mà không cần tăng kích thước của các mô hình AI hoặc yêu cầu phần cứng đắt tiền hơn. Angus chia sẻ rằng phương pháp này đại diện cho một cách đầy hứa hẹn để cải thiện chất lượng hình ảnh do AI tạo ra mà không cần dựa vào các mô hình lớn hơn và sử dụng nhiều tài nguyên hơn.

Một vấn đề với AI trong nghệ thuật là nó có thể làm giảm giá trị tác phẩm của các nghệ sĩ con người, những người dành nhiều thời gian để sáng tạo nghệ thuật, trong khi AI có thể tạo ra tác phẩm chỉ trong vài giây. Tuy nhiên, có một phẩm chất vô hình nhất định đối với nghệ thuật của con người mà AI có thể khó tái tạo, chẳng hạn như chiều sâu cảm xúc và sự phức tạp thường có trong các tác phẩm do con người tạo ra. NightCafe Studio tin rằng AI không phải là sáng tạo nghệ thuật vì mục đích thương mại mà là để tận hưởng quá trình sáng tạo.

“Sẽ luôn có giá trị trong nghệ thuật do con người tạo ra vì nó thể hiện nỗ lực và kỹ năng của nghệ sĩ, trong khi nghệ thuật do AI tạo ra không có cùng giá trị nội tại,”

Angus nói.

Một vấn đề đạo đức xung quanh AI trong nghệ thuật là việc sử dụng hình ảnh công khai để đào tạo các thuật toán AI có thể không thuộc về công ty đào tạo AI. Mặc dù hiện tại không có luật nào bị vi phạm, nhưng nó đặt ra câu hỏi về sự đồng ý và quyền riêng tư. Các công ty mã nguồn mở như OpenAI và DALL-E đang làm việc để làm cho quy trình trở nên đạo đức hơn, nhưng nó vẫn là một câu hỏi mở. Có thể có những quy định trong tương lai liên quan đến việc sử dụng hình ảnh để đào tạo AI trong nghệ thuật.

Bất chấp những lo ngại này, Angus tin rằng quá trình AI trong nghệ thuật về cơ bản không khác với việc các nghệ sĩ con người lấy cảm hứng từ tác phẩm của các nghệ sĩ khác. AI biết mọi thứ trông như thế nào và ghi nhớ các bit về hình ảnh, giống như con người. Nó chỉ đơn giản là tốt hơn để tạo lại chúng từ đầu.

Tìm hiểu thêm:

Từ chối trách nhiệm

Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.

Giới thiệu về Tác giả

Agne là một nhà báo đưa tin về các xu hướng và sự phát triển mới nhất trong metaverse, AI và Web3 các ngành công nghiệp cho Metaverse Post. Niềm đam mê kể chuyện đã khiến cô thực hiện nhiều cuộc phỏng vấn với các chuyên gia trong các lĩnh vực này, luôn tìm cách khám phá những câu chuyện thú vị và hấp dẫn. Agne có bằng Cử nhân văn học và có kiến ​​thức sâu rộng về viết về nhiều chủ đề bao gồm du lịch, nghệ thuật và văn hóa. Cô cũng tình nguyện làm biên tập viên cho tổ chức bảo vệ quyền động vật, nơi cô giúp nâng cao nhận thức về các vấn đề phúc lợi động vật. Liên hệ với cô ấy trên [email được bảo vệ].

Xem thêm bài viết
Agne Cimerman
Agne Cimerman

Agne là một nhà báo đưa tin về các xu hướng và sự phát triển mới nhất trong metaverse, AI và Web3 các ngành công nghiệp cho Metaverse Post. Niềm đam mê kể chuyện đã khiến cô thực hiện nhiều cuộc phỏng vấn với các chuyên gia trong các lĩnh vực này, luôn tìm cách khám phá những câu chuyện thú vị và hấp dẫn. Agne có bằng Cử nhân văn học và có kiến ​​thức sâu rộng về viết về nhiều chủ đề bao gồm du lịch, nghệ thuật và văn hóa. Cô cũng tình nguyện làm biên tập viên cho tổ chức bảo vệ quyền động vật, nơi cô giúp nâng cao nhận thức về các vấn đề phúc lợi động vật. Liên hệ với cô ấy trên [email được bảo vệ].

Sự thèm muốn của các tổ chức ngày càng tăng đối với các quỹ ETF Bitcoin trong bối cảnh biến động

Tiết lộ thông qua hồ sơ 13F cho thấy các nhà đầu tư tổ chức đáng chú ý đang đầu tư vào Bitcoin ETF, nhấn mạnh sự chấp nhận ngày càng tăng đối với ...

Biết thêm

Ngày tuyên án đến: Số phận của CZ đang cân bằng khi Tòa án Hoa Kỳ xem xét lời bào chữa của DOJ

Changpeng Zhao sẽ phải đối mặt với bản tuyên án tại tòa án Hoa Kỳ ở Seattle vào ngày hôm nay.

Biết thêm
Tham gia cộng đồng công nghệ đổi mới của chúng tôi
Tìm hiểu thêm
Tìm hiểu thêm
Injective hợp tác với AltLayer để mang lại tính bảo mật cho việc thiết lập lại inEVM
Kinh doanh Báo cáo tin tức Công nghệ
Injective hợp tác với AltLayer để mang lại tính bảo mật cho việc thiết lập lại inEVM
3 Tháng Năm, 2024
Masa hợp tác với Teller để giới thiệu nhóm cho vay MASA, cho phép vay USDC trên cơ sở
thị trường Báo cáo tin tức Công nghệ
Masa hợp tác với Teller để giới thiệu nhóm cho vay MASA, cho phép vay USDC trên cơ sở
3 Tháng Năm, 2024
Velodrome ra mắt phiên bản Superchain Beta trong những tuần tới và mở rộng trên các chuỗi khối lớp 2 của OP
thị trường Báo cáo tin tức Công nghệ
Velodrome ra mắt phiên bản Superchain Beta trong những tuần tới và mở rộng trên các chuỗi khối lớp 2 của OP
3 Tháng Năm, 2024
CARV công bố hợp tác với Aethir để phân cấp lớp dữ liệu và phân phối phần thưởng
Kinh doanh Báo cáo tin tức Công nghệ
CARV công bố hợp tác với Aethir để phân cấp lớp dữ liệu và phân phối phần thưởng
3 Tháng Năm, 2024
CRYPTOMERIA LABS PTE. CÔNG TY TNHH