συνέντευξη Τέχνη SMW
01 Μαΐου 2023

DeepFloyd and Beyond: Exploring the Latest in AI Art με τον Διευθύνοντα Σύμβουλο του NightCafe Studio

Εν συντομία

Κατά τη διάρκεια μιας αποκλειστικής συνέντευξης, ο Διευθύνων Σύμβουλος του NightCafe Studio παρείχε πολύτιμες γνώσεις και προοπτικές για την τέχνη που δημιουργείται από την τεχνητή νοημοσύνη.

Ο Angus Russell παρουσίασε το DeepFloyd – έναν νέο αλγόριθμο που αναπτύχθηκε από τον συνεργάτη του NightCafe Studio, Stability AI, που λειτουργεί σε χώρο pixel και χρησιμοποιεί ένα Large Language Model (LLM) για τη δημιουργία εικόνων.

NightCafe Studio είναι ένα AI Art Generator που επιτρέπει στους χρήστες να δημιουργούν εκπληκτική και φουτουριστική τέχνη σε δευτερόλεπτα με τη βοήθεια της τεχνητής νοημοσύνης. Ιδρύθηκε από Άνγκους Ράσελ Πριν από τέσσερα χρόνια, το NightCafe Studio γεννήθηκε από την απογοήτευση του ίδιου του Angus που δεν μπορούσε να βρει έργα τέχνης που του είχαν απήχηση. Με γνώμονα τη γνώση ότι υπήρχαν αλγόριθμοι μεταφοράς στυλ, αναζήτησε έναν ιστότοπο που θα του επέτρεπε να δημιουργήσει εξατομικευμένη τέχνη μέσω της μεταφοράς στυλ και να την εκτυπώσει. 

Προς απογοήτευσή του, δεν μπορούσε να βρει μια τέτοια πλατφόρμα. Ωστόσο, αυτή η οπισθοδρόμηση του πυροδότησε μια καινοτόμο ιδέα. Αποφάσισε να δημιουργήσει μια εφαρμογή μεταφοράς νευρικού στυλ για τη δημιουργία τέχνης που δημιουργείται από AI και την ανέβασε στο Reddit.

Το NightCafe Studio ξεκίνησε ως μια πλατφόρμα δημιουργίας κειμένου σε εικόνα, καθιστώντας το το πρώτο στο είδος του. Αυτό το μοναδικό χαρακτηριστικό επέφερε σημαντική αύξηση τόσο στα έσοδα όσο και στη βάση χρηστών. Έκτοτε, η πλατφόρμα παραμένει στην πρώτη γραμμή της γενετικής τεχνητής νοημοσύνης, προσελκύοντας μια μεγάλη κοινότητα ενθουσιωδών που χαίρονται να χρησιμοποιούν τη γεννήτρια για να δημιουργήσουν εκπληκτικά έργα τέχνης. Σήμερα, το NightCafe Studio θεωρείται ευρέως ως μία από τις πιο δημοφιλείς και καινοτόμες συσκευές δημιουργίας εικόνων AI που είναι διαθέσιμες.

Κατά τη διάρκεια μιας συνέντευξης με τον Angus Russell, εξερευνήσαμε τα οφέλη και τους περιορισμούς της τέχνης που δημιουργείται από AI, την αυξανόμενη χρήση της τεχνητής νοημοσύνης στον κόσμο της τέχνης και τον πιο πρόσφατο αλγόριθμο δημιουργίας εικόνων AI, DeepFloyd.

νυχτερινό καφέ στούντιο
Όπερα του Σίδνεϊ: Μία από τις πρώτες εικόνες του Angus που δημιουργήθηκαν από AI

Η Εμφάνιση της Τέχνης που δημιουργήθηκε από την AI

Την τελευταία δεκαετία, η βιομηχανία της τέχνης γνώρισε μια σταδιακή διείσδυση της τεχνητής νοημοσύνης και της μηχανικής μάθησης (ML). Αυτές οι τεχνολογίες αιχμής έχουν εισαγάγει μερικές συναρπαστικές νέες έννοιες, όπως Deepfakes και DALL-E, που έχουν κερδίσει σημαντική προσοχή σε όλο τον κόσμο. Σήμερα, η βιομηχανία της τέχνης δεν έχει την πολυτέλεια να αγνοήσει τον τεράστιο αντίκτυπο της τεχνητής νοημοσύνης, η οποία τώρα πυροδοτεί μια επανάσταση στον τομέα που είχε καθυστερήσει πολύ.

Ο Angus συζήτησε πώς το NightCafe Studio γνώρισε αιχμές στην ανάπτυξη κατά την κυκλοφορία του Stable Diffusion, ένα μοντέλο κειμένου σε εικόνα με το οποίο η εταιρεία του κυκλοφόρησε την ημέρα κυκλοφορίας. Έκτοτε, το εμπόδιο στην είσοδο για τη δημιουργία παρόμοιων εργαλείων έχει μειωθεί λόγω της ανοιχτής πηγής αλγορίθμων και δειγμάτων κωδικών.

Ο ιδρυτής του NightCafe Studio πιστεύει ότι η δημιουργία τέχνης AI δεν αφορά μόνο το τελικό προϊόν αλλά και τη διαδικασία δημιουργίας του. Το βλέπει ως μια μορφή θεραπείας και χαλάρωσης, που επιτρέπει στους ανθρώπους να εκφραστούν με μοναδικούς και δημιουργικούς τρόπους. Πολλοί άνθρωποι που δεν θεωρούσαν ποτέ τους εαυτούς τους δημιουργικούς, ανακάλυψαν τις καλλιτεχνικές τους ικανότητες μέσω εικόνων που δημιουργήθηκαν από την τεχνητή νοημοσύνη. Αυτή η φιλοσοφία αντικατοπτρίζεται στη διεπαφή χρήστη της πλατφόρμας, η οποία έχει σχεδιαστεί για να είναι φιλική προς τον χρήστη και προσβάσιμη σε καλλιτέχνες όλων των επιπέδων δεξιοτήτων. 

Μόνο στο NightCafe Studio υπάρχουν ήδη από δύο έως τρία εκατομμύρια χρήστες το μήνα, παράγοντας περίπου ένα εκατομμύριο εικόνες την ημέρα. Stability AI, μια εταιρεία τεχνητής νοημοσύνης ανοιχτού κώδικα, δήλωσε ότι είχαν πάνω από 10 εκατομμύρια χρήστες που ήταν ενεργοί καθημερινά λίγο μετά την κυκλοφορία του Stable Diffusion.

Συνιστάται: 10+ Καλύτερες Γεννήτριες Τέχνης AI του 2023: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: Ο νέος αλγόριθμος δημιουργίας εικόνας AI που αλλάζει το παιχνίδι

Το NightCafe Studio εφαρμόζει έναν νέο αλγόριθμο από Stability AI που ονομάζεται DeepFloyd, το οποίο υπόσχεται να φέρει επανάσταση στον τρόπο δημιουργίας εικόνων με τεχνητή νοημοσύνη.

Το DeepFloyd, το οποίο αυτή τη στιγμή βρίσκεται σε έκδοση beta, είναι ένα νέο μοντέλο κειμένου σε εικόνα που μπορεί να δημιουργήσει εντυπωσιακές εικόνες από περιγραφές φυσικής γλώσσας. Βασίζεται σε μια νέα αρχιτεκτονική που συνδυάζει ένα μεγάλο μοντέλο γλώσσας με τρία μοντέλα διάχυσης. Είναι εμπνευσμένο από το Imagen, ένα παρόμοιο μοντέλο που αναπτύχθηκε από την Google Research αλλά δεν κυκλοφόρησε ποτέ στο κοινό.

Το μοντέλο μπορεί να δημιουργήσει σαφείς και συνεκτικές εικόνες με κείμενο και αντικείμενα σε διάφορες χωρικές σχέσεις, κάτι που αποτελεί πρόκληση για τα περισσότερα άλλα μοντέλα κειμένου σε εικόνα. Αυτό επιτυγχάνεται με τη χρήση του μοντέλου μεγάλης γλώσσας T5-XXL-1.1 ως κωδικοποιητή κειμένου και ενός σημαντικού αριθμού επιπέδων διασταυρούμενης προσοχής κειμένου-εικόνας που παρέχουν καλύτερη προτροπή και συμμαχία εικόνας. 

Το DeepFloyd μπορεί επίσης να δημιουργήσει εικόνες με μη τυπική αναλογία διαστάσεων και έχει υψηλό βαθμό φωτορεαλισμού. Επιπλέον, επιτρέπει μεταφράσεις εικόνας σε εικόνα μηδενικής λήψης, πράγμα που σημαίνει ότι το στυλ, τα μοτίβα και οι λεπτομέρειες μιας εικόνας εξόδου μπορούν να τροποποιηθούν διατηρώντας τη βασική μορφή της εικόνας πηγής χωρίς την ανάγκη λεπτομέρειας.

Ο νέος αλγόριθμος λειτουργεί με διαφορετικό τρόπο από αυτόν Stable Diffusion. Το DeepFloyd χρησιμοποιεί χώρο pixel και ένα Large Language Model (LLM), ενώ Stable Diffusion χρησιμοποιεί λανθάνον χώρο και ένα σταθερό μοντέλο CLIP. Το DeepFloyd χρησιμοποιεί επίσης πολλαπλές διαδικασίες διάχυσης για τη δημιουργία εικόνων, ενώ Stable Diffusion χρησιμοποιεί μόνο ένα.

DeepFloyd είναι το όνομα της ερευνητικής ομάδας που κατασκεύασε τον αλγόριθμο και ο ίδιος ο αλγόριθμος ονομάζεται IF. Η ερευνητική ομάδα περιλαμβάνει πολλά από τα ίδια άτομα που δημιούργησαν GPT-3ο προκάτοχος του, GPT-2, και ένα προηγούμενο μοντέλο γλώσσας αιχμής που ονομαζόταν RuGPT.

Κάποιες εικασίες υποδηλώνουν ότι το όνομα IF μπορεί να είναι εμπνευσμένο από ένα ομώνυμο τραγούδι των Pink Floyd, όπως υπονοείται από το βιογραφικό σημείωμα κοινωνικής δικτύωσης της ερευνητικής ομάδας αλγορίθμων.

Διαβάστε περισσότερα για τον αλγόριθμο εδώ.

στούντιο νυχτερινής καφετέριας deepfloyd
Εικόνες που δημιουργούνται με το DeepFloyd IF. Πηγή: Stability AI

Σύγκριση περιορισμών τέχνης AI και ψηφιακής τέχνης

Ένας από τους σημαντικότερους περιορισμούς της τεχνητής νοημοσύνης είναι το κείμενο, αν και το DeepFloyd αντιμετωπίζει αυτό το ζήτημα. Ένας άλλος περιορισμός είναι η δυσκολία λήψης μιας εικόνας ακριβώς όπως την έχετε οραματιστεί, ειδικά χωρίς την προτροπή των ειδικών. Η τεχνητή νοημοσύνη δεν έχει επίσης την ικανότητα κατανόησης και ερμηνείας πολιτιστικά και κοινωνικά πλαίσια που διαμορφώνουν την ανθρώπινη τέχνη. Επομένως, η τέχνη που δημιουργείται από την τεχνητή νοημοσύνη μπορεί μερικές φορές να παράγει έργα που φαίνονται παράταιρα ή πολιτιστικά αναίσθητα.

Ωστόσο, οι εικόνες που δημιουργούνται από την τεχνητή νοημοσύνη μπορούν ακόμα να είναι όμορφες και μερικές φορές ακόμη καλύτερες από την αρχική ιδέα, αρκεί ο χρήστης να είναι ανοιχτός στην έκπληξη, είπε ο Angus. Επιπλέον, υπάρχουν τρόποι για να τροποποιήσετε το δημιουργήθηκαν εικόνες χρησιμοποιώντας αλγόριθμους AI ή Photoshop. Ενώ η λήψη μιας ακριβούς εικόνας είναι επί του παρόντος ένας τομέας ενεργού έρευνας, σημειώνεται σημαντική πρόοδος. Μπορεί σύντομα να είναι δυνατό να έχετε τον πλήρη έλεγχο σε κάθε πτυχή μιας εικόνας. 

Η τεχνητή νοημοσύνη βασίζεται στις εικόνες και την τέχνη που υπάρχουν στον Ιστό ως έμπνευση, αλλά μόνο σε εκείνες στις οποίες εκπαιδεύτηκε. Διαφορετικοί αλγόριθμοι, όπως π.χ Midjourney, DALL-E, και Stable Diffusion, εκπαιδεύονται σε διαφορετικά σύνολα δεδομένων, πράγμα που σημαίνει ότι μπορεί να έχουν καλύτερη απόδοση σε συγκεκριμένους τύπους εικόνων. 

Πρόσφατα, οι ερευνητές διερεύνησαν τον αντίκτυπο της αφαίρεσης εικόνων χαμηλής ποιότητας από σύνολα δεδομένων εκπαίδευσης για τη βελτίωση των αποτελεσμάτων AI. Με το φιλτράρισμα αυτών των εικόνων χαμηλής ποιότητας, το προκύπτον σύνολο δεδομένων μπορεί να γίνει μικρότερο αλλά υψηλότερης ποιότητας, οδηγώντας σε καλύτερα αποτελέσματα χωρίς να αυξηθεί το μέγεθος των μοντέλων AI ή να απαιτείται ακριβότερο υλικό. Ο Angus μοιράστηκε ότι αυτή η προσέγγιση αντιπροσωπεύει έναν πολλά υποσχόμενο τρόπο βελτίωσης της ποιότητας των εικόνων που δημιουργούνται από την τεχνητή νοημοσύνη χωρίς να βασιζόμαστε σε μεγαλύτερα και πιο εντατικά μοντέλα πόρων.

Ένα θέμα με την τεχνητή νοημοσύνη στην τέχνη είναι ότι μπορεί να υποτιμήσει τη δουλειά των ανθρώπων καλλιτεχνών, οι οποίοι αφιερώνουν πολύ χρόνο στη δημιουργία τέχνης, ενώ η τεχνητή νοημοσύνη είναι σε θέση να δημιουργήσει τέχνη μέσα σε λίγα δευτερόλεπτα. Ωστόσο, υπάρχει μια ορισμένη άυλη ποιότητα στην ανθρώπινη τέχνη που μπορεί να είναι δύσκολο για την τεχνητή νοημοσύνη να αναπαραχθεί, όπως το συναισθηματικό βάθος και η πολυπλοκότητα που υπάρχουν συχνά στα έργα που δημιουργούνται από τον άνθρωπο. Το NightCafe Studio πιστεύει ότι η τεχνητή νοημοσύνη αφορά λιγότερο τη δημιουργία τέχνης για εμπορικούς σκοπούς και περισσότερο την απόλαυση της ίδιας της δημιουργικής διαδικασίας.

«Πάντα θα υπάρχει αξία στην ανθρώπινη τέχνη γιατί αντιπροσωπεύει την προσπάθεια και την ικανότητα του καλλιτέχνη, ενώ η τέχνη που δημιουργείται από την τεχνητή νοημοσύνη δεν έχει την ίδια εγγενή αξία».

Ο Άγους είπε.

Ένα ηθικό ζήτημα που αφορά την τεχνητή νοημοσύνη στην τέχνη είναι η χρήση δημόσιας εικόνας για την εκπαίδευση αλγορίθμων τεχνητής νοημοσύνης που μπορεί να μην ανήκουν στην εταιρεία που εκπαιδεύει την τεχνητή νοημοσύνη. Αν και επί του παρόντος δεν παραβιάζονται νόμοι, εγείρει ερωτήματα σχετικά με τη συναίνεση και το απόρρητο. Οι εταιρείες ανοιχτού κώδικα όπως OpenAI και η DALL-E εργάζονται για να κάνουν τη διαδικασία πιο ηθική, αλλά παραμένει ένα ανοιχτό ερώτημα. Μπορεί να υπάρξουν μελλοντικοί κανονισμοί σχετικά με τη χρήση εικόνων για την εκπαίδευση της τεχνητής νοημοσύνης στην τέχνη.

Παρά αυτές τις ανησυχίες, ο Angus πιστεύει ότι η διαδικασία της τεχνητής νοημοσύνης στην τέχνη δεν διαφέρει θεμελιωδώς από τους ανθρώπινους καλλιτέχνες που αντλούν έμπνευση από τη δουλειά άλλων καλλιτεχνών. Η τεχνητή νοημοσύνη ξέρει πώς μοιάζουν τα πράγματα και θυμάται κομμάτια για τις εικόνες, όπως ακριβώς κάνουν οι άνθρωποι. Απλώς είναι καλύτερο να τα αναδημιουργείς από την αρχή.

Διαβάστε περισσότερα:

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Η Agne είναι μια δημοσιογράφος που καλύπτει τις τελευταίες τάσεις και εξελίξεις στο metaverse, AI και Web3 βιομηχανίες για την Metaverse Post. Το πάθος της για την αφήγηση την οδήγησε να πραγματοποιήσει πολυάριθμες συνεντεύξεις με ειδικούς σε αυτούς τους τομείς, επιδιώκοντας πάντα να αποκαλύψει συναρπαστικές και συναρπαστικές ιστορίες. Η Agne είναι κάτοχος πτυχίου στη λογοτεχνία και έχει εκτεταμένο υπόβαθρο γραφής για ένα ευρύ φάσμα θεμάτων, όπως ταξίδια, τέχνη και πολιτισμός. Έχει επίσης εργαστεί εθελοντικά ως συντάκτρια για την οργάνωση για τα δικαιώματα των ζώων, όπου βοήθησε στην ευαισθητοποίηση σχετικά με θέματα καλής διαβίωσης των ζώων. Επικοινωνήστε μαζί της [προστασία μέσω email].

Περισσότερα άρθρα
Agne Cimerman
Agne Cimerman

Η Agne είναι μια δημοσιογράφος που καλύπτει τις τελευταίες τάσεις και εξελίξεις στο metaverse, AI και Web3 βιομηχανίες για την Metaverse Post. Το πάθος της για την αφήγηση την οδήγησε να πραγματοποιήσει πολυάριθμες συνεντεύξεις με ειδικούς σε αυτούς τους τομείς, επιδιώκοντας πάντα να αποκαλύψει συναρπαστικές και συναρπαστικές ιστορίες. Η Agne είναι κάτοχος πτυχίου στη λογοτεχνία και έχει εκτεταμένο υπόβαθρο γραφής για ένα ευρύ φάσμα θεμάτων, όπως ταξίδια, τέχνη και πολιτισμός. Έχει επίσης εργαστεί εθελοντικά ως συντάκτρια για την οργάνωση για τα δικαιώματα των ζώων, όπου βοήθησε στην ευαισθητοποίηση σχετικά με θέματα καλής διαβίωσης των ζώων. Επικοινωνήστε μαζί της [προστασία μέσω email].

Hot Stories
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταία νέα

Η θεσμική όρεξη αυξάνεται προς τα ETF του Bitcoin εν μέσω αστάθειας

Οι αποκαλύψεις μέσω των καταθέσεων 13F αποκαλύπτουν αξιόλογους θεσμικούς επενδυτές που ασχολούνται με τα Bitcoin ETF, υπογραμμίζοντας την αυξανόμενη αποδοχή του ...

Μάθετε περισσότερα

Έφτασε η ημέρα της ποινής: Η μοίρα της CZ βρίσκεται σε ισορροπία καθώς το δικαστήριο των ΗΠΑ εξετάζει την ένσταση του DOJ

Ο Changpeng Zhao είναι έτοιμος να αντιμετωπίσει την καταδίκη σε αμερικανικό δικαστήριο στο Σιάτλ σήμερα.

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Δείτε Περισσότερα
Διάβασε περισσότερα
Το Injective ενώνει τις δυνάμεις του με το AltLayer για να επαναφέρει την ασφάλεια στο inEVM
Business Αναφορά ειδήσεων Τεχνολογία
Το Injective ενώνει τις δυνάμεις του με το AltLayer για να επαναφέρει την ασφάλεια στο inEVM
3 Μαΐου 2024
Η Masa συνεργάζεται με το Teller για να εισαγάγει το MASA Lending Pool, ενεργοποιεί τον βασικό δανεισμό USDC
αγορές Αναφορά ειδήσεων Τεχνολογία
Η Masa συνεργάζεται με το Teller για να εισαγάγει το MASA Lending Pool, ενεργοποιεί τον βασικό δανεισμό USDC
3 Μαΐου 2024
Η Velodrome κυκλοφορεί την έκδοση Superchain Beta τις επόμενες εβδομάδες και επεκτείνεται σε όλες τις OP Stack Layer 2 Blockchains
αγορές Αναφορά ειδήσεων Τεχνολογία
Η Velodrome κυκλοφορεί την έκδοση Superchain Beta τις επόμενες εβδομάδες και επεκτείνεται σε όλες τις OP Stack Layer 2 Blockchains
3 Μαΐου 2024
Η CARV ανακοινώνει συνεργασία με την Aethir για την αποκέντρωση του επιπέδου δεδομένων της και τη διανομή ανταμοιβών
Business Αναφορά ειδήσεων Τεχνολογία
Η CARV ανακοινώνει συνεργασία με την Aethir για την αποκέντρωση του επιπέδου δεδομένων της και τη διανομή ανταμοιβών
3 Μαΐου 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.