Stability AI Κυκλοφορεί ένα νέο μοντέλο που ονομάζεται SDXL Beta
Εν συντομία
Stability AI κυκλοφόρησε ένα νέο μοντέλο που ονομάζεται SDXL Beta (Stable Diffusion XL Beta). Είναι ένα μεγαλύτερο μοντέλο με περισσότερες παραμέτρους και μερικές άγνωστες βελτιώσεις. Είναι διαθέσιμο στο DreamStudio, Stability AIείναι η επίσημη συσκευή δημιουργίας εικόνων και χρησιμοποιεί προηγμένους αλγόριθμους και τεχνικές βαθιάς εκμάθησης για να δημιουργήσει εντυπωσιακά γραφικά.
Stability AI αποκάλυψε μια προεπισκόπηση ενός νέου μοντέλου που ονομάζεται SDXL Beta, συντομογραφία του Stable Diffusion XL Beta. Μέχρι στιγμής, η εταιρεία δεν έχει μοιραστεί πολλές πληροφορίες για το μοντέλο, αλλά είναι διαθέσιμο για δοκιμή για όποιον θέλει να το κάνει. Τι είναι καινοτόμο για αυτό το μοντέλο SDXL stable diffusion? Ποια είναι τα πλεονεκτήματα και τα μειονεκτήματά του; Ας ερευνήσουμε.
Διαβάστε περισσότερα: Midjourney και Dall-E Artist Styles Dump με παραδείγματα: 130 διάσημες τεχνικές ζωγραφικής AI |
Τι ακριβώς είναι το μοντέλο SDXL;
Το μοντέλο SDXL είναι ένα νέο μοντέλο που είναι αυτή τη στιγμή που εκπαιδεύεται. Απέχει πολύ από το να έχει ολοκληρωθεί, και μέχρι να κυκλοφορήσει, πολλές λεπτομέρειες σχετικά μπορεί να αλλάξουν. για όλα όσα γνωρίζουμε, μπορεί να μην ονομάζεται καν μοντέλο SDXL. Το μόνο που γνωρίζουμε είναι ότι πρόκειται για ένα μεγαλύτερο μοντέλο με περισσότερες παραμέτρους και μερικές άγνωστες βελτιώσεις. Είναι μοντέλο v2, όχι μοντέλο v3 (ό,τι κι αν σημαίνει αυτό). Είναι πιθανό ότι οι βελτιώσεις στο μοντέλο v2 θα μπορούσαν να βελτιώσουν την απόδοση του συστήματος, αλλά χωρίς περαιτέρω πληροφορίες, είναι δύσκολο να προσδιοριστεί πόσο σημαντικές μπορεί να είναι αυτές οι βελτιώσεις. Επιπλέον, θα ήταν χρήσιμο να γνωρίζετε ποιες συγκεκριμένες παράμετροι έχουν προστεθεί ή προσαρμοστεί σε αυτήν την έκδοση.
Το μοντέλο SDXL είναι προς το παρόν διαθέσιμο στο DreamStudio, Stability AIεπίσημο πρόγραμμα δημιουργίας εικόνων. Επιλέξτε SDXL Beta από το μενού μοντέλου για να το ελέγξετε. Φαίνεται να χρησιμοποιεί προηγμένους αλγόριθμους και τεχνικές βαθιάς μάθησης για να δημιουργήσετε εντυπωσιακά γραφικά που είναι ιδανικά για ένα ευρύ φάσμα εφαρμογών.
Βελτιώσεις
Ευανάγνωστο κείμενο. Το SDXL είναι ικανό να δημιουργεί ευανάγνωστο κείμενο και είναι ίσως το πιο εντυπωσιακό χαρακτηριστικό του, καθώς δεν ήταν δυνατό στα υπάρχοντα μοντέλα v1 και v2.1. Το κείμενο που δημιουργείται από το SDXL δεν είναι πάντα ακριβές όπως μπορείτε να δείτε στο Stable Diffusion Κείμενο παρακάτω. Ωστόσο, είναι πολύ ανώτερο από το v2.1, πόσο μάλλον το μοντέλο v1. Αυτό συμβαίνει επειδή τα SDXL χρησιμοποιούν έναν πιο προηγμένο αλγόριθμο βαθιάς μάθησης που του επιτρέπει να κατανοεί και να δημιουργεί πιο σύνθετες δομές γλώσσας. Με περαιτέρω ανάπτυξη, έχει τη δυνατότητα να γίνει ακόμη πιο ακριβής και αξιόπιστος.
Ανθρώπινη ανατομία. Η ακριβής δημιουργία ανατομικά σωστών ανθρώπινων μορφών ήταν από καιρό μια πρόκληση stable diffusion. Η παρουσία πρόσθετων ή ελλειπόντων άκρων είναι συχνή. Το Inpainting χρησιμοποιείται συνήθως για τη διόρθωσή τους ή, πιο πρόσφατα, μπορείτε να χρησιμοποιήσετε τη λειτουργία Open Pose του ControlNet για να αντιγράψετε μια πόζα από μια εικόνα αναφοράς. Είμαστε στην ευχάριστη θέση να σημειώσουμε ότι εδώ έχει βελτιωθεί το μοντέλο SDXL Beta. Το μοντέλο SDXL Beta έχει δείξει σημαντική βελτίωση στην ακριβή αντιγραφή στάσεων από εικόνες αναφοράς. Αυτό μπορεί να είναι ένα πολύτιμο εργαλείο για διάφορες εφαρμογές όπως κινούμενα σχέδια και εικονική πραγματικότητα.
Στυλ πορτρέτου. Το SDXL Beta παράγει εξαιρετικά πορτρέτα που μοιάζουν με φωτογραφίες – είναι μια αναβάθμιση σε σύγκριση με την έκδοση 1.5. Ο βελτιωμένος αλγόριθμος στο SDXL Beta ενισχύει τις λεπτομέρειες και την ακρίβεια των χρωμάτων των πορτρέτων, με αποτέλεσμα μια πιο φυσική και ρεαλιστική εμφάνιση. Οι χρήστες μπορούν επίσης να προσαρμόσουν τα επίπεδα ευκρίνειας και κορεσμού για να επιτύχουν τα επιθυμητά αποτελέσματα.
Διχρωμία. Η λέξη-κλειδί duotone παράγει πάντα ασπρόμαυρες φωτογραφίες στο μοντέλο v1.5. Ωστόσο, τώρα, οι διτονικές εικόνες που παράγονται από την SDXL Beta διατίθενται σε ποικιλία χρωμάτων. Είναι σαφές ότι σε σύγκριση με τα μοντέλα v1, η δυνατότητα να ερμηνεύστε την προτροπή έχει βελτιωθεί, με αποτέλεσμα πιο ακριβείς και σχετικές απαντήσεις από τα μοντέλα v2, καθιστώντας τα ένα πιο αξιόπιστο εργαλείο για εργασίες επεξεργασίας φυσικής γλώσσας.
Καλλιτεχνικά στυλ. Έχουν γίνει κάποιες μικρές προσαρμογές, αλλά είναι δύσκολο να προσδιοριστεί εάν το νέο μοντέλο παρέχει καλύτερα αποτελέσματα, καθώς είναι απλά μοναδικά. Είναι πιθανό αυτές οι προσαρμογές να είναι θέμα προσωπικής προτίμησης ή υποκειμενικής γνώμης, καθιστώντας δύσκολη την α defiθετική κρίση για την ποιότητά τους. Ωστόσο, η μοναδικότητα των προσαρμογών μπορεί να είναι αξιοσημείωτη και αξίζει να διερευνηθεί περαιτέρω.
Συμπέρασμα
- Stable Diffusion μπορεί επιτέλους να παράγει κείμενο που έχει νόημα.
- Το SDXL παρέχει πιο ευχάριστες αισθητικά εικόνες από τα μοντέλα v2.1 και (σε μικρότερο βαθμό) τα μοντέλα v1.5.
- Το νέο μοντέλο παράγει εικόνες που είναι πιο ακριβείς.
- Η ανθρώπινη ανατομία έχει βελτιωθεί.
- Τα αρνητικά μηνύματα δεν είναι τόσο απαραίτητα όσο στην έκδοση 2.1.
- Μπορεί να δημιουργήσει ρεαλιστικά πορτρέτα.
- Ορισμένες παραξενιές στο μοντέλο θα διορθωθούν πριν από την κυκλοφορία.
Διαβάστε περισσότερα σχετικά άρθρα:
Αποποίηση ευθυνών
Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.
Σχετικά με το Συγγραφέας
Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου.
Περισσότερα άρθραΟ Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου.