Αναφορά ειδήσεων Τεχνολογία
Μαρτίου 15, 2023

GPT-4 Μπορεί να χειριστεί τα αιτήματά σας για εικόνες, έγγραφα, διαγράμματα και στιγμιότυπα οθόνης

Εν συντομία

GPT-4 μπορεί να χειριστεί αιτήματα για εικόνες, έγγραφα, διαγράμματα και στιγμιότυπα οθόνης. Είναι μια βελτίωση GPT-3, το οποίο χειριζόταν μόνο κείμενο.

GPT-4 έχει ανώτερη απόδοση σε διάφορες εξετάσεις και τεστ και μπορεί να έχει πρόσβαση σε πρόσθετες πληροφορίες και λεπτομέρειες μέσω εικόνων που ενδέχεται να μην είναι διαθέσιμες σε γραπτή μορφή.

gpt-4 εικόνες εγγράφων στιγμιότυπα οθόνης

OpenAIτο τελευταίο ορόσημο της, το νέο μοντέλο GPT-4, μπορεί να δεχτεί αιτήματα που περιλαμβάνουν εικόνες, έγγραφα με κείμενο, διαγράμματα ή στιγμιότυπα οθόνης ως είσοδο. Αυτό αντιπροσωπεύει μια σημαντική βελτίωση σε σχέση με την προηγούμενη έκδοση, GPT-3, το οποίο μπορούσε να κατανοήσει και να παράγει μόνο κείμενο. Με αυτό το νέο χαρακτηριστικό, GPT-4 παράγει εξόδους κειμένου δεδομένες εισόδους που αποτελούνται από διάσπαρτα κείμενο και εικόνες.

«Σε μια σειρά τομέων—συμπεριλαμβανομένων εγγράφων με κείμενο και φωτογραφίες, διαγράμματα ή στιγμιότυπα οθόνης—GPT-4 παρουσιάζει παρόμοιες δυνατότητες με τις εισαγωγές μόνο κειμένου.»

OpenAI Έγραψε.

ChatGPT-4 έχει μεγαλύτερο μέγεθος από τους προκατόχους του, υποδεικνύοντας ότι έχει εκπαιδευτεί σε μεγαλύτερο όγκο δεδομένων και περιέχει περισσότερα βάρη στο αρχείο μοντέλου του, με αποτέλεσμα υψηλότερο κόστος για τη λειτουργία του. Η πιο πρόσφατη γλώσσα AI μπορεί να δημιουργήσει κείμενο που μοιάζει με άνθρωπο χρησιμοποιώντας βαθιά μάθηση και να είναι προεκπαιδευμένο σε ένα μεγάλο σύνολο δεδομένων.

GPT-4 έχει επέδειξε ανώτερη απόδοση σε σχέση με άλλες γλώσσες AI σε μια ποικιλία εξετάσεων και δοκιμών λόγω εν μέρει της ικανότητάς του να έχει πρόσβαση σε πρόσθετες πληροφορίες και λεπτομέρειες μέσω εικόνων που ενδέχεται να μην είναι διαθέσιμες σε γραπτή μορφή.

Το νέο GPT-4 Το μοντέλο μπορεί να σας πει τι ακριβώς απεικονίζεται στην εικόνα, να το αναλύσει και ακόμη και να εξηγήσει το νόημά του. Στο demo, GPT-4 εξήγησε το οπτικό αστείο όπου ένα καλώδιο VGA είναι συνδεδεμένο στο iPhone. Θα μπορούσε επίσης να εξηγήσει τι είναι ασυνήθιστο σε μια εικόνα που παρουσιάζει «ακραίο σιδέρωμα», την οποία μπορείτε να δείτε παρακάτω.

gpt-4 εικόνες
πηγή: OpenAI

Ωστόσο, υπάρχουν και πιο χρήσιμες συνέπειες GPT-4η νέα γνώση του. Στην παρουσίαση, δείχθηκε ότι το PGT-4 μπορούσε να πει τι θα μπορούσε να μαγειρευτεί από τα συστατικά που φαίνονται στην εικόνα. Αυτό σημαίνει ότι το μοντέλο μπορεί να σας βοηθήσει να μαγειρέψετε εάν έχετε προϊόντα διατροφής και δεν έχετε ιδέα τι να κάνετε με αυτά. Τραβήξτε ένα στιγμιότυπο από το φαγητό που έχετε και συνομιλήστε-GPT μπορεί να σας πει τι μπορείτε να ετοιμάσετε από τα υλικά που έχετε στο σπίτι.

Αυτή η ικανότητα κατανόησης και ερμηνείας οπτικών πληροφοριών κάνει GPT-4 ένα ισχυρό εργαλείο για εργασίες όπως η δημιουργία λεζάντας εικόνων, η οπτική απάντηση σε ερωτήσεις, ακόμη και η δημιουργία περιεχομένου. Με την ενσωμάτωση τόσο του κειμένου όσο και της οπτικής κατανόησης, GPT-4 έχει τη δυνατότητα να φέρει επανάσταση σε διάφορους κλάδους, όπως η διαφήμιση, ο σχεδιασμός και το ηλεκτρονικό εμπόριο, και να βοηθήσει τους ανθρώπους να κάνουν τις βαρετές, εγκόσμιες εργασίες για αυτούς.

η προηγμένη γλωσσικό μοντέλο επίσης «καταλαβαίνει» στιγμιότυπα οθόνης και έγγραφα με κείμενο, πίνακες, διαγράμματα ή άλλες οπτικές αναπαραστάσεις. Για παράδειγμα, εάν ανεβάσετε μια ερευνητική εργασία τριών σελίδων και χρειάζεστε περίληψη και επεξήγηση, GPT-4 είναι σε θέση να το κάνει. 

Ο παρουσιαστής του Bloomberg, Jon Erlichman, έδειξε πώς μπόρεσε να μεταμορφώσει ένα σχέδιο με το χέρι σε έναν λειτουργικό ιστότοπο.

Η νέα τεχνολογία μπορεί επίσης να χρησιμοποιηθεί ως βοήθημα κινητικότητας καθώς θα μπορούσε να χρησιμοποιηθεί για να περιγράψει το περιβάλλον για άτομα με προβλήματα όρασης. Για το σκοπό αυτό, το Open AI έχει ήδη συνεργαστεί με μια εφαρμογή που ονομάζεται Να είναι τα μάτια μου που έχει σχεδιαστεί για να προσφέρει στους τυφλούς μια χείρα βοηθείας όταν χρειάζονται να ρίξουν μια ματιά σε κάτι, για παράδειγμα, όταν ψωνίζουν. Η εφαρμογή επιτρέπει σε «εθελόντες και επαγγελματίες με όραση να δανείσουν τα μάτια τους για να λύσουν εργασίες μεγάλες και μικρές για να βοηθήσουν τους τυφλούς και τους ανθρώπους με χαμηλή όραση να ζήσουν πιο ανεξάρτητη ζωή». Τώρα, προσφέρει επίσης ένα εικονικό εργαλείο εθελοντισμού που υποστηρίζεται από OpenAI'S GPT-4.

Αν και OpenAI'S GPT-4 επί του παρόντος προσφέρει τη δυνατότητα επεξεργασίας κειμένου και εικόνων ως εισόδων, το μοντέλο δεν είναι ακόμη εξοπλισμένο για να χειρίζεται εισόδους ήχου και βίντεο. Ωστόσο, υπάρχουν ενδείξεις ότι αυτοί οι τρόποι μπορεί να συμπεριληφθούν στην επόμενη επανάληψη της τεχνολογίας.

Διαβάστε περισσότερα:

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Η Agne είναι μια δημοσιογράφος που καλύπτει τις τελευταίες τάσεις και εξελίξεις στο metaverse, AI και Web3 βιομηχανίες για την Metaverse Post. Το πάθος της για την αφήγηση την οδήγησε να πραγματοποιήσει πολυάριθμες συνεντεύξεις με ειδικούς σε αυτούς τους τομείς, επιδιώκοντας πάντα να αποκαλύψει συναρπαστικές και συναρπαστικές ιστορίες. Η Agne είναι κάτοχος πτυχίου στη λογοτεχνία και έχει εκτεταμένο υπόβαθρο γραφής για ένα ευρύ φάσμα θεμάτων, όπως ταξίδια, τέχνη και πολιτισμός. Έχει επίσης εργαστεί εθελοντικά ως συντάκτρια για την οργάνωση για τα δικαιώματα των ζώων, όπου βοήθησε στην ευαισθητοποίηση σχετικά με θέματα καλής διαβίωσης των ζώων. Επικοινωνήστε μαζί της [προστασία μέσω email].

Περισσότερα άρθρα
Agne Cimerman
Agne Cimerman

Η Agne είναι μια δημοσιογράφος που καλύπτει τις τελευταίες τάσεις και εξελίξεις στο metaverse, AI και Web3 βιομηχανίες για την Metaverse Post. Το πάθος της για την αφήγηση την οδήγησε να πραγματοποιήσει πολυάριθμες συνεντεύξεις με ειδικούς σε αυτούς τους τομείς, επιδιώκοντας πάντα να αποκαλύψει συναρπαστικές και συναρπαστικές ιστορίες. Η Agne είναι κάτοχος πτυχίου στη λογοτεχνία και έχει εκτεταμένο υπόβαθρο γραφής για ένα ευρύ φάσμα θεμάτων, όπως ταξίδια, τέχνη και πολιτισμός. Έχει επίσης εργαστεί εθελοντικά ως συντάκτρια για την οργάνωση για τα δικαιώματα των ζώων, όπου βοήθησε στην ευαισθητοποίηση σχετικά με θέματα καλής διαβίωσης των ζώων. Επικοινωνήστε μαζί της [προστασία μέσω email].

Hot Stories
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταία νέα

Έφτασε η ημέρα της ποινής: Η μοίρα της CZ βρίσκεται σε ισορροπία καθώς το δικαστήριο των ΗΠΑ εξετάζει την ένσταση του DOJ

Ο Changpeng Zhao είναι έτοιμος να αντιμετωπίσει την καταδίκη σε αμερικανικό δικαστήριο στο Σιάτλ σήμερα.

Μάθετε περισσότερα

Οι ιδρυτές του πορτοφολιού Samourai κατηγορούνται για διευκόλυνση $2 δις σε προσφορές Darknet

Η σύλληψη των ιδρυτών του Samourai Wallet αντιπροσωπεύει μια αξιοσημείωτη οπισθοδρόμηση για τον κλάδο, υπογραμμίζοντας την επίμονη ...

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Δείτε Περισσότερα
Διάβασε περισσότερα
Η Chainlink και η γρήγορη προσθήκη συνεργάζονται για την ανάπτυξη προσαρμογέα Blockchain που βασίζεται σε CCIP
Business Αναφορά ειδήσεων Τεχνολογία
Η Chainlink και η γρήγορη προσθήκη συνεργάζονται για την ανάπτυξη προσαρμογέα Blockchain που βασίζεται σε CCIP
1 Μαΐου 2024
Το BitSmiley λανσάρει το Alphanet V1, κάνει το ντεμπούτο του στο Bitlayer του δικτύου Bitcoin Layer 2
Αναφορά ειδήσεων Τεχνολογία
Το BitSmiley λανσάρει το Alphanet V1, κάνει το ντεμπούτο του στο Bitlayer του δικτύου Bitcoin Layer 2
1 Μαΐου 2024
Απρίλιος 2024 Ιστορικά χαμηλά σε εισβολές και απάτες, το CertiK αναφέρει μείωση 141% από τον Μάρτιο
αγορές Ασφάλεια Wiki Ιστορίες και κριτικές Τεχνολογία
Απρίλιος 2024 Ιστορικά χαμηλά σε εισβολές και απάτες, το CertiK αναφέρει μείωση 141% από τον Μάρτιο
1 Μαΐου 2024
Η τιμή του Bitcoin μειώνεται εν όψει της ανακοίνωσης της απόφασης για το επιτόκιο της Federal Reserve, οι αναλυτές προειδοποιούν για πιθανή μετατόπιση της αγοράς
αγορές Αναφορά ειδήσεων Τεχνολογία
Η τιμή του Bitcoin μειώνεται εν όψει της ανακοίνωσης της απόφασης για το επιτόκιο της Federal Reserve, οι αναλυτές προειδοποιούν για πιθανή μετατόπιση της αγοράς
1 Μαΐου 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.