Αναφορά ειδήσεων Τεχνολογία
Σεπτέμβριος 25, 2023

OpenAI'S ChatGPT Αποκαλύπτει σημαντική αναβάθμιση, προσθέτει φωνητική συνομιλία και συνομιλία με εικόνα

Εν συντομία

OpenAI θα λανσάρει νέες δυνατότητες φωνής και εικόνας ChatGPT τις επόμενες δύο εβδομάδες.

Αυτές οι λειτουργίες θα είναι διαθέσιμες μόνο σε χρήστες Plus και Enterprise.

OpenAI ανακοίνωσε σήμερα ότι θα κυκλοφορήσει νέες δυνατότητες φωνής και εικόνας ChatGPT. Τα νέα χαρακτηριστικά θα επιτρέψουν στους χρήστες να έχουν μια φωνητική συνομιλία ChatGPT ή συνομιλήστε με το chatbot μέσω εικόνων.

Η ανακοίνωση ακολουθεί τους ισχυρισμούς των χρηστών του Reddit που ισχυρίστηκαν ότι είχαν αποκτήσει πρόσβαση στο OpenAI's μοντέλα και στη συνέχεια μοιράστηκε αυτές τις πληροφορίες στην πλατφόρμα. Το Redditor FeltSteam περιέγραψε ένα μοντέλο τεχνητής νοημοσύνης με το όνομα εργασίας Arrakis, το οποίο φέρεται να επιτρέπει στους χρήστες να "εισάγουν οποιοδήποτε συνδυασμό κειμένου, ήχου και βίντεο".

«Η νέα δυνατότητα φωνής τροφοδοτείται από ένα νέο μοντέλο μετατροπής κειμένου σε ομιλία, ικανό να παράγει ήχο που μοιάζει με άνθρωπο από μόνο κείμενο και μερικά δευτερόλεπτα δείγματος ομιλίας», έγραψε η Open AI σε μια ανάρτηση. «Συνεργαστήκαμε με επαγγελματίες φωνητικούς ηθοποιούς για να δημιουργήσουμε κάθε μία από τις φωνές. Χρησιμοποιούμε επίσης το Whisper, το ανοιχτού κώδικα σύστημα αναγνώρισης ομιλίας μας, για να μεταγράψουμε τις προφορικές σας λέξεις σε κείμενο."

Με τις νέες δυνατότητες, οι χρήστες μπορούν να συμμετάσχουν σε μια συζήτηση πέρα ​​δώθε ChatGPT χρησιμοποιώντας τις φωνές τους. Μπορούν επίσης να συζητήσουν για εικόνες με το chatbot. Οι δυνατότητες θα κυκλοφορήσουν τις επόμενες δύο εβδομάδες στους χρήστες Plus και Enterprise.

Η δυνατότητα φωνής θα έρχεται σε iOS και Android ως επιλογή, ενώ η λειτουργία εικόνας θα είναι διαθέσιμη σε όλες τις πλατφόρμες.

Για να ξεκινήσουν να χρησιμοποιούν τη λειτουργία φωνής, οι χρήστες μπορούν να μεταβούν στις Ρυθμίσεις → Νέες λειτουργίες στην εφαρμογή για κινητά και να επιλέξουν "φωνητικές συνομιλίες". Στη συνέχεια, ο χρήστης θα πρέπει να πατήσει το κουμπί ακουστικών που βρίσκεται στην επάνω δεξιά γωνία της αρχικής οθόνης και να επιλέξει τη φωνή που προτιμά από μια επιλογή πέντε διαφορετικών φωνών.

Να συνομιλήσει με ChatGPT μέσω εικόνων, ο χρήστης μπορεί να πατήσει το κουμπί φωτογραφίας είτε για να τραβήξει μια εικόνα είτε για να επιλέξει μία. Εάν χρησιμοποιείτε iOS ή Android, πατήστε το κουμπί συν πριν συνεχίσετε. Επιπλέον, μπορούν να συμμετάσχουν σε συζητήσεις με πολλές εικόνες ή να τις χρησιμοποιήσουν για να καθοδηγήσουν το chatbot.

OpenAI λέει ότι η κατανόηση της εικόνας τροφοδοτείται από πολυτροπικές GPT-3.5 Και GPT-4. Αυτά τα μοντέλα αξιοποιούν τις γλωσσικές συλλογιστικές ικανότητες για την ανάλυση μιας ποικιλίας οπτικού περιεχομένου, που περιλαμβάνει φωτογραφίες, στιγμιότυπα οθόνης και έγγραφα που περιέχουν συνδυασμό κειμένου και εικόνων.

OpenAIσυνεργασία του με το Spotify

Spotify επίσης ανακοίνωσε σήμερα Η δυνατότητα φωνητικής μετάφρασης με AI. Η νέα δυνατότητα μπορεί να μεταφράσει podcast σε διαφορετικές γλώσσες, χρησιμοποιώντας την αρχική φωνή του podcaster.

Σύμφωνα με Η Verge, αυτή η δυνατότητα μετάφρασης βασίζεται σε OpenAIΤο εργαλείο μεταγραφής φωνής του Whisper, το οποίο είναι σε θέση να μεταγράφει την αγγλική ομιλία και να μεταφράζει διάφορες γλώσσες στα αγγλικά.

Ως μέρος του πιλοτικού προγράμματος, η εταιρεία συνεργάστηκε με τους podcasters Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons και Steven Bartlett για να δημιουργήσει φωνητικές μεταφράσεις με γνώμονα την τεχνητή νοημοσύνη σε γλώσσες όπως ισπανικά, γαλλικά και γερμανικά για συγκεκριμένα επεισόδια καταλόγου και επερχόμενα εκδόσεις.

«Πιστεύουμε ότι μια στοχαστική προσέγγιση στην τεχνητή νοημοσύνη μπορεί να βοηθήσει στη δημιουργία βαθύτερων συνδέσεων μεταξύ ακροατών και δημιουργών, ένα βασικό συστατικό της αποστολής του Spotify να ξεκλειδώσει τις δυνατότητες της ανθρώπινης δημιουργικότητας», δήλωσε ο Ziad Sultan, Αντιπρόεδρος Εξατομίκευσης στο Spotify.

Επεισόδια μεταφρασμένα με φωνή από πιλοτικούς δημιουργούς θα είναι διαθέσιμα σε όλο τον κόσμο σε χρήστες Premium και Free.

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Η Σίντι είναι δημοσιογράφος στο Metaverse Post, καλύπτοντας θέματα που σχετίζονται με web3, NFT, metaverse και AI, με έμφαση στις συνεντεύξεις με Web3 παίκτες του κλάδου. Έχει μιλήσει με πάνω από 30 στελέχη C-level και πολλά άλλα, μεταφέροντας τις πολύτιμες γνώσεις τους στους αναγνώστες. Με καταγωγή από τη Σιγκαπούρη, η Cindy εδρεύει τώρα στην Τιφλίδα της Γεωργίας. Είναι κάτοχος πτυχίου Bachelor στις Επικοινωνίες & Σπουδές Μέσων από το Πανεπιστήμιο της Νότιας Αυστραλίας και έχει μια δεκαετία εμπειρίας στη δημοσιογραφία και τη συγγραφή. Επικοινωνήστε μαζί της μέσω [προστασία μέσω email] με δημοσιεύσεις τύπου, ανακοινώσεις και ευκαιρίες συνεντεύξεων.

Περισσότερα άρθρα
Σίντι Ταν
Σίντι Ταν

Η Σίντι είναι δημοσιογράφος στο Metaverse Post, καλύπτοντας θέματα που σχετίζονται με web3, NFT, metaverse και AI, με έμφαση στις συνεντεύξεις με Web3 παίκτες του κλάδου. Έχει μιλήσει με πάνω από 30 στελέχη C-level και πολλά άλλα, μεταφέροντας τις πολύτιμες γνώσεις τους στους αναγνώστες. Με καταγωγή από τη Σιγκαπούρη, η Cindy εδρεύει τώρα στην Τιφλίδα της Γεωργίας. Είναι κάτοχος πτυχίου Bachelor στις Επικοινωνίες & Σπουδές Μέσων από το Πανεπιστήμιο της Νότιας Αυστραλίας και έχει μια δεκαετία εμπειρίας στη δημοσιογραφία και τη συγγραφή. Επικοινωνήστε μαζί της μέσω [προστασία μέσω email] με δημοσιεύσεις τύπου, ανακοινώσεις και ευκαιρίες συνεντεύξεων.

Hot Stories
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταια νεα

Από το Ripple στο The Big Green DAO: Πώς τα έργα κρυπτονομισμάτων συμβάλλουν στη φιλανθρωπία

Ας εξερευνήσουμε πρωτοβουλίες που αξιοποιούν τις δυνατότητες των ψηφιακών νομισμάτων για φιλανθρωπικούς σκοπούς.

Μάθετε περισσότερα

AlphaFold 3, Med-Gemini και άλλοι: Ο τρόπος που η τεχνητή νοημοσύνη μεταμορφώνει την υγειονομική περίθαλψη το 2024

Η τεχνητή νοημοσύνη εκδηλώνεται με διάφορους τρόπους στην υγειονομική περίθαλψη, από την αποκάλυψη νέων γενετικών συσχετισμών έως την ενδυνάμωση ρομποτικών χειρουργικών συστημάτων...

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Διαβάστε Περισσότερα
Διάβασε περισσότερα
Τα κορυφαία 10 δωρεάν εργαλεία AI για δημιουργία περιεχομένου, επεξεργασία βίντεο και πολλά άλλα
AI Wiki Σύνοψη Εκπαίδευση Lifestyle λογισμικό Τεχνολογία
Τα κορυφαία 10 δωρεάν εργαλεία AI για δημιουργία περιεχομένου, επεξεργασία βίντεο και πολλά άλλα
14 Μαΐου 2024
Η Επιτροπή Κεφαλαιαγοράς του Χονγκ Κονγκ προειδοποιεί για απάτες Deepfake που στοχεύουν τη βιομηχανία κρυπτογράφησης: Επιπτώσεις για την ασφάλεια των επενδυτών
Lifestyle Ασφάλεια Wiki λογισμικό Ιστορίες και κριτικές Τεχνολογία
Η Επιτροπή Κεφαλαιαγοράς του Χονγκ Κονγκ προειδοποιεί για απάτες Deepfake που στοχεύουν τη βιομηχανία κρυπτογράφησης: Επιπτώσεις για την ασφάλεια των επενδυτών
14 Μαΐου 2024
Η Ripple και η Evmos συνεργάζονται για την ανάπτυξη XRP Ledger EVM Sidechain με την τεχνολογία EvmOS
Business Αναφορά ειδήσεων Τεχνολογία
Η Ripple και η Evmos συνεργάζονται για την ανάπτυξη XRP Ledger EVM Sidechain με την τεχνολογία EvmOS
14 Μαΐου 2024
Το 5ireChain ξεκινά με κίνητρα «Testnet Thunder: GA» για δοκιμές πίεσης δικτύου, προσκαλεί τους χρήστες να συμμετάσχουν για Airdrop Ανταμοιβές
Αναφορά ειδήσεων Τεχνολογία
Το 5ireChain ξεκινά με κίνητρα «Testnet Thunder: GA» για δοκιμές πίεσης δικτύου, προσκαλεί τους χρήστες να συμμετάσχουν για Airdrop Ανταμοιβές
14 Μαΐου 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.