Η Google παρουσίασε ένα μοντέλο τεχνητής νοημοσύνης για την απεικόνιση άρθρων ειδήσεων
Εν συντομία
Η Google ανακοινώνει ένα νέο μοντέλο τεχνητής νοημοσύνης για την παραγωγή υψηλής ποιότητας οπτικών περιλήψεων άρθρων ειδήσεων
Η Google έχει ανακοίνωσε ένα νέο μοντέλο τεχνητής νοημοσύνης (AI) που λέει ότι μπορεί να δημιουργήσει αυτόματα «συνεκτικές και εύρυθμες» οπτικές περιλήψεις άρθρων ειδήσεων. Ο τεχνολογικός γίγαντας λέει ότι το μοντέλο μπορεί να βοηθήσει να γίνουν οι πληροφορίες πιο προσιτές στους χρήστες παραγωγής "υψηλής ποιότητας" οπτικές περιλήψεις μεγάλων κομματιών κειμένου.
Το μοντέλο βασίζεται σε έναν αλγόριθμο βαθιάς μάθησης, γνωστό ως μετασχηματιστή, ο οποίος έχει σχεδιαστεί για να «κατανοεί» το πλαίσιο μιας πρότασης και στη συνέχεια να δημιουργεί μια απεικόνιση που διατηρεί τις σημαντικές πληροφορίες από το αρχικό κείμενο.
Η Google ολοκληρώνει το πολύ πιο δύσκολο έργο της κατανόησης του συνολικού πλαισίου ολόκληρου του κειμένου, σε αντίθεση με το δημοφιλές επί του παρόντος κείμενο σε εικόνα συστήματα, τα οποία βασίζονται σε μια «μετωπική» απεικόνιση της αρχής «ό,τι βλέπω, σχεδιάζω». Επιπλέον, η επιλογή των εικόνων γίνεται για να δημιουργηθεί μια «εικόνα ως σύνολο» και όχι μεμονωμένες δηλώσεις και φράσεις (όπως κάνουν σχεδόν όλοι αυτή τη στιγμή). Με άλλα λόγια, οι εικόνες επιλέγονται για ολόκληρο το άρθρο, ενώ λαμβάνονται υπόψη τα συμφραζόμενα και τα νοήματα.
Η Google λέει ότι το μοντέλο μπορεί να δημιουργήσει περιλήψεις πολλών προτάσεων από ένα άρθρο ειδήσεων και ότι έχει γίνει εκπαιδευμένο σε ένα μεγάλο σύνολο δεδομένων NewsStories, που περιέχει σχεδόν 31 εκατομμύρια άρθρα, 22 εκατομμύρια φωτογραφίες και 1 εκατομμύριο βίντεο κρυμμένα στους θάμνους.
Το πρώτο βήμα είναι να αντιστοιχίσετε την εικόνα με το πλήρες άρθρο αφού μεταφραστεί στις κατάλληλες αναπαραστάσεις χρησιμοποιώντας τόσο τη γλώσσα όσο και τους κωδικοποιητές εικόνας.
Το δεύτερο βήμα συνεπάγεται τη διαίρεση ενός άρθρου κειμένου σε ξεχωριστές προτάσεις και την κωδικοποίηση κάθε πρότασης σε διαφορετική αναπαράσταση. Στόχος είναι η βελτιστοποίηση της αμοιβαίας πληροφόρησης, defiεξαρτώνται από την άποψη των κατανομών πιθανοτήτων, μεταξύ ακολουθιών εικόνας και κειμένου. Ως αποτέλεσμα ελήφθη η μεγαλύτερη ακρίβεια.
Συμπερασματικά, αυτή η μελέτη κάνει μια ποικιλία συνεισφορών, από εφαρμογές όπως η αυτοματοποιημένη αφηγηματική εικονογράφηση μέχρι το δύσκολο έργο της αντιστοίχισης μιας ιστορίας και μιας συλλογής εικονογραφήσεων. Η εταιρεία λέει ότι μοντέλο μπορεί επίσης να εφαρμοστεί σε άλλες γλώσσες και ότι εργάζεται για την επέκταση του συνόλου δεδομένων ώστε να περιλαμβάνει άρθρα από άλλους ιστότοπους.
Διαβάστε περισσότερα σχετικά άρθρα:
Αποποίηση ευθυνών
Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.
Σχετικά με το Συγγραφέας
Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου.
Περισσότερα άρθραΟ Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου.