Αναφορά ειδήσεων Τεχνολογία
Σεπτέμβριος 12, 2023

FLM-101B: Ένα εξαιρετικά οικονομικό μοντέλο γλώσσας κλίμακας 101B ανταγωνίζεται κορυφαία μοντέλα AI

Εν συντομία

Το κινέζικο LLM, LM-101B, μπορεί να εκπαιδευτεί με προϋπολογισμό 100 $, επιτυγχάνοντας απόδοση συγκρίσιμη με γνωστά μοντέλα όπως GPT-3 και GLM-130B.

Κινέζοι ερευνητές παρουσίασαν ένα νέο LLM, το FLM-101B, ένα LLM μόνο για αποκωδικοποιητή με αξιοσημείωτες 101 δισεκατομμύρια παραμέτρους. Αυτή η εξέλιξη παρέχει μια οικονομικά αποδοτική εναλλακτική λύση τόσο για έρευνα όσο και για πρακτικές εφαρμογές.

FLM-101B: Ένα εξαιρετικά οικονομικό μοντέλο γλώσσας κλίμακας 101B ανταγωνίζεται κορυφαία μοντέλα τεχνητής νοημοσύνης
Συγγενεύων: Το κόστος εκπαίδευσης μοντέλων AI αναμένεται να αυξηθεί από 100 εκατομμύρια δολάρια σε 500 εκατομμύρια δολάρια έως το 2030

Αυτό που κάνει το FLM-101B να ξεχωρίζει είναι η εξαιρετική του απόδοση που επιτυγχάνεται με σχετικά μέτριο προϋπολογισμό. Ενώ είναι γνωστό ότι η εκπαίδευση LLM από το μηδέν μπορεί να απαιτεί αστρονομικές επενδύσεις, οι δημιουργοί του FLM-101B έχουν δείξει ότι είναι δυνατό να εκπαιδεύσετε ένα μοντέλο με 101 δισεκατομμύρια παραμέτρους χρησιμοποιώντας μόνο έναν προϋπολογισμό 100 $.

Τα πειραματικά αποτελέσματα δεν είναι τίποτα λιγότερο από εντυπωσιακά. Το FLM-101B έχει επιδείξει επίπεδα απόδοσης συγκρίσιμα με τα καθιερωμένα και με ένταση πόρων μοντέλα όπως GPT-3 και GLM-130B. Αυτή η σύγκριση υπογραμμίζει τις τεράστιες δυνατότητες αυτού του οικονομικά αποδοτικού μοντέλου, ιδιαίτερα σε δείκτες αναφοράς IQ με πολύπλοκα πλαίσια που δεν υπάρχουν στα δεδομένα εκπαίδευσης.

Σε μια κίνηση που υπογραμμίζει τη δέσμευσή τους για την προώθηση της έρευνας και ανάπτυξης της τεχνητής νοημοσύνης, οι δημιουργοί του FLM-101B έκαναν αυτό το μοντέλο ανοιχτού κώδικα. Ερευνητές και προγραμματιστές σε όλο τον κόσμο μπορούν τώρα να έχουν πρόσβαση και να αξιοποιήσουν αυτό το LLM κλίμακας 101B για διάφορες εφαρμογές, που εκτείνονται τόσο στην κινεζική όσο και στην αγγλική γλώσσα.

Το μοντέλο FLM-101B χρησιμοποιεί μια μοναδική προσέγγιση εκπαίδευσης. Συσσωρεύει γρήγορα τη γνώση από ένα μικρότερο μοντέλο 16 δισεκατομμυρίων παραμέτρων στα αρχικά στάδια της εκπαίδευσης και σταδιακά κλιμακώνει έως και 101 δισεκατομμύρια παραμέτρους. Αυτή η σταδιακή προσέγγιση μειώνει σημαντικά το κόστος εκπαίδευσης, καθιστώντας την οικονομικά εφικτή για ένα ευρύτερο φάσμα έργων.

Ένα ξεχωριστό χαρακτηριστικό του FLM-101B είναι η υποστήριξή του για αποτελεσματική επέκταση του μεγέθους του παραθύρου κατά την εξαγωγή συμπερασμάτων. Αυτό επιτυγχάνεται με τη χρήση της ενσωμάτωσης περιστροφικής θέσης xPos, επιτρέποντας στο μοντέλο να χειρίζεται ένα ευρύτερο πλαίσιο, ενισχύοντας την προσαρμοστικότητα και τη χρηστικότητά του.

Το FLM-101B εκπαιδεύτηκε σε ένα σύμπλεγμα 24 διακομιστών GPU DGX-A800 σε λιγότερο από 26 ημέρες. Αυτό το εντυπωσιακό κατόρθωμα υπογραμμίζει την επεκτασιμότητα του μοντέλου και την αποτελεσματική χρήση των πόρων. Η βάση κώδικα εκπαίδευσης του μοντέλου, προσαρμοσμένη από τη Megatron-LM, θα είναι σύντομα διαθέσιμη ως ανοιχτού κώδικα, παρέχοντας πολύτιμες πληροφορίες για την κοινότητα της τεχνητής νοημοσύνης.

Οι δημιουργοί του FLM-101B αναγνωρίζουν πιθανούς περιορισμούς, συμπεριλαμβανομένης της έκθεσης του μοντέλου σε μη ασφαλή παραδείγματα στο σώμα εκπαίδευσης λόγω της ανοιχτής φύσης του συνόλου δεδομένων. Αυτή η προειδοποίηση χρησιμεύει ως υπενθύμιση της σημασίας της υπεύθυνης χρήσης AI και μετριοπάθεια περιεχομένου.

Ενώ το FLM-101B έχει επιτύχει αξιοσημείωτα αποτελέσματα, οι δημιουργοί αναγνωρίζουν τομείς για βελτίωση. Η διαδικασία συμπερασμάτων του μοντέλου, αν και ισχυρή, δεν έχει βελτιστοποιηθεί ακόμη πλήρως, οδηγώντας σε υψηλότερη χρήση πόρων και μειωμένη ταχύτητα. Ωστόσο, βρίσκονται σε εξέλιξη σχέδια για την εισαγωγή του Flash Attention στο συμπέρασμα, αντιμετωπίζοντας αυτόν τον περιορισμό.

Διαβάστε περισσότερα για το AI:

Ετικέτες:

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Περισσότερα άρθρα
Νταμίρ Γιαλάλοφ
Νταμίρ Γιαλάλοφ

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Hot Stories
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταια νεα

Η θεσμική όρεξη αυξάνεται προς τα ETF του Bitcoin εν μέσω αστάθειας

Οι αποκαλύψεις μέσω των καταθέσεων 13F αποκαλύπτουν αξιόλογους θεσμικούς επενδυτές που ασχολούνται με τα Bitcoin ETF, υπογραμμίζοντας την αυξανόμενη αποδοχή του ...

Μάθετε περισσότερα

Έφτασε η ημέρα της ποινής: Η μοίρα της CZ βρίσκεται σε ισορροπία καθώς το δικαστήριο των ΗΠΑ εξετάζει την ένσταση του DOJ

Ο Changpeng Zhao είναι έτοιμος να αντιμετωπίσει την καταδίκη σε αμερικανικό δικαστήριο στο Σιάτλ σήμερα.

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Διαβάστε Περισσότερα
Διάβασε περισσότερα
BLOCKCHANCE και CONF3RENCE Ενώνονται για το μεγαλύτερο της Γερμανίας Web3 Συνέδριο στο Ντόρτμουντ
Business αγορές λογισμικό Ιστορίες και κριτικές Τεχνολογία
BLOCKCHANCE και CONF3RENCE Ενώνονται για το μεγαλύτερο της Γερμανίας Web3 Συνέδριο στο Ντόρτμουντ
9 Μαΐου 2024
Το NuLink εκκινεί στο Bybit Web3 Πλατφόρμα IDO. Παρατείνεται η φάση της συνδρομής έως τις 13 Μαΐου
αγορές Αναφορά ειδήσεων Τεχνολογία
Το NuLink εκκινεί στο Bybit Web3 Πλατφόρμα IDO. Παρατείνεται η φάση της συνδρομής έως τις 13 Μαΐου
9 Μαΐου 2024
Η UXLINK και η Binance συνεργάζονται σε νέα καμπάνια, προσφέροντας στους χρήστες 20 εκατομμύρια πόντους UXUY και Airdrop Ανταμοιβές
αγορές Αναφορά ειδήσεων Τεχνολογία
Η UXLINK και η Binance συνεργάζονται σε νέα καμπάνια, προσφέροντας στους χρήστες 20 εκατομμύρια πόντους UXUY και Airdrop Ανταμοιβές
9 Μαΐου 2024
Το Side Protocol εκκινεί το Incentivized Testnet και εισάγει το Insider Point System, επιτρέποντας στους χρήστες να κερδίζουν SIDE Points
αγορές Αναφορά ειδήσεων Τεχνολογία
Το Side Protocol εκκινεί το Incentivized Testnet και εισάγει το Insider Point System, επιτρέποντας στους χρήστες να κερδίζουν SIDE Points
9 Μαΐου 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.