Η Mistral AI και η NVIDIA κυκλοφόρησαν σήμερα ένα νέο μοντέλο γλώσσας τελευταίας τεχνολογίας, Mistral NeMo 12B, ότι οι προγραμματιστές μπορούν εύκολα να προσαρμόσουν και να αναπτύξουν για εταιρικές εφαρμογές που υποστηρίζουν chatbot, πολύγλωσσες εργασίες, κωδικοποίηση και σύνοψη.
Συνδυάζοντας την τεχνογνωσία του Mistral AI στα δεδομένα εκπαίδευσης με το βελτιστοποιημένο οικοσύστημα υλικού και λογισμικού της NVIDIA, το μοντέλο Mistral NeMo προσφέρει υψηλή απόδοση για διαφορετικές εφαρμογές.
«Είμαστε τυχεροί που συνεργαζόμαστε με την ομάδα της NVIDIA, αξιοποιώντας το κορυφαίο υλικό και το λογισμικό της», δήλωσε ο Guillaume Lample, συνιδρυτής και επικεφαλής επιστήμονας της Mistral AI. «Μαζί, αναπτύξαμε ένα μοντέλο με πρωτοφανή ακρίβεια, ευελιξία, υποστήριξη και ασφάλεια υψηλής απόδοσης και επιχειρηματικού επιπέδου χάρη στην ανάπτυξη της NVIDIA AI Enterprise».
Το Mistral NeMo εκπαιδεύτηκε στο NVIDIA DGX Cloud Πλατφόρμα AI, η οποία προσφέρει αποκλειστική, κλιμακούμενη πρόσβαση στην τελευταία αρχιτεκτονική NVIDIA.
NVIDIA TensorRT-LLM για ταχεία απόδοση συμπερασμάτων σε μεγάλα γλωσσικά μοντέλα και το NVIDIA NeMo Η πλατφόρμα ανάπτυξης για τη δημιουργία προσαρμοσμένων μοντέλων τεχνητής νοημοσύνης χρησιμοποιήθηκε επίσης για την προώθηση και τη βελτιστοποίηση της διαδικασίας.
Αυτή η συνεργασία υπογραμμίζει τη δέσμευση της NVIDIA να υποστηρίζει το οικοσύστημα κατασκευής μοντέλων.
Παρέχοντας άνευ προηγουμένου ακρίβεια, ευελιξία και αποτελεσματικότητα
Με εξαιρετική απόδοση σε συνομιλίες πολλαπλών στροφών, μαθηματικά, λογική λογική, παγκόσμια γνώση και κωδικοποίηση, αυτό το επιχειρηματικό μοντέλο τεχνητής νοημοσύνης προσφέρει ακριβή, αξιόπιστη απόδοση σε διάφορες εργασίες.
Με μήκος περιβάλλοντος 128K, το Mistral NeMo επεξεργάζεται εκτενείς και σύνθετες πληροφορίες με μεγαλύτερη συνοχή και ακρίβεια, διασφαλίζοντας εξόδους σχετικά με τα συμφραζόμενα.
Κυκλοφόρησε με την άδεια Apache 2.0, η οποία προωθεί την καινοτομία και υποστηρίζει την ευρύτερη κοινότητα AI, το Mistral NeMo είναι ένα μοντέλο 12 δισεκατομμυρίων παραμέτρων. Επιπλέον, το μοντέλο χρησιμοποιεί τη μορφή δεδομένων FP8 για την εξαγωγή συμπερασμάτων μοντέλου, η οποία μειώνει το μέγεθος της μνήμης και επιταχύνει την ανάπτυξη χωρίς υποβάθμιση στην ακρίβεια.
Αυτό σημαίνει ότι το μοντέλο μαθαίνει καλύτερα τις εργασίες και χειρίζεται διαφορετικά σενάρια πιο αποτελεσματικά, καθιστώντας το ιδανικό για περιπτώσεις εταιρικής χρήσης.
Το Mistral NeMo διατίθεται συσκευασμένο ως NVIDIA NIM μικρουπηρεσία συμπερασμάτων, που προσφέρει συμπεράσματα βελτιστοποιημένης απόδοσης με τους κινητήρες NVIDIA TensorRT-LLM.
Αυτή η μορφή κοντέινερ επιτρέπει την εύκολη ανάπτυξη οπουδήποτε, παρέχοντας βελτιωμένη ευελιξία για διάφορες εφαρμογές.
Ως αποτέλεσμα, τα μοντέλα μπορούν να αναπτυχθούν οπουδήποτε μέσα σε λίγα λεπτά, αντί για αρκετές ημέρες.
Το NIM διαθέτει λογισμικό εταιρικής ποιότητας που αποτελεί μέρος του NVIDIA AI Enterpriseμε αποκλειστικούς κλάδους δυνατοτήτων, αυστηρές διαδικασίες επικύρωσης και ασφάλεια και υποστήριξη εταιρικού επιπέδου.
Περιλαμβάνει ολοκληρωμένη υποστήριξη, άμεση πρόσβαση σε έναν ειδικό της NVIDIA AI και καθορισμένες συμφωνίες σε επίπεδο υπηρεσιών, παρέχοντας αξιόπιστη και συνεπή απόδοση.
Η άδεια ανοιχτού μοντέλου επιτρέπει στις επιχειρήσεις να ενσωματώνουν απρόσκοπτα το Mistral NeMo σε εμπορικές εφαρμογές.
Σχεδιασμένο για να χωράει στη μνήμη μιας μεμονωμένης GPU NVIDIA L40S, NVIDIA GeForce RTX 4090 ή NVIDIA RTX 4500, το Mistral NeMo NIM προσφέρει υψηλή απόδοση, χαμηλό υπολογιστικό κόστος και βελτιωμένη ασφάλεια και απόρρητο.
Προηγμένη Ανάπτυξη και Προσαρμογή Μοντέλων
Η συνδυασμένη τεχνογνωσία των μηχανικών Mistral AI και NVIDIA έχει βελτιστοποιήσει την εκπαίδευση και τα συμπεράσματα για το Mistral NeMo.
Εκπαιδευμένο με την τεχνογνωσία της Mistral AI, ειδικά στην πολυγλωσσία, τον κώδικα και το περιεχόμενο πολλαπλών στροφών, το μοντέλο επωφελείται από την ταχεία εκπαίδευση στο πλήρες stack της NVIDIA.
Έχει σχεδιαστεί για βέλτιστη απόδοση, χρησιμοποιώντας αποτελεσματικές τεχνικές παραλληλισμού μοντέλων, επεκτασιμότητα και μικτή ακρίβεια με το Megatron-LM.
Το μοντέλο εκπαιδεύτηκε χρησιμοποιώντας Megatron-LMμέρος της NVIDIA NeMoμε 3.072 H100 80 GB Tensor Core GPU στο DGX Cloud, που αποτελείται από αρχιτεκτονική NVIDIA AI, συμπεριλαμβανομένης της επιτάχυνσης των υπολογιστών, του ιστού δικτύου και του λογισμικού για την αύξηση της αποτελεσματικότητας της εκπαίδευσης.
Διαθεσιμότητα και ανάπτυξη
Με την ευελιξία να λειτουργεί οπουδήποτε — cloud, κέντρο δεδομένων ή σταθμός εργασίας RTX — το Mistral NeMo είναι έτοιμο να φέρει επανάσταση στις εφαρμογές τεχνητής νοημοσύνης σε διάφορες πλατφόρμες.
Ζήστε το Mistral NeMo ως NVIDIA NIM σήμερα μέσω ai.nvidia.comμε ένα NIM με δυνατότητα λήψης σύντομα.
Βλέπω ειδοποίηση σχετικά με πληροφορίες προϊόντων λογισμικού.