Στον ιλιγγιώδη αγώνα για την κατασκευή παραγωγικών συστημάτων AI, το μάντρα της βιομηχανίας της τεχνολογίας ήταν μεγαλύτερος είναι καλύτερο, ανεξάρτητα από την τιμή.
Τώρα οι εταιρείες τεχνολογίας αρχίζουν να αγκαλιάζουν μικρότερες τεχνολογίες AI που δεν είναι τόσο ισχυρά αλλά κοστίζουν πολύ λιγότερο. Και για πολλούς πελάτες, αυτό μπορεί να είναι μια καλή ανταλλαγή.
Την Τρίτη, η Microsoft παρουσίασε τρία μικρότερα μοντέλα τεχνητής νοημοσύνης που αποτελούν μέρος μιας τεχνολογικής οικογένειας που η εταιρεία ονόμασε Phi-3. Η εταιρεία είπε ότι ακόμη και το μικρότερο από τα τρία είχε σχεδόν εξίσου καλή απόδοση με το GPT-3.5, το πολύ μεγαλύτερο σύστημα που υποστήριξε το chatbot ChatGPT του OpenAI όταν κατέπληξε τον κόσμο κατά την κυκλοφορία του στα τέλη του 2022.
Το μικρότερο μοντέλο Phi-3 μπορεί να χωρέσει σε smartphone, ώστε να μπορεί να χρησιμοποιηθεί ακόμα κι αν δεν είναι συνδεδεμένο στο διαδίκτυο. Και μπορεί να λειτουργήσει με τα είδη των τσιπ που τροφοδοτούν κανονικούς υπολογιστές, αντί για ακριβότερους επεξεργαστές που κατασκευάζει η Nvidia.
Επειδή τα μικρότερα μοντέλα απαιτούν λιγότερη επεξεργασία, οι μεγάλοι πάροχοι τεχνολογίας μπορούν να χρεώνουν λιγότερο τους πελάτες για να τα χρησιμοποιήσουν. Ελπίζουν ότι αυτό σημαίνει ότι περισσότεροι πελάτες μπορούν να εφαρμόσουν AI σε μέρη όπου τα μεγαλύτερα, πιο προηγμένα μοντέλα ήταν πολύ ακριβά στη χρήση. Αν και η Microsoft είπε ότι η χρήση των νέων μοντέλων θα ήταν «ουσιαστικά φθηνότερη» από τη χρήση μεγαλύτερων μοντέλων όπως το GPT-4, δεν πρόσφερε λεπτομέρειες.
Τα μικρότερα συστήματα είναι λιγότερο ισχυρά, πράγμα που σημαίνει ότι μπορεί να είναι λιγότερο ακριβή ή να ακούγονται πιο άβολα. Αλλά η Microsoft και άλλες εταιρείες τεχνολογίας στοιχηματίζουν ότι οι πελάτες θα είναι πρόθυμοι να παραιτηθούν από κάποια απόδοση, εάν αυτό σημαίνει ότι τελικά μπορούν να αντέξουν οικονομικά την τεχνητή νοημοσύνη
Οι πελάτες φαντάζονται πολλούς τρόπους χρήσης της τεχνητής νοημοσύνης, αλλά με τα μεγαλύτερα συστήματα «είναι σαν, «Ω, αλλά ξέρετε, μπορεί να γίνουν κάπως ακριβά», είπε ο Έρικ Μπόιντ, στέλεχος της Microsoft. Τα μικρότερα μοντέλα, σχεδόν εξ ορισμού, είναι φθηνότερα στην ανάπτυξη, είπε.
Ο κ. Boyd είπε ότι ορισμένοι πελάτες, όπως γιατροί ή φοροτεχνικοί, θα μπορούσαν να δικαιολογήσουν το κόστος των μεγαλύτερων, ακριβέστερων συστημάτων τεχνητής νοημοσύνης, επειδή ο χρόνος τους ήταν τόσο πολύτιμος. Αλλά πολλές εργασίες μπορεί να μην χρειάζονται το ίδιο επίπεδο ακρίβειας. Οι διαδικτυακοί διαφημιστές, για παράδειγμα, πιστεύουν ότι μπορούν να στοχεύσουν καλύτερα διαφημίσεις με AI, αλλά χρειάζονται χαμηλότερο κόστος για να μπορούν να χρησιμοποιούν τα συστήματα τακτικά.
«Θέλω ο γιατρός μου να διορθώσει τα πράγματα», είπε ο κύριος Μπόιντ. “Άλλες καταστάσεις, όπου συνοψίζω τις κριτικές χρηστών στο διαδίκτυο, αν είναι λίγο άστοχο, δεν είναι το τέλος του κόσμου.”
Τα chatbot οδηγούνται από μεγάλα γλωσσικά μοντέλα, ή LLM, μαθηματικά συστήματα που ξοδεύουν εβδομάδες αναλύοντας ψηφιακά βιβλία, άρθρα Wikipedia, άρθρα ειδήσεων, αρχεία καταγραφής συνομιλιών και άλλο κείμενο που έχει συλλεχθεί από όλο το Διαδίκτυο. Εντοπίζοντας μοτίβα σε όλο αυτό το κείμενο, μαθαίνουν να δημιουργούν κείμενο μόνοι τους.
Αλλά τα LLM αποθηκεύουν τόσες πολλές πληροφορίες, η ανάκτηση όσων χρειάζονται για κάθε συνομιλία απαιτεί σημαντική υπολογιστική ισχύ. Και αυτό είναι ακριβό.
Ενώ οι τεχνολογικοί γίγαντες και οι νεοφυείς επιχειρήσεις όπως το OpenAI και Ανθρωπικό έχουν επικεντρωθεί στη βελτίωση των μεγαλύτερων συστημάτων AI, ανταγωνίζονται επίσης για την ανάπτυξη μικρότερων μοντέλων που προσφέρουν χαμηλότερες τιμές. Η Meta και η Google, για παράδειγμα, έχουν κυκλοφορήσει μικρότερα μοντέλα τον περασμένο χρόνο.
Η Meta και η Google έχουν επίσης “ανοιχτού κώδικαΑυτά τα μοντέλα, που σημαίνει ότι ο καθένας μπορεί να τα χρησιμοποιήσει και να τα τροποποιήσει δωρεάν. Αυτός είναι ένας κοινός τρόπος για τις εταιρείες να λαμβάνουν εξωτερική βοήθεια για τη βελτίωση του λογισμικού τους και να ενθαρρύνουν τη μεγαλύτερη βιομηχανία να χρησιμοποιήσει τις τεχνολογίες τους. Η Microsoft προμηθεύεται και τα νέα της μοντέλα Phi-3.
(Οι Νιου Γιορκ Ταιμς μήνυσε OpenAI και Microsoft τον Δεκέμβριο για παραβίαση πνευματικών δικαιωμάτων σε περιεχόμενο ειδήσεων που σχετίζεται με συστήματα τεχνητής νοημοσύνης.)
Αφού το OpenAI κυκλοφόρησε το ChatGPT, ο Sam Altman, διευθύνων σύμβουλος της εταιρείας, είπε ότι το κόστος κάθε συνομιλίας ήταν «μονοψήφια σεντ” — ένα τεράστιο κόστος λαμβάνοντας υπόψη τις δημοφιλείς υπηρεσίες ιστού όπως η Wikipedia για ελάχιστα κλάσματα του λεπτού.
Τώρα, οι ερευνητές λένε ότι τα μικρότερα μοντέλα τους μπορούν τουλάχιστον να προσεγγίσουν την απόδοση κορυφαίων chatbots όπως το ChatGPT και το Google Gemini. Ουσιαστικά, τα συστήματα μπορούν ακόμα να αναλύουν μεγάλες ποσότητες δεδομένων, αλλά να αποθηκεύουν τα μοτίβα που προσδιορίζουν σε ένα μικρότερο πακέτο που μπορεί να εξυπηρετηθεί με λιγότερη επεξεργαστική ισχύ.
Η κατασκευή αυτών των μοντέλων είναι μια αντιστάθμιση μεταξύ ισχύος και μεγέθους. Sébastien Bubeck, α ερευνητής και αντιπρόεδρος της Microsoftείπε ότι η εταιρεία κατασκεύασε τα νέα μικρότερα μοντέλα της βελτιώνοντας τα δεδομένα που διοχετεύτηκαν σε αυτά, διασφαλίζοντας ότι τα μοντέλα μαθαίνουν από κείμενο υψηλότερης ποιότητας.
Μέρος αυτού του κειμένου δημιουργήθηκε από την ίδια την τεχνητή νοημοσύνη – αυτό που είναι γνωστό ως “συνθετικά δεδομένα.Στη συνέχεια, οι επιμελητές εργάστηκαν για να διαχωρίσουν το πιο ευκρινές κείμενο από το υπόλοιπο.
Η Microsoft έχει κατασκευάσει τρία διαφορετικά μικρά μοντέλα: Phi-3-mini, Phi-3-small και Phi-3-medium. Το Phi-3-mini, το οποίο θα είναι διαθέσιμο την Τρίτη, είναι το μικρότερο (και φθηνότερο) αλλά το λιγότερο ισχυρό. Το Phi-3 Medium, το οποίο δεν είναι ακόμη διαθέσιμο, είναι το πιο ισχυρό αλλά το μεγαλύτερο και ακριβότερο.
Κάνοντας τα συστήματα αρκετά μικρά ώστε να μπορούν να μεταβούν απευθείας σε ένα τηλέφωνο ή έναν προσωπικό υπολογιστή «θα τα καταστήσει πολύ πιο γρήγορα και σε τάξη μεγέθους λιγότερο ακριβά», δήλωσε ο Gil Luria, αναλυτής στην επενδυτική τράπεζα DA Davidson.