Πριν από ένα χρόνο, ένα Σαν Φρανσίσκο που μαζεύονταν πολλοί ονόμασαν «Woodstock της AIσυγκέντρωσε 5.000 θιασώτες των μοντέλων τεχνητής νοημοσύνης «ανοιχτού κώδικα» – δηλαδή, όπου ο υποκείμενος κώδικας, και μερικές φορές τα βάρη των μοντέλων και οι μέθοδοι εκπαίδευσης, είναι δημόσια διαθέσιμα στους ερευνητές και τους προγραμματιστές.
Η εκδήλωση, που φιλοξενήθηκε από τον κόμβο τεχνητής νοημοσύνης ανοιχτού κώδικα Hugging Face και με ζωντανές λάμα (σε ένα νεύμα προς το μοντέλο Llama του Meta) ξεκίνησε μια έκρηξη AI ανοιχτού κώδικα που δεν έχει σταματήσει από τότε. Το τοπίο περιλαμβάνει πλέον startups μονόκερων, όπως το Mistral και το Together AI, και μπορεί να υπερηφανεύεται για έναν συνεχή καταιγισμό νέων μοντέλων τεχνητής νοημοσύνης ανοιχτού κώδικα που πλησιάζουν ολοένα και περισσότερο στο να ξεπεράσουν το ναυαρχίδα του OpenAI GPT-4 σε διάφορα σημεία αναφοράς επιδόσεων. Μόλις τις τελευταίες δύο εβδομάδες, υπήρξαν εκδόσεις ανοιχτού κώδικα LLM από κορυφαίες εταιρείες όπως οι Databricks, Cerebras, AI21 και Cohere.
Ωστόσο, μια πρόσφατη έρευνα από την εταιρεία επιχειρηματικών κεφαλαίων a16z διαπίστωσε ότι για τις μεγάλες εταιρείες που υιοθετούν γενετική τεχνητή νοημοσύνη, τα κλειστά, ιδιόκτητα μοντέλα του OpenAI παραμένουν τα πιο δημοφιλή μακράν—ιδίως για περιπτώσεις χρήσης που πράγματι τίθενται σε παραγωγή. Έδειξε όμως σημάδια αλλαγής: Πριν από έξι μήνες, για παράδειγμα, οι περισσότεροι οργανισμοί πειραματίζονταν με ένα μόνο μοντέλο —κυρίως από το OpenAI— και οι περισσότεροι κολλούσαν σε περιπτώσεις κοινής χρήσης σε τομείς όπως το μάρκετινγκ, η κωδικοποίηση και η υποστήριξη πελατών. Αλλά το 2024, ανοίγονται στον πειραματισμό με περισσότερες επιλογές μοντέλων τεχνητής νοημοσύνης — οι οποίες είναι συχνά ανοιχτού κώδικα.
Περισσότεροι οργανισμοί πειραματίζονται με μοντέλα ανοιχτού κώδικα
Η Sarah Wang, γενικός συνεργάτης της a16z που συνέταξε την έρευνα, είπε ότι το μεγαλύτερο πλεονέκτημα του OpenAI μέχρι τώρα ήταν αυτό της πρώτης κίνησης. Επιπρόσθετα, ήταν δύσκολο να ξεπεράσεις την κορυφή του, εξήγησε, επειδή το μεγαλύτερο μέρος του περασμένου έτους, το GPT-4 θεωρήθηκε επίσης το καλύτερο διαθέσιμο μοντέλο, καθώς και εύκολη πρόσβαση απευθείας μέσω ενός API ή μέσω Microsoft Γαλανός.
«Νομίζω ότι ήταν το πιο εύκολο να συνδέσεις και να παίξεις και να πεις ότι αυτό το μοντέλο είναι το καλύτερο, ας δούμε απλώς τι περιπτώσεις χρήσης βγαίνουν από αυτό», είπε. Η έρευνα υπολόγισε το μερίδιο αγοράς του 2023 των μοντέλων κλειστού κώδικα σε 80%-90%, με το μεγαλύτερο μερίδιο να πηγαίνει στο OpenAI. Δεν παρασχέθηκε ενημερωμένο μερίδιο αγοράς για φέτος, αλλά το 46% των ερωτηθέντων ανέφερε ότι προτιμά ή προτιμά έντονα μοντέλα ανοιχτού κώδικα.
«Κάθε μεμονωμένη επιχείρηση είπε ότι δοκίμαζε περισσότερες από μία οικογένειες μοντέλων», είπε ο Wang και επεσήμανε ότι δύο από τις έξι κορυφαίες οικογένειες μοντέλων όσον αφορά τη χρήση ήταν ανοιχτού κώδικα – η Llama και η Mistral. «Σίγουρα λοιπόν είναι ακόμα νωρίς, αλλά νομίζω ότι είναι ίσως ένας κορυφαίος δείκτης για τη χρήση στο δρόμο», είπε.
Το OpenAI έχει διαφημίσει «τεράστια ανάπτυξη» στην προσφορά επιχειρήσεων
Ίσως με το μάτι του στον καθρέφτη και το πόδι του στο αέριο, το OpenAI, με επικεφαλής τον CEO Sam Altman, φαίνεται να εργάζεται σκληρά για να σταθεροποιήσει το προβάδισμά του στους εταιρικούς πελάτες. Δημοσιεύτηκε μια νέα ανάρτηση στο blog την περασμένη εβδομάδα ανακοίνωσε νέα χαρακτηριστικά για το “self-serve fine-tuning API” του — το οποίο επιτρέπει ορισμένες προσαρμογές — και κοινές μελέτες περιπτώσεων εταιρειών όπως ΣΚ Telecom που έχουν προσαρμοσμένα και τελειοποιημένα μοντέλα OpenAI. Η ανάρτηση σάλπισε επίσης μια διευρυμένη «υποβοηθούμενη προσφορά λεπτομέρειας» για εταιρείες για «συνεργασία με τεχνικές ομάδες OpenAI για να αξιοποιήσουν τεχνικές πέρα από το API λεπτομέρειας».
Επιπλέον, ο OpenAI COO Brad Lightcap ανέδειξε την «τεράστια ανάπτυξη» στην εταιρική έκδοση του ChatGPT σε ένα Bloomberg συνέντευξη την Παρασκευή — ισχυριζόμενος ότι τώρα περισσότερα από 600.000 άτομα έχουν εγγραφεί για να χρησιμοποιούν το ChatGPT Enterprise, από περίπου 150.000 τον Ιανουάριο και αποκαλώντας το 2024 «έτος υιοθέτησης της τεχνητής νοημοσύνης στην επιχείρηση».
Ωστόσο, σύμφωνα με τον Kjell Carlsson, επικεφαλής στρατηγικής τεχνητής νοημοσύνης στο Domino Data Lab και πρώην αναλυτή της Forrester, η αγορά για τα παραγωγικά μοντέλα τεχνητής νοημοσύνης διασπάται με βάση τις περιπτώσεις εταιρικής χρήσης.
«Η OpenAI κατέχει δεσπόζουσα θέση χάρη στην πρωτοπορία της αλλά, ακόμη περισσότερο, στη σχέση της με τη Microsoft και τις ισχυρές ομάδες πωλήσεών τους», είπε, αναφερόμενος στη συνεργασία του OpenAI με τη Microsoft, συμπεριλαμβανομένης της προσφοράς μοντέλων OpenAI μέσω του βραχίονα cloud, Azure. Ωστόσο, πρόσθεσε ότι οι εταιρείες χρησιμοποιούν κατά κύριο λόγο τα μοντέλα του OpenAI για περιπτώσεις γενικής χρήσης, όπως ad-hoc ερωτήματα χρηστών ή chatbot εξυπηρέτησης πελατών. Όταν οι εταιρείες επιδιώκουν να δημιουργήσουν διαφοροποιημένες εφαρμογές και περιπτώσεις τεχνητής νοημοσύνης —όπως μια βιοτεχνολογική επιχείρηση που κάνει ανακάλυψη φαρμάκων με τεχνητή τεχνητή νοημοσύνη— και θέλουν να προστατεύσουν τα δεδομένα τους λόγω κανονιστικών ή προβλημάτων ασφάλειας, συχνά στρέφονται σε άλλους προμηθευτές και μοντέλα ανοιχτού κώδικα.
«Δεν έχω μιλήσει ακόμη με μια εταιρεία που λέει ότι χρησιμοποιεί τα μοντέλα του OpenAI λόγω τυχόν εγγενών τεχνολογικών πλεονεκτημάτων που έχουν σήμερα», είπε.
Κόστος, έλεγχος και προσαρμογή
Ενώ το κόστος έχει αναφερθεί συχνά ως λόγος για να στραφούμε σε ανοιχτό κώδικα—για παράδειγμα, το Llama 2 της Meta έχει φαίνεται ότι είναι 10-20 φορές φθηνότερο από το GPT-4 του OpenAI για τη δημιουργία 1 εκατομμυρίου διακριτικών — ο Wang είπε ότι οι ερωτηθέντες ανέφεραν ευρέως άλλους λόγους για την επιθυμία να υιοθετήσουν μοντέλα AI. Αυτοί οι λόγοι περιλαμβάνουν τον έλεγχο (ασφάλεια των ιδιόκτητων δεδομένων και την κατανόηση γιατί τα μοντέλα παράγουν συγκεκριμένα αποτελέσματα) και την προσαρμογή (ικανότητα αποτελεσματικής λεπτομέρειας για μια δεδομένη περίπτωση χρήσης).
«Το γεγονός ότι μπορείτε να φιλοξενήσετε μόνοι σας ένα μοντέλο προσαρμοσμένο στα δικά σας δεδομένα με ένα μοντέλο ανοιχτού κώδικα ήταν πολύ ελκυστικό για πολλές επιχειρήσεις», είπε.
Ο Ali Ghodsi, Διευθύνων Σύμβουλος της πλατφόρμας δεδομένων και τεχνητής νοημοσύνης Databricks (η οποία πρόσφατα κυκλοφόρησε ένα ισχυρό νέο μοντέλο μεγάλης γλώσσας ανοιχτού κώδικα που ονομάζεται DBRX) συμφώνησε με αυτήν την αξιολόγηση, αποκαλώντας τη χονδρική κίνηση στην τεχνητή νοημοσύνη ανοιχτού κώδικα το 2024 ως «υπό αναφορά τάση». Πρόσθεσε ότι οι επιχειρήσεις θέλουν να προσαρμόσουν τα μοντέλα AI στα συγκεκριμένα δεδομένα και τις εργασίες τους και, ως εκ τούτου, να κατέχουν την πνευματική ιδιοκτησία.
«Πιστεύω ότι αυτό θα συνεχιστεί ανεξάρτητα από το αν υπάρχουν πραγματικά έξυπνα μοντέλα που βγαίνουν από τους ιδιόκτητους πωλητές», είπε. «Οι επιχειρήσεις θέλουν να είναι ανταγωνιστικές στην αγορά τους. Θέλουν να έχουν τις δικές τους συνταγές».
Ο πιθανός αντίκτυπος του GPT-5
Φυσικά, καμία από τις τρέχουσες προβλέψεις για την εταιρική υιοθέτηση της γενετικής τεχνητής νοημοσύνης δεν λαμβάνει υπόψη την κυκλοφορία του επόμενου μοντέλου μεγάλης γλώσσας του OpenAI, του πολυαναμενόμενου GPT-5, το οποίο ο Wang λέει ότι θα έρθει πολύ σύντομα. Ωστόσο, επεσήμανε ότι σε συνομιλίες με εταιρείες επιχειρήσεων, το κόστος αλλαγής μοντέλων είναι πολύ χαμηλό – επομένως είναι πιθανό οι οργανισμοί να συνεχίσουν να πειραματίζονται με ένα συνδυασμό μοντέλων κλειστού και ανοιχτού κώδικα.
«Μπορούν να ανταλλάξουν μοντέλα πολύ εύκολα στο πίσω μέρος», είπε, επομένως δεν υπάρχουν τα ίδια προβλήματα που μπορεί να έχουν οι εταιρείες σχετικά με το κλείδωμα του προμηθευτή με κάτι σαν μια επιχείρηση βάσης δεδομένων. Επιπλέον, το τοπίο γεμίζει πολύ περισσότερο με νεοεισερχόμενους, οπότε οι άνθρωποι είναι ανοιχτοί σε δοκιμές.
Τούτου λεχθέντος, το GPT-5 θα μπορούσε να βγει και να «χτυπήσει τους πάντες» παραδέχτηκε ο Wang, οδηγώντας το OpenAI να διατηρήσει το μερίδιο αγοράς του. «Θα μπορούσε να πετάξει τα πάντα. Είναι δύσκολο να το προβλέψεις».