Η Google έκανε πράξη την υπόσχεσή της να ανοίξει το πιο ισχυρό μοντέλο AI, το Gemini 1.5 Pro, στο κοινό μετά από μια έκδοση beta τον περασμένο μήνα για προγραμματιστές.
Το Gemini 1.5 Pro της Google είναι σε θέση να χειριστεί πιο σύνθετες εργασίες από άλλα μοντέλα τεχνητής νοημοσύνης πριν από αυτό, όπως η ανάλυση ολόκληρων βιβλιοθηκών κειμένου, ταινιών μεγάλου μήκους του Χόλιγουντ ή δεδομένων ήχου σχεδόν μιας ολόκληρης ημέρας. Αυτό είναι 20 φορές περισσότερα δεδομένα από το GPT-4o του OpenAI και σχεδόν 10 φορές τις πληροφορίες που μπορεί να διαχειριστεί το Claude 3.5 Sonnet της Anthropic.
Ο στόχος είναι να τεθούν ταχύτερα και χαμηλού κόστους εργαλεία στα χέρια των προγραμματιστών τεχνητής νοημοσύνης, ανέφερε η Google σε αυτήν ανακοίνωσηκαι «επιτρέπουν νέες περιπτώσεις χρήσης, πρόσθετη στιβαρότητα παραγωγής και υψηλότερη αξιοπιστία».
Εικόνα: Google
Η Google είχε προηγουμένως αποκαλύψει το μοντέλο τον Μάιο, παρουσιάζοντας βίντεο για το πώς μια επιλεγμένη ομάδα δοκιμαστών beta ήταν σε θέση να εκμεταλλευτεί τις δυνατότητές της. Για παράδειγμα, ο μηχανικός μηχανικής μάθησης Lukas Atkins τροφοδότησε το μοντέλο με ολόκληρη τη βιβλιοθήκη Python και έκανε ερωτήσεις για να τον βοηθήσει να λύσει ένα πρόβλημα. «Το κάρφωσε», είπε στο βίντεο. «Μπορούσε να βρει συγκεκριμένες αναφορές σε σχόλια στον κώδικα και συγκεκριμένα αιτήματα που είχαν κάνει οι άνθρωποι».
Ένας άλλος δοκιμαστής beta τράβηξε ένα βίντεο από ολόκληρο το ράφι του και ο Gemini δημιούργησε μια βάση δεδομένων με όλα τα βιβλία που είχε — μια εργασία που είναι σχεδόν αδύνατο να επιτευχθεί με τα παραδοσιακά chatbot AI.
Το Gemma 2 έρχεται να κυριαρχήσει στον χώρο ανοιχτού κώδικα
Αλλά η Google κάνει επίσης κύματα στην κοινότητα ανοιχτού κώδικα. Η εταιρεία κυκλοφόρησε σήμερα το Gemma 2 27B, ένα μοντέλο ανοιχτού κώδικα μεγάλης γλώσσας που γρήγορα διεκδίκησε τον θρόνο του μοντέλου ανοιχτού κώδικα με τις υψηλότερης ποιότητας απαντήσεις, σύμφωνα με το Κατάταξη LLM Arena.
ισχυρίζεται η Google Το Gemma 2 προσφέρει «καλύτερη απόδοση στην κατηγορία του, τρέχει με απίστευτη ταχύτητα σε διαφορετικό υλικό και ενσωματώνεται εύκολα με άλλα εργαλεία τεχνητής νοημοσύνης». Προορίζεται να ανταγωνιστεί μοντέλα «πάνω από το διπλάσιο του μεγέθους του», λέει η εταιρεία.
Εικόνα: Google
Η άδεια για το Gemma 2 επιτρέπει δωρεάν πρόσβαση και αναδιανομή, αλλά εξακολουθεί να μην είναι ίδια με τις παραδοσιακές άδειες ανοιχτού κώδικα όπως το MIT ή το Apache. Το μοντέλο έχει σχεδιαστεί για πιο προσιτές και φιλικές προς τον προϋπολογισμό αναπτύξεις AI τόσο στις εκδόσεις 27B όσο και στις μικρότερες εκδόσεις 9Β.
Αυτό έχει σημασία τόσο για τους μέσους όσο και για τους εταιρικούς χρήστες, επειδή, σε αντίθεση με αυτά που προσφέρουν τα κοντινά μοντέλα, ένα ισχυρό ανοιχτό μοντέλο όπως το Gemma είναι εξαιρετικά προσαρμόσιμο. Αυτό σημαίνει ότι οι χρήστες μπορούν να συντονίσουν τα μοντέλα τους ώστε να υπερέχουν σε συγκεκριμένες εργασίες, προστατεύοντας τα δεδομένα τους εκτελώντας τέτοια μοντέλα τοπικά.
Για παράδειγμα, το μικρό γλωσσικό μοντέλο της Microsoft Phi-3 έχει ρυθμιστεί ειδικά για μαθηματικά προβλήματα και μπορεί να νικήσει μεγαλύτερα μοντέλα όπως το Llama-3 και ακόμη και το ίδιο το Gemma 2 σε αυτό το πεδίο.
Εικόνα: Microsoft
Το Gemma 2 είναι πλέον διαθέσιμο στο Google AI Studio, με βάρη μοντέλων διαθέσιμα για λήψη από το Kaggle και Αγκαλιαζόμενα μοντέλα προσώπου με το πανίσχυρο Gemini 1.5 Pro διαθέσιμο για να το δοκιμάσουν οι προγραμματιστές Κορυφή ΑΕΓΩ.