Η Google μόλις ανακοίνωσε Δίδυμοιη πιο ισχυρή σουίτα μοντέλων τεχνητής νοημοσύνης μέχρι σήμερα, και η εταιρεία έχει ήδη κατηγορηθεί ότι λέει ψέματα για τις επιδόσεις της.
Ένα άρθρο από Bloomberg ισχυρίζεται ότι η Google παρερμήνευσε τη δύναμη των Διδύμων σε ένα πρόσφατο βίντεο. Η Google μετέδωσε ένα εντυπωσιακό “τι κουκλάκι” πρακτικό βίντεο κατά τη διάρκεια της ανακοίνωσής του νωρίτερα αυτή την εβδομάδα, και ο αρθρογράφος Parmy Olson λέει ότι φαινόταν εξαιρετικά ικανός στο βίντεο — ίσως πολύ ικανός.
Το βίντεο διάρκειας έξι λεπτών δείχνει τις πολυτροπικές δυνατότητες του Gemini (προφορικές προτροπές συνομιλίας σε συνδυασμό με την αναγνώριση εικόνας, για παράδειγμα). Ο Δίδυμος φαινομενικά αναγνωρίζει τις εικόνες γρήγορα —ακόμα και για εικόνες που συνδέονται με τις κουκκίδες— ανταποκρίνεται μέσα σε δευτερόλεπτα και παρακολουθεί ένα κομμάτι χαρτιού σε ένα παιχνίδι φλυτζανιών και μπάλας σε πραγματικό χρόνο. Σίγουρα, οι άνθρωποι μπορούν να τα κάνουν όλα αυτά, αλλά αυτό είναι ένα AI ικανό να αναγνωρίσει και να προβλέψει τι θα συμβεί στη συνέχεια.
Αλλά κάντε κλικ στην περιγραφή του βίντεο στο YouTube και η Google έχει μια σημαντική δήλωση αποποίησης ευθύνης:
“Για τους σκοπούς αυτής της επίδειξης, η καθυστέρηση έχει μειωθεί και οι έξοδοι Gemini έχουν μειωθεί για λόγους συντομίας.”
Αυτό είναι που ο Olson αγανακτεί. Σύμφωνα με αυτήν Bloomberg κομμάτι, Η Google παραδέχτηκε όταν της ζητήθηκε να σχολιάσει ότι η επίδειξη βίντεο δεν έγινε σε πραγματικό χρόνο με προφορικά μηνύματα, αλλά αντ’ αυτού χρησιμοποίησε καρέ ακίνητων εικόνων από ακατέργαστο υλικό και στη συνέχεια έγραψε μηνύματα κειμένου στα οποία ο Gemini απάντησε. “Αυτό είναι πολύ διαφορετικό από αυτό που φαινόταν να προτείνει η Google: ότι ένα άτομο θα μπορούσε να έχει μια ομαλή φωνητική συνομιλία με τον Gemini καθώς παρακολουθούσε και ανταποκρινόταν σε πραγματικό χρόνο στον κόσμο γύρω του”, γράφει ο Olson.
Για να είμαστε δίκαιοι με την Google, οι εταιρείες επεξεργάζονται συχνά βίντεο επίδειξης, ειδικά καθώς πολλές θέλουν να αποφύγουν τυχόν τεχνικά προβλήματα που προκαλούν οι ζωντανές επιδείξεις. Είναι σύνηθες να τροποποιούμε λίγο τα πράγματα. Αλλά η Google έχει ιστορικό αμφισβητήσιμων επιδείξεων βίντεο. Οι άνθρωποι αναρωτήθηκαν αν η επίδειξη Duplex της Google (θυμηθείτε το Duplexο φωνητικός βοηθός AI που κάλεσε κομμωτήρια και εστιατόρια για να κλείσουν κρατήσεις;) ήταν αληθινό επειδή υπήρχε σαφής έλλειψη θορύβου περιβάλλοντος και πολύ εξυπηρετικοί υπάλληλοι. Και τα προηχογραφημένα βίντεο μοντέλων AI τείνουν να κάνουν τους ανθρώπους ακόμα πιο καχύποπτους. Θυμηθείτε όταν Baidu κυκλοφόρησε το Ernie Bot με τα επεξεργασμένα βίντεο και τα κοινόχρηστά του;
Σε μια κατάσταση όπως αυτή, ο Olson λέει ότι η Google «επιδεικνύει» προκειμένου να παραπλανήσει τους ανθρώπους από το γεγονός ότι το Gemini εξακολουθεί να υστερεί σε σχέση με το GPT του OpenAI.
Η Google διαφωνεί. Όταν ρωτήθηκε για την εγκυρότητα της επίδειξης, έδειξε Το χείλος προς την μια ανάρτηση από την Oriol Vinyalsαντιπρόεδρος έρευνας και βαθιάς μάθησης επικεφαλής στο DeepMind της Google (επίσης ο συν-επικεφαλής του Gemini), το οποίο εξηγεί πώς η ομάδα έφτιαξε το βίντεο.
«Όλες οι προτροπές και οι έξοδοι των χρηστών στο βίντεο είναι πραγματικές, συντομευμένες για συντομία», λέει ο Vinyals. «Το βίντεο δείχνει πώς θα μπορούσαν να μοιάζουν οι εμπειρίες των χρηστών πολλαπλών λειτουργιών που έχουν δημιουργηθεί με το Gemini. Το φτιάξαμε για να εμπνεύσουμε τους προγραμματιστές».
Πρόσθεσε ότι η ομάδα έδωσε στον Δίδυμο εικόνες και κείμενα και του ζήτησε να απαντήσει προβλέποντας τι θα ακολουθήσει.
Αυτός είναι σίγουρα ένας τρόπος προσέγγισης αυτής της κατάστασης, αλλά μπορεί να μην είναι ο σωστός για την Google — η οποία έχει ήδη φανεί, τουλάχιστον στα μάτια του κοινού, ότι έχει παγιδευτεί από την τεράστια επιτυχία του OpenAI φέτος. Αν θέλει να εμπνεύσει τους προγραμματιστές, δεν είναι μέσα από προσεκτικά επεξεργασμένους κυλίνδρους που αναμφισβήτητα παραποιούν τις δυνατότητες του AI. Γίνεται μέσω του να αφήσουμε τους δημοσιογράφους και τους προγραμματιστές να βιώσουν πραγματικά το προϊόν. Αφήστε τους ανθρώπους να κάνουν ανόητα πράγματα με τους Διδύμους σε μια μικρή δημόσια έκδοση beta. Δείξτε μας πόσο ισχυρό είναι πραγματικά.