Η Google είπε την Πέμπτη ότι θα «θέσει σε παύση» το εργαλείο δημιουργίας εικόνων του chatbot Gemini, αφού είχε ευρεία μετατόπιση για τη δημιουργία «διαφορετικών» εικόνων που δεν ήταν ιστορικά ή πραγματικές ακριβείς — όπως π.χ. μαύροι Βίκινγκς, γυναίκες πάπες και ιθαγενείς Αμερικανοί μεταξύ των Ιδρυτών Πατέρων.
Οι χρήστες των μέσων κοινωνικής δικτύωσης είχαν χαρακτηρίσει τον Δίδυμο ως «παράλογα ξύπνιο» και «άχρηστο» μετά από αιτήματα δημιουργίας αντιπροσωπευτικών εικόνων για θέματα που είχαν ως αποτέλεσμα τις παράξενες αναθεωρητικές εικόνες.
«Εργαζόμαστε ήδη για να αντιμετωπίσουμε πρόσφατα ζητήματα με τη δυνατότητα δημιουργίας εικόνας του Gemini», είπε η Google σε δήλωση που δημοσιεύτηκε στο X. «Ενώ το κάνουμε αυτό, θα διακόψουμε τη δημιουργία εικόνων των ανθρώπων και θα επανακυκλοφορήσουμε μια βελτιωμένη έκδοση σύντομα.”
Τα παραδείγματα περιελάμβαναν μια εικόνα τεχνητής νοημοσύνης ενός μαύρου άνδρα που φαινόταν να αντιπροσωπεύει τον Τζορτζ Ουάσιγκτον, με μια λευκή περούκα σε σκόνη και στολή του Ηπειρωτικού Στρατού, και μια γυναίκα από τη Νοτιοανατολική Ασία ντυμένη με παπική ενδυμασία, παρόλο που και οι 266 πάπες στην ιστορία ήταν λευκοί άνδρες.
Σε άλλο ένα τρανταχτό παράδειγμα αποκαλύφθηκε από το Vergeο Δίδυμος δημιούργησε ακόμη και «διαφορετικές» αναπαραστάσεις Γερμανών στρατιωτών της ναζιστικής εποχής, συμπεριλαμβανομένης μιας Ασιάτισσας και ενός μαύρου άνδρα που φορούσαν στρατιωτικά ρούχα το 1943.
Η Google είχε νωρίτερα παραδεχτεί ότι η ακανόνιστη συμπεριφορά του chatbot έπρεπε να διορθωθεί.
«Εργαζόμαστε για να βελτιώσουμε αμέσως αυτού του είδους τις απεικονίσεις», είπε στην The Post ο Jack Krawczyk, ανώτερος διευθυντής διαχείρισης προϊόντων της Google για τις εμπειρίες Gemini.
«Η δημιουργία εικόνων AI του Gemini δημιουργεί ένα ευρύ φάσμα ανθρώπων. Και αυτό είναι γενικά καλό γιατί το χρησιμοποιούν άνθρωποι σε όλο τον κόσμο. Αλλά χάνει το σημάδι εδώ».
Η Δημοσίευση απευθύνθηκε στην Google για περαιτέρω σχόλια.
Ήταν ένα σημαντικό λάθος για την Google, η οποία είχε μόλις μετονομάσει το κύριο προϊόν της chatbot με τεχνητή νοημοσύνη με το όνομα Gemini νωρίτερα αυτόν τον μήνα και εισήγαγε έντονα διαφημιζόμενα νέα χαρακτηριστικά — συμπεριλαμβανομένης της δημιουργίας εικόνων.
Η γκάφα ήρθε επίσης λίγες μέρες αφότου το OpenAI, το οποίο διαχειρίζεται το δημοφιλές ChatGPT, παρουσίασε ένα νέο εργαλείο AI που ονομάζεται Sora που δημιουργεί βίντεο με βάση τα μηνύματα κειμένου των χρηστών.
Εφόσον η Google δεν έχει δημοσιεύσει τις παραμέτρους που διέπουν τη συμπεριφορά του chatbot Gemini, είναι δύσκολο να έχουμε μια σαφή εξήγηση για το γιατί το λογισμικό εφευρίσκει διάφορες εκδόσεις ιστορικών προσώπων και γεγονότων.
Όταν ζητήθηκε από το The Post να παράσχει τις κατευθυντήριες γραμμές εμπιστοσύνης και ασφάλειας, ο Gemini αναγνώρισε ότι δεν «αποκαλύφθηκαν δημόσια λόγω τεχνικών πολυπλοκοτήτων και εκτιμήσεων πνευματικής ιδιοκτησίας».
Το chatbot στις απαντήσεις του σε προτροπές είχε παραδεχτεί ότι γνώριζε «τις επικρίσεις ότι το Gemini μπορεί να είχε δώσει προτεραιότητα στην αναγκαστική ποικιλομορφία στη δημιουργία εικόνων, οδηγώντας σε ιστορικά ανακριβείς απεικονίσεις».
«Οι αλγόριθμοι πίσω από τα μοντέλα δημιουργίας εικόνων είναι περίπλοκοι και ακόμη υπό ανάπτυξη», είπε ο Gemini. «Μπορεί να δυσκολεύονται να κατανοήσουν τις αποχρώσεις του ιστορικού πλαισίου και της πολιτιστικής αναπαράστασης, οδηγώντας σε ανακριβή αποτελέσματα».