Με τα πρώτα του γενέθλια ακριβώς στη γωνίατο εργαλείο συνομιλίας AI της Google Bard λαμβάνει άλλη μια αναβάθμιση.
Πρώιμες κριτικές βρέθηκαν Ο Bard υστερούσε σε σχέση με τα ανταγωνιστικά chatbot εν μέρει επειδή οι απαντήσεις του ήταν λιγότερο ανθρώπινες. Από τότε, η Google έχει ενσωματώσει το μοντέλο AI Gemini, το οποίο βοήθησε τον Bard επεκτείνει την εκπαίδευσή του πέρα από αυτό κείμενο σε βίντεο, ήχο και φωτογραφίες, και τώρα προσπαθεί να κάνει περαιτέρω βήματα στη χρησιμότητα καθώς γενετικό AI παραμένει ένα καυτό εισιτήριο.
Σε ένα ανάρτηση Την Πέμπτη, ο επικεφαλής προϊόντων της Bard, Jack Krawczyk, δήλωσε ότι το εργαλείο επιτρέπει τώρα στους χρήστες να δημιουργούν εικόνες δωρεάν.
Όταν κάποιος πληκτρολογεί μια προτροπή, όπως “δημιουργήστε μια εικόνα ενός αερόστατου που πετάει πάνω από τα βουνά το ηλιοβασίλεμα”, ο Bard δημιουργεί αυτό που η Google περιγράφει ως “προσαρμοσμένα, ευρείας εμβέλειας γραφικά που θα σας βοηθήσουν να πραγματοποιήσετε την ιδέα σας”.
Ωστόσο, χρειάζεται λίγος χρόνος – περίπου 13 δευτερόλεπτα για την ακρίβεια.
Και ενώ τα περισσότερα ερωτήματα που δοκιμάσαμε δημιούργησαν σχετικές εικόνες ή/και απαντήσεις, δεν έχει ποσοστό ακρίβειας 100%.
Για παράδειγμα, όταν ζήτησα από τον Bard να δημιουργήσει μια εικόνα για μια είδηση σχετικά με τις πιο πρόσφατες ενημερώσεις του εργαλείου, αρνήθηκε να δημιουργήσει την εικόνα που ζητήθηκε. Και όταν του ζήτησα να δημιουργήσει απλώς μια εικόνα για το Google Bard, δημιούργησε αυτό το ξανθό cyborg:
Τον τελευταίο χρόνο, η αγορά έχει πλημμυρίσει από chatbots όπως το ChatGPT του OpenAI, το Bing AI της Microsoft, τον Claude της Anthropic — και, ναι, τον Bard της Google — καθώς η Big Tech προσπαθεί να διακυβεύσει την αξίωσή της στο επόμενο κύμα αναζήτησης. Αυτά τα chatbots έχουν πρόσβαση σε τεράστια σύνολα δεδομένων και χρησιμοποιούν μεγάλα μοντέλα γλώσσας για την παράδοση κειμένου, και τώρα εικόνας ή ακόμη βίντεο, απαντήσεις σε ερωτήματα καταναλωτών. Είναι ένα ταχέως εξελισσόμενο πεδίο που έχει ήδη πλησιάσει πιο κοντά στην ανθρώπινη συζήτηση. Ωστόσο, ενώ τα ρομπότ μπορεί να δίνουν απαντήσεις με σιγουριά, δεν είναι πάντα ακριβείς — και παραμένουν ευάλωτα σε κατάχρηση.
Η ανάρτηση της Google σημείωσε ότι ο Bard περιλαμβάνει μια διάκριση μεταξύ των εικαστικών που δημιουργούνται με τον Bard και των πρωτότυπων ανθρώπινων έργων τέχνης και ενσωματώνει υδατογραφήματα στα pixel των εικόνων που δημιουργούνται. Για να το δοκιμάσω, του ζήτησα να δημιουργήσει μια εικόνα της Γέννησης της Αφροδίτης του Μποτιτσέλι. Προσέφερε ένα αντίγραφο, αλλά πιο ατημέλητο. Αυτά τα πρόσωπα! Αυτά τα χέρια! Ωστόσο, υπάρχει η επιλογή να αναφέρετε ένα νομικό ζήτημα και να δίνετε σε κάθε εικόνα έναν αντίχειρα προς τα πάνω ή προς τα κάτω.
Στον απόηχο της Deepfakes της Taylor Swift, η Google είπε ότι επιδιώκει να περιορίσει το “βίαιο, προσβλητικό ή σεξουαλικό περιεχόμενο” και εφαρμόζει φίλτρα για να αποφύγει τη δημιουργία εικόνων επώνυμων ατόμων. Πράγματι, αρνήθηκε να δημιουργήσει μια εικόνα των στρατιωτών του Super Bowl, Patrick Mahomes και Brock Purdy, να κάνουν ένα πικνίκ ή ένα της Beyonce στην τράπεζα.
«Θα συνεχίσουμε να επενδύουμε σε νέες τεχνικές για τη βελτίωση της προστασίας της ασφάλειας και της ιδιωτικής ζωής των μοντέλων μας», έγραψε ο Krawczyk.
Όταν ζήτησα από τον Bard να δημιουργήσει μια εικόνα της Lisa Lacy στη δουλειά, ο Bard είπε ότι δεν είχε αρκετές πληροφορίες για αυτό το άτομο για να βοηθήσει. Ωστόσο, ήταν σε θέση να δημιουργήσει μια εικόνα για το πιο γενικό ερώτημα ενός δημοσιογράφου στη δουλειά — με όχι ένα αλλά δύο σάντουιτς στο γραφείο του.
Αρνήθηκε να δημιουργήσει μια εικόνα ενός άνδρα που πετάει ένα νόμισμα από το φράγμα Χούβερ, καθώς «απαγορεύεται η ρίψη αντικειμένων στο φράγμα Χούβερ». (Προσφέρθηκε να δημιουργήσει μια εικόνα μιας γραφικής θέας ή μιας ιστορικής απεικόνισης.)
Και ο Μπαρντ δημιουργούσε με χαρά εικόνες ιστορικών στιγμών όπως η υπογραφή της Διακήρυξης της Ανεξαρτησίας.
Εκτός από την προσθήκη του εργαλείου δημιουργίας εικόνων, η Google επεκτείνει τη διαθεσιμότητα του Gemini Pro στο Bard από τα αγγλικά σε περισσότερες από 40 γλώσσες. Αυτό περιλαμβάνει τη δυνατότητα διπλού ελέγχου, η οποία επιτρέπει στους χρήστες να ελέγχουν τις απαντήσεις του Bard με περιεχόμενο ιστού.
Αυτό θα βοηθήσει το εργαλείο να επεκταθεί σε περισσότερες από 230 χώρες και εδάφη, σύμφωνα με την ανάρτηση.
Η Google πρόσθεσε για πρώτη φορά το Gemini Pro στο Bard τον Δεκέμβριο του 2023, για να του δώσει “πιο προηγμένες ικανότητες κατανόησης, συλλογισμού, σύνοψης και κωδικοποίησης”.
Σημείωση των συντακτών: Το CNET χρησιμοποιεί μια μηχανή τεχνητής νοημοσύνης για να βοηθήσει στη δημιουργία ορισμένων ιστοριών. Για περισσότερα, βλ αυτή η ανάρτηση.