Μέχρι σήμερα, οι πιο ευρέως χρησιμοποιούμενοι βοηθοί σάς επιτρέπουν να αλληλεπιδράτε με τηλέφωνα μέσω φωνητικών εντολών. Η χρησιμότητα της δυνατότητας χρήσης της κινητής συσκευής σας hands-free είναι προφανής.
9to5Google έχει ένα επανεκκίνηση του ενημερωτικού δελτίου που αναδεικνύει τις μεγαλύτερες ιστορίες Google με πρόσθετο σχολιασμό και άλλα στοιχεία. Εγγραφείτε εδώ!
Για την Google, η κορυφαία επένδυσή της σε αυτόν τον τομέα ήταν ο νέος Βοηθός Google το 2019 που έκανε το ντεμπούτο του στο Pixel 4. Ο στόχος της Google ήταν να “σας αφήσει να χειρίζεστε άμεσα το τηλέφωνό σας με τη φωνή σας, να κάνετε πολλές εργασίες σε όλες τις εφαρμογές και να ολοκληρώσετε σύνθετες ενέργειες, όλα σχεδόν με μηδενική καθυστέρηση».
Με τη φωνητική επεξεργασία στη συσκευή να οδηγεί αυτόν τον βοηθό, η εταιρεία δήλωσε με τόλμη ότι «το πάτημα για να χειριστείτε το τηλέφωνό σας θα φαινόταν σχεδόν αργό».
Δυστυχώς, η εμπειρία – που εξακολουθεί να υπάρχει στα τηλέφωνα Pixel σήμερα – απαιτούσε από τους χρήστες να τηρούν συγκεκριμένες φράσεις αντί να τους αφήνουν να μιλάνε φυσικά και να διακρίνουν αυτόματα την πρόθεση. Εν τω μεταξύ, οι πιθανές ενέργειες ήταν πολύ περιορισμένες και δεν λειτουργούσαν με πολλές εφαρμογές.
Siri στο iOS 18 με την Apple Intelligence, η Apple Intelligence κάνει άλλη μια μαχαιριά σε αυτό, με τα μεγάλα γλωσσικά μοντέλα (LLM) να είναι πιθανώς το κλειδί για έναν φωνητικό βοηθό που μπορεί να χρησιμοποιήσει οποιαδήποτε εφαρμογή στο τηλέφωνό σας.
Η Google ήταν ερευνώντας το ίδιο πράγμα, και θα μπορούσε κάλλιστα ακόμα να δημιουργήσει ένα. Ωστόσο, μετά το I/O 2024, δεν νομίζω ότι αυτή είναι πλέον η προτεραιότητα της εταιρείας.
Αντίθετα, η Google θέλει τελικά να δημιουργήσει έναν βοηθό τεχνητής νοημοσύνης που θα σας βοηθά στη φυσική σφαίρα. Η ιδέα είναι ότι οι περισσότερες από τις ερωτήσεις και τα προβλήματά σας εξακολουθούν να συμβαίνουν στον πραγματικό κόσμο χωρίς ψηφιακό ισοδύναμο.
Ο πυρήνας σε αυτό είναι να μπορείτε να στρέφετε το τηλέφωνό σας (ή τα έξυπνα γυαλιά στο μέλλον) σε κάτι και να ζητάτε περισσότερες πληροφορίες ή βοήθεια.
Αυτό παρουσίασε η Google με το Project Astra, το οποίο θα έρθει στη διαδραστική εμπειρία Gemini Live που σας επιτρέπει να έχετε μια φυσική αμφίδρομη συνομιλία. Το Going Live with Gemini αναμένεται να φτάσει φέτος, με τη φωνητική πτυχή να ξεκινά πρώτα και μετά τις δυνατότητες της κάμερας.
Εν τω μεταξύ, πολλές από τις πληροφορίες σας αποθηκεύονται ως εικόνες και βίντεο. Οι Δίδυμοι με δύναμη Ρωτήστε Φωτογραφίες που μετατρέπει τη βιβλιοθήκη σας σε ένα σύνολο των γνώσεών σας στον πραγματικό κόσμο που μπορεί να χρησιμοποιήσει η Google για να σας βοηθήσει.
Η λήψη μιας φωτογραφίας πληροφοριών στον πραγματικό κόσμο και η οργάνωση της Google είναι πραγματικά εξοικονόμηση χρόνου και εγγενώς βοηθητική. Ένα από τα αγαπημένα μου παραδείγματα από το I/O είναι κάτι που δεν είναι ιδιαίτερα εντυπωσιακό. Έρχονται οι επεκτάσεις Google Calendar, Keep και Tasks Gemini:
…θα μπορείτε να κάνετε πράγματα όπως να τραβήξετε μια φωτογραφία του σχολικού προγράμματος του παιδιού σας και να ζητήσετε από τον Δίδυμο να δημιουργήσει μια καταχώριση ημερολογίου για κάθε εργασία ή να τραβήξετε μια φωτογραφία μιας νέας συνταγής και να την προσθέσετε στη λίστα αγορών Keep σας.
Το Gemini Advanced αποκτά επίσης έναν καθηλωτικό ταξιδιωτικό σχεδιασμό, ενώ το παράδειγμα μιας πρακτορικής εμπειρίας που επέλεξε η Google ξεκίνησε με τη λήψη μιας φωτογραφίας ενός παπουτσιού που αγοράσατε για να ξεκινήσει η διαδικασία επιστροφής. Ο άλλος ανέθεσε στους Διδύμους να σας βοηθήσουν να μετακομίσετε σε μια νέα πόλη και να κάνετε όλες τις απαραίτητες αλλαγές.
Κάτι που μπορεί να σας βοηθήσει να περιηγηθείτε στον κόσμο σίγουρα φαίνεται πιο φανταχτερό και εντυπωσιακό από έναν βοηθό που μπορεί να διασχίσει το τηλέφωνό σας, κάτι που θα μπορούσε κάλλιστα να είναι η Google που εργάζονται για. Οι χρήστες Android μπορεί να προτιμούν έναν ανανεωμένο βοηθό τηλεφώνου και μένει να δούμε πόσο χρήσιμο είναι κάτι σαν το Astra, αλλά δεν μπορείτε να κατηγορήσετε την Google ότι δεν ταλαντεύεται για τα αστέρια.
Ο δηλωμένος στόχος του Project Astra είναι να δημιουργήσει έναν «καθολικό πράκτορα AI που μπορεί να είναι πραγματικά χρήσιμος στην καθημερινή ζωή». Η είσοδος κάμερας που παρέχει μια ζωντανή προβολή στον κόσμο λύνει πραγματικά ένα πρόβλημα που προέκυψε από την αρχή της Google: ορισμένες ερωτήσεις και τα πραγματικά περιβάλλοντά τους δεν μπορούν εύκολα να εκφραστούν με λέξεις για ένα ερώτημα κειμένου.
FTC: Χρησιμοποιούμε συνδέσμους θυγατρικών που κερδίζουν αυτόματα εισόδημα. Περισσότερο.