Στο τέλος του I/O, του ετήσιου συνεδρίου προγραμματιστών της Google στο Shoreline Amphitheatre στο Mountain View, ο CEO της Google, Sundar Pichai, αποκάλυψε ότι η εταιρεία είχε πει “AI” 121 φορές. Αυτό, ουσιαστικά, ήταν το επίκεντρο της δίωρης ομιλίας της Google – πλήρωση της τεχνητής νοημοσύνης σε κάθε εφαρμογή και υπηρεσία της Google που χρησιμοποιείται από περισσότερους από δύο δισεκατομμύρια ανθρώπους σε όλο τον κόσμο. Ακολουθούν όλες οι σημαντικές ενημερώσεις από τη μεγάλη εκδήλωση της Google, μαζί με ορισμένες πρόσθετες ανακοινώσεις που ήρθαν μετά την κεντρική ομιλία.
Gemini 1.5 Flash και ενημερώσεις στο Gemini 1.5 Pro
Google ανακοινώθηκε ένα ολοκαίνουργιο μοντέλο AI που ονομάζεται Gemini 1.5 Flash, το οποίο λέει ότι είναι βελτιστοποιημένο για ταχύτητα και αποτελεσματικότητα. Το Flash βρίσκεται ανάμεσα στο Gemini 1.5 Pro και το Gemini 1.5 Nano, το οποίο είναι το μικρότερο μοντέλο της εταιρείας που εκτελείται τοπικά στη συσκευή. Η Google είπε ότι δημιούργησε το Flash επειδή οι προγραμματιστές ήθελαν ένα ελαφρύτερο και λιγότερο ακριβό μοντέλο από το Gemini Pro για τη δημιουργία εφαρμογών και υπηρεσιών με τεχνητή νοημοσύνη, διατηρώντας παράλληλα ορισμένα πράγματα όπως ένα μακρύ παράθυρο περιβάλλοντος με ένα εκατομμύριο διακριτικά που διαφοροποιεί το Gemini Pro από τα ανταγωνιστικά μοντέλα. Αργότερα φέτος, η Google θα διπλασιάσει το παράθυρο περιβάλλοντος του Gemini σε δύο εκατομμύρια διακριτικά, πράγμα που σημαίνει ότι θα μπορεί να επεξεργάζεται δύο ώρες βίντεο, 22 ώρες ήχου, περισσότερες από 60.000 γραμμές κώδικα ή περισσότερες από 1,4 εκατομμύρια λέξεις ταυτόχρονα .
Έργο Astra
Google έκανε επίδειξη Το Project Astra, μια πρώιμη έκδοση ενός καθολικού βοηθού που τροφοδοτείται από τεχνητή νοημοσύνη που ο CEO της Google DeepMind Demis Hassabis είπε ότι ήταν η έκδοση της Google για έναν πράκτορα AI «που μπορεί να είναι χρήσιμος στην καθημερινή ζωή».
Σε ένα βίντεο που η Google λέει ότι τραβήχτηκε με μία λήψη, ένας χρήστης του Astra κινείται στα γραφεία της Google στο Λονδίνο κρατώντας ψηλά το τηλέφωνό του και στρέφοντας την κάμερα σε διάφορα πράγματα – ένα ηχείο, κάποιο κωδικό σε έναν πίνακα και έξω από ένα παράθυρο – και έχει ένα φυσική συζήτηση με την εφαρμογή για το τι φαίνεται. Σε μια από τις πιο εντυπωσιακές στιγμές του βίντεο, η χρήστης λέει σωστά πού άφησε τα γυαλιά της πριν, χωρίς ο χρήστης να έχει σηκώσει ποτέ τα γυαλιά.
Το βίντεο τελειώνει με μια ανατροπή — όταν ο χρήστης βρει και φοράει τα γυαλιά που λείπουν, μαθαίνουμε ότι έχει ενσωματωμένο σύστημα κάμερας και είναι σε θέση να χρησιμοποιούν το Project Astra για να συνεχίσουν απρόσκοπτα μια συνομιλία με τον χρήστη, υποδεικνύοντας ίσως ότι η Google μπορεί να εργάζεται σε έναν ανταγωνιστή των έξυπνων γυαλιών Ray Ban της Meta.
Ρωτήστε το Google Photos
Το Google Photos ήταν ήδη έξυπνο όταν επρόκειτο να αναζητήσει συγκεκριμένες εικόνες ή βίντεο, αλλά με την τεχνητή νοημοσύνη, η Google πηγαίνει τα πράγματα στο επόμενο επίπεδο. Εάν είστε συνδρομητής του Google One στις ΗΠΑ, θα μπορείτε να θέσετε στο Google Photos μια περίπλοκη ερώτηση όπως “δείξε μου την καλύτερη φωτογραφία από κάθε εθνικό πάρκο που έχω επισκεφτεί”, όταν η λειτουργία κυκλοφορήσει τους επόμενους μήνες. Το Google Photos θα χρησιμοποιήσει τις πληροφορίες GPS καθώς και τη δική του κρίση για το τι είναι «καλύτερο» για να σας παρουσιάσει επιλογές. Μπορείτε επίσης να ζητήσετε από το Google Photos να δημιουργήσει υπότιτλους για να δημοσιεύσετε τις φωτογραφίες στα μέσα κοινωνικής δικτύωσης.
Veo και Imagen 3
Οι νέες μηχανές δημιουργίας πολυμέσων της Google που λειτουργούν με τεχνητή νοημοσύνη ονομάζονται Veo και Imagen 3. Το Veo είναι η απάντηση της Google στο Sora του OpenAI. Μπορεί να παράγει βίντεο «υψηλής ποιότητας» 1080p που μπορούν να διαρκέσουν «πάνω από ένα λεπτό», είπε η Google, και μπορεί να κατανοήσει κινηματογραφικές έννοιες όπως ένα timelapse.
Το Imagen 3, εν τω μεταξύ, είναι μια συσκευή δημιουργίας κειμένου σε εικόνα που η Google ισχυρίζεται ότι χειρίζεται το κείμενο καλύτερα από την προηγούμενη έκδοσή της, την Imagen 2. Το αποτέλεσμα είναι το υψηλότερης ποιότητας μοντέλο κειμένου σε εικόνα της εταιρείας με “απίστευτο επίπεδο λεπτομέρειας” για ” φωτορεαλιστικές, ρεαλιστικές εικόνες» και λιγότερα τεχνουργήματα — ουσιαστικά αντιπαραθέτοντας το DALLE-3 του OpenAI.
Μεγάλες ενημερώσεις στην Αναζήτηση Google
Η Google είναι κάνοντας μεγάλες αλλαγές για το πώς λειτουργεί βασικά η Αναζήτηση. Οι περισσότερες ενημερώσεις που ανακοινώθηκαν σήμερα, όπως η δυνατότητα να κάνετε πολύ περίπλοκες ερωτήσεις («Βρείτε τα καλύτερα στούντιο γιόγκα ή πιλάτες στη Βοστώνη και δείτε λεπτομέρειες για τις εισαγωγικές προσφορές τους και τον χρόνο περπάτημα από το Beacon Hill.») και η χρήση της Αναζήτησης για τον προγραμματισμό γευμάτων και διακοπών κέρδισε Δεν θα είναι διαθέσιμο εκτός και αν επιλέξετε να συμμετέχετε στο Search Labs, την πλατφόρμα της εταιρείας που επιτρέπει στους χρήστες να δοκιμάσουν πειραματικές λειτουργίες.
Ωστόσο, ένα μεγάλο νέο χαρακτηριστικό που η Google αποκαλεί AI Overviews και το οποίο η εταιρεία δοκιμάζει εδώ και ένα χρόνο, τελικά κυκλοφορεί σε εκατομμύρια ανθρώπους στις ΗΠΑ. Η Αναζήτηση Google θα παρουσιάζει πλέον απαντήσεις που δημιουργούνται από AI πάνω από τα αποτελέσματα από προεπιλογή και η εταιρεία λέει ότι θα φέρει τη δυνατότητα σε περισσότερους από ένα δισεκατομμύριο χρήστες σε όλο τον κόσμο μέχρι το τέλος του έτους.
Gemini στο Android
Η Google είναι ενσωματώνοντας τους Διδύμους απευθείας στο Android. Όταν το Android 15 κυκλοφορήσει αργότερα φέτος, το Gemini θα γνωρίζει την εφαρμογή, την εικόνα ή το βίντεο που εκτελείτε και θα μπορείτε να το εμφανίσετε ως επικάλυψη και να του κάνετε ερωτήσεις σχετικά με το πλαίσιο. Πού αφήνει αυτό το Google Assistant που το κάνει ήδη αυτό; Ποιός ξέρει! Η Google δεν το ανέφερε καθόλου κατά τη σημερινή κεντρική ομιλία.
Βελτιώσεις στη διάρκεια ζωής της μπαταρίας WearOS 5
Η Google δεν είναι έτοιμη να κυκλοφορήσει την πιο πρόσφατη έκδοση του λειτουργικού της smartwatch, αλλά υπόσχεται κάποιες σημαντικές βελτιώσεις στη διάρκεια ζωής της μπαταρίας όταν έρθει. Η εταιρεία είπε ότι το Wear OS 5 θα καταναλώνουν 20 τοις εκατό λιγότερη ενέργεια από το Wear OS 4 εάν ένας χρήστης τρέξει μαραθώνιο. Το Wear OS 4 έφερε ήδη βελτιώσεις στη διάρκεια ζωής της μπαταρίας σε smartwatches που το υποστηρίζουν, αλλά θα μπορούσε να είναι πολύ καλύτερο στη διαχείριση της ισχύος μιας συσκευής. Η Google παρείχε επίσης στους προγραμματιστές έναν νέο οδηγό σχετικά με τον τρόπο εξοικονόμησης ενέργειας και μπαταρίας, ώστε να μπορούν να δημιουργούν πιο αποτελεσματικές εφαρμογές.
Αντικλεπτικά χαρακτηριστικά Android 15
Η προεπισκόπηση προγραμματιστή του Android 15 μπορεί να κυκλοφορεί εδώ και μήνες, αλλά υπάρχουν ακόμα λειτουργίες που έρχονται. Κλείδωμα ανίχνευσης κλοπής είναι μια νέα δυνατότητα Android 15 που θα χρησιμοποιεί AI (εκεί είναι πάλι) για να προβλέψει κλοπές τηλεφώνου και να κλειδώσει τα πράγματα ανάλογα. Η Google λέει ότι οι αλγόριθμοί της μπορούν να ανιχνεύσουν κινήσεις που σχετίζονται με κλοπή, όπως αυτές που σχετίζονται με την αρπαγή του τηλεφώνου και το κλείσιμο, την ποδηλασία ή την οδήγηση. Εάν ένα ακουστικό Android 15 εντοπίσει μία από αυτές τις καταστάσεις, η οθόνη του τηλεφώνου θα κλειδώσει γρήγορα, καθιστώντας πολύ πιο δύσκολη την πρόσβαση στα δεδομένα σας από τον αρπαστή τηλεφώνου.
Υπήρχαν επίσης ένα σωρό άλλες ενημερώσεις. Η Google είπε ότι θα προσθέσει ψηφιακά υδατογραφήματα σε βίντεο και κείμενο που δημιουργείται από AI, κάνουν τους Διδύμους προσβάσιμους στον πλαϊνό πίνακα στο Gmail και στα Έγγραφα, power a εικονικός συμπαίκτης AI στο Workspace, ακούστε τις τηλεφωνικές κλήσεις και εντοπίστε αν σας απατούν σε πραγματικό χρόνο, και πολλά άλλα.
Ενημερωθείτε για όλα τα νέα από το Google I/O 2024 σωστά εδώ!
Ενημέρωση 15 Μαΐου, 14:45 ET: Αυτή η ιστορία ενημερώθηκε μετά τη δημοσίευσή της για να περιλαμβάνει λεπτομέρειες σχετικά με τις νέες ανακοινώσεις Android 15 και WearOS 5 που έγιναν μετά την κεντρική ομιλία I/O 2024.