Ένα χαρακτηριστικό που προστέθηκε στο AI Copilot της Microsoft στο πρόγραμμα περιήγησης Edge αυτή την εβδομάδα είναι το δυνατότητα δημιουργίας περιλήψεων κειμένου βίντεο. Ωστόσο, η δυνατότητα εξοικονόμησης χρόνου του Edge Copilot εξακολουθεί να είναι αρκετά περιορισμένη και λειτουργεί μόνο σε προεπεξεργασμένα βίντεο ή σε αυτά με υπότιτλους, όπως εξήγησε ο Mikhail Parakhin, Διευθύνων Σύμβουλος διαφημίσεων και υπηρεσιών web της Microsoft.
Οπως και έχων στίγματα με MSPowerUser, Parakhin γράφει, «Για να λειτουργήσει, πρέπει να επεξεργαστούμε εκ των προτέρων το βίντεο. Εάν το βίντεο έχει υπότιτλους – μπορούμε πάντα να το κάνουμε εναλλακτικό, αν δεν έχει και δεν το προεπεξεργάσαμε ακόμα – τότε δεν θα λειτουργήσει», απαντώντας σε ερώτηση.
Με άλλα λόγια, από μόνο του το Edge Copilot δεν συνοψίζει τόσο πολλά Βίντεο καθώς συνοψίζει τις μεταγραφές κειμένου των βίντεο. Το Copilot μπορεί επίσης να εκτελέσει μια παρόμοια λειτουργία σε όλο το Microsoft 365, συμπεριλαμβανομένης της σύνοψης του βίντεο Teams συναντήσεις και κλήσεις για πράκτορες εξυπηρέτησης πελατών — και στις δύο περιπτώσεις, ο ήχος πρέπει να είναι μεταγραφεί πρώτα από τη Microsoft. Το Copilot στο Microsoft Stream μπορεί επίσης να συνοψίσει οποιοδήποτε βίντεο, αλλά και πάλι, απαιτεί από τους χρήστες να το κάνουν παράγω γραπτή μεταγραφή.
Η συζήτηση ξεκίνησε μετά τον σχεδιαστή Pietro Schirano αναρτήθηκε μια εγγραφή οθόνης του Edge Copilot που συνοψίζει ένα βίντεο YouTube σχετικά ο GTA VI τροχόσπιτο. Σε αυτή την περίπτωση, το Copilot φάνηκε να κάνει τέλεια τη δουλειά του. Ο χρήστης στην ηχογράφηση πατά το κουμπί “Δημιουργία σύνοψης βίντεο” στην πλαϊνή γραμμή του Copilot και λίγα δευτερόλεπτα αργότερα, το Copilot βγάζει ένα, με επισημάνσεις και χρονικές σημάνσεις.
Φυσικά, πολλές πλατφόρμες, συμπεριλαμβανομένων των YouTube και Vimeo, μπορούν να δημιουργήσουν αυτόματα μεταγραφές και υπότιτλους — εάν οι χρήστες ενεργοποιήσουν τη λειτουργία. Μετά Το χείλος ρώτησε τον Parakhin στο X εάν θα μπορούσαμε να υποθέσουμε ότι τα περισσότερα δημόσια διαθέσιμα βίντεο (π.χ. YouTube) δεν ήταν προεπεξεργασμένα. απάντησε: “Θα πρέπει να λειτουργεί για τα περισσότερα βίντεο.”
Το Copilot είναι απλώς το πιο πρόσφατο παράδειγμα του γενεσιουργού αγώνα τεχνητής νοημοσύνης που η Microsoft ανταγωνίζεται την Google (και άλλους). Τον περασμένο μήνα, η Google αναβάθμισε το επέκταση YouTube για το chatbot Bard που του επιτρέπει να συνοψίζει το περιεχόμενο ενός βίντεο και να εμφανίζει συγκεκριμένες πληροφορίες από αυτό. Μόλις αυτή την εβδομάδα, η Google ανακοίνωσε μια σημαντική ενημέρωση Gemini που έχει τα δικά της προβλήματα — η επεξεργασία της εταιρείας μπορεί να έχει παραποιημένα ορισμένες από τις δυνατότητες του AI σε ένα demo, και δεν συμβαίνει πάντα έχει τα δεδομένα του.
Ο Parakhin ήταν ειλικρινής σχετικά με τα διάφορα στάδια της εξέλιξης του Copilot στα μέσα κοινωνικής δικτύωσης. Ενώ βρισκόταν σε αεροπλάνο το πρωί της Τρίτης, ο ειδικός στη μηχανική μάθηση δημοσίευσε στο X: «Προσθήκη ικανότητας για τον Edge Copilot να χρησιμοποιεί πληροφορίες σε βίντεο – σε μια πτήση».