Ορισμένοι τεχνολογικοί γίγαντες, συμπεριλαμβανομένων μήλοεκπαιδευμένο Όλα συμπεριλαμβάνονται μοντέλα επάνω YouTube βίντεο χωρίς τη συγκατάθεση των δημιουργών, σύμφωνα με ένα νέο ρεπορτάζ σήμερα.
Αυτό το έκαναν χρησιμοποιώντας αρχεία υποτίτλων που κατέβασε τρίτος από περισσότερα από 170.000 βίντεο. Οι δημιουργοί που επηρεάζονται περιλαμβάνουν τον τεχνικό κριτικό Marquees Brownlee (MKBHD), τον MrBeast, τον PewDiePie, τον Stephen Colbert, τον John Oliver και τον Jimmy Kimmel…
Τα αρχεία υποτίτλων είναι ουσιαστικά μεταγραφές του περιεχομένου βίντεο.
Ενσύρματο Αναφορές.
Μια έρευνα από το Proof News διαπίστωσε ότι μερικές από τις πιο πλούσιες εταιρείες τεχνητής νοημοσύνης στον κόσμο έχουν χρησιμοποιήσει υλικό από χιλιάδες βίντεο στο YouTube για να εκπαιδεύσουν την τεχνητή νοημοσύνη. Οι εταιρείες το έκαναν παρά τους κανόνες του YouTube κατά της συγκομιδής υλικών από την πλατφόρμα χωρίς άδεια.
Η έρευνά μας διαπίστωσε ότι οι υπότιτλοι από 173.536 βίντεο του YouTube, που λήφθηκαν από περισσότερα από 48.000 κανάλια, χρησιμοποιήθηκαν από βαριές εταιρείες της Silicon Valley, συμπεριλαμβανομένων των Anthropic, Nvidia, Apple και Salesforce.
Οι λήψεις φέρεται να πραγματοποιήθηκαν από έναν μη κερδοσκοπικό οργανισμό που ονομάζεται EleutherAI, ο οποίος λέει ότι βοηθά τους προγραμματιστές να εκπαιδεύουν μοντέλα τεχνητής νοημοσύνης. Αν και ο στόχος φαίνεται να ήταν η παροχή εκπαιδευτικού υλικού σε μικρούς προγραμματιστές και ακαδημαϊκούς, το σύνολο δεδομένων έχει επίσης χρησιμοποιηθεί από αρκετούς τεχνολογικούς γίγαντες, συμπεριλαμβανομένης της Apple.
Σύμφωνα με μια ερευνητική εργασία που δημοσιεύτηκε από την EleutherAI, το σύνολο δεδομένων είναι μέρος μιας συλλογής που κυκλοφόρησε ο μη κερδοσκοπικός οργανισμός και ονομάζεται Pile […]
Τα περισσότερα από τα σύνολα δεδομένων του Pile είναι προσβάσιμα και ανοιχτά για οποιονδήποτε στο διαδίκτυο διαθέτει αρκετό χώρο και υπολογιστική ισχύ για πρόσβαση σε αυτά. Ακαδημαϊκοί και άλλοι προγραμματιστές εκτός της Big Tech χρησιμοποίησαν το σύνολο δεδομένων, αλλά δεν ήταν οι μόνοι.
Η Apple, η Nvidia και η Salesforce—εταιρείες που αποτιμώνται σε εκατοντάδες δισεκατομμύρια και τρισεκατομμύρια δολάρια— περιγράφουν στις ερευνητικές τους εργασίες και αναρτήσεις πώς χρησιμοποίησαν το Pile για να εκπαιδεύσουν την τεχνητή νοημοσύνη. Έγγραφα δείχνουν επίσης ότι η Apple χρησιμοποίησε το Pile για να εκπαιδεύσει το OpenELM, ένα μοντέλο υψηλού προφίλ που κυκλοφόρησε τον Απρίλιο, εβδομάδες πριν η εταιρεία αποκαλύψει ότι θα προσθέσει νέες δυνατότητες AI σε iPhone και MacBook.
Ενσύρματο λέει ότι η Apple δεν είχε απαντήσει σε αίτημα για σχολιασμό τη στιγμή της σύνταξης.
9to5Mac’s Take
Είναι σημαντικό να τονίσουμε εδώ ότι η Apple δεν κατέβασε η ίδια τα δεδομένα, αλλά αυτό έγινε από την EleutherAI. Είναι αυτός ο οργανισμός που φαίνεται να έχει παραβιάσει τους όρους και τις προϋποθέσεις του YouTube.
Παρόλα αυτά, ενώ η Apple και οι άλλες εταιρείες που κατονομάζονται πιθανότατα χρησιμοποίησαν ένα δημοσίως διαθέσιμο σύνολο δεδομένων με καλή πίστη, είναι μια καλή απεικόνιση του νομικού ναρκοπεδίου που δημιουργήθηκε με το ξύσιμο του ιστού για την εκπαίδευση συστημάτων AI. Υπήρξαν πολλά παραδείγματα συστημάτων τεχνητής νοημοσύνης που λογοκλοπή ολόκληρων παραγράφων κειμένου όταν ρωτήθηκαν για εξειδικευμένα θέματα και οι κίνδυνοι χρήσης υλικού χωρίς άδεια αυξάνονται μόνο όταν οι εταιρείες χρησιμοποιούν σύνολα δεδομένων που έχουν συγκεντρωθεί από τρίτους.
Επικοινωνήσαμε με την Apple για σχόλια και θα ενημερώσουμε με οποιαδήποτε απάντηση.
Σκηνογραφία: MKBHD
FTC: Χρησιμοποιούμε συνδέσμους θυγατρικών που κερδίζουν αυτόματα εισόδημα. Περισσότερο.