«Υπάρχουν κάποιες αποφάσεις που δεν πρέπει ποτέ να τις χρησιμοποιήσετε για να πάρετε», είπε ο Lehmann, καθηγητής δικτύων και επιστήμης πολυπλοκότητας στο Τεχνικό Πανεπιστήμιο της Δανίας και πρώην μεταδιδακτορικός συνεργάτης στα πανεπιστήμια Northeastern και Harvard.
Το Life2vec είναι ένα “μεγάλο μοντέλο γλώσσας” AI που βασίζεται στις ίδιες αρχές με το ChatGPT. Αυτός ο τύπος τεχνητής νοημοσύνης μπορεί να επεξεργαστεί τεράστιες ποσότητες δεδομένων και να εξάγει μοτίβα συμπεριφοράς που είναι αόρατα στους ανθρώπους ή σε λιγότερο εξελιγμένο λογισμικό.
Το Life2vec εκπαιδεύτηκε σε μια τεράστια βάση δεδομένων που διατηρεί η Statistics Denmark, μια υπηρεσία χρηματοδοτούμενη από την κυβέρνηση που περιέχει λεπτομερείς πληροφορίες για 6 εκατομμύρια πολίτες. Η πρόσβαση στα δεδομένα ελέγχεται αυστηρά για λόγους απορρήτου, επομένως ο Lehmann και οι συνάδελφοί του χρειάζονταν ειδική άδεια για τη χρήση το.
Οι πληροφορίες περιελάμβαναν διευθύνσεις κατοικίας και εργασίας, σχολικά αρχεία, ιατρικά αρχεία, οικογενειακή κατάσταση και δεδομένα καριέρας και εισοδήματος. Περιλάμβανε επίσης τα αποτελέσματα των τεστ προσωπικότητας και κοινωνικής συμπεριφοράς που έκαναν χιλιάδες Δανοί. Η ερευνητική ομάδα εξέτασε δεδομένα πολιτών που συλλέχθηκαν μεταξύ 2008 και 2015.
«Τώρα ζούμε σε μια εποχή όπου μπορούμε να δούμε όλα τα δεδομένα ταυτόχρονα», είπε ο καθηγητής επιστήμης υπολογιστών Northeastern. Τίνα Ηλιάση-Ραντ, συν-συγγραφέας της εφημερίδας. «Σημαίνει ότι μπορείς να δώσεις προσοχή και να μάθεις συσχετισμούς ανάμεσα σε κάθε κομμάτι δεδομένων που έχουμε».
Οι ερευνητές δοκίμασαν τις προγνωστικές ικανότητες του Life2vec επιλέγοντας 100.000 άτομα από την εκπαίδευση βάση δεδομένων. Περίπου 30.000 από αυτούς που επιλέχθηκαν είχαν πεθάνει μεταξύ 2016 και 2020, μετά την περίοδο εκπαίδευσης. Για να γίνει πιο δύσκολη η πρόβλεψη της διάρκειας ζωής των ανθρώπων, και οι 100.000 ήταν μεταξύ 35 και 65 ετών, επειδή σχετικά λίγοι άνθρωποι σε αυτό το ηλικιακό εύρος θα πέθαιναν τα επόμενα τέσσερα χρόνια. Ωστόσο, όταν του ζητήθηκε να επιλέξει ποιος από αυτούς είχε ζήσει και ποιος είχε πεθάνει, ο υπολογιστής το έκανε σωστά σχεδόν στο 79 τοις εκατό των περιπτώσεων.
Ο Eliassi-Rad και ο Lehmann δεν είναι σίγουροι πώς το AI θα μπορούσε να το καταλάβει αυτό. Διαπίστωσαν ότι ακόμη και όταν το Life2vec δεν έλαβε υπόψη τα ιατρικά αρχεία, ήταν αρκετά ακριβές στην πρόβλεψη της θνησιμότητας. Αυτό υποδηλώνει ότι η τεχνητή νοημοσύνη βασίζεται σε άλλους παράγοντες που επηρεάζουν τη διάρκεια ζωής, όπως η επιλογή της καριέρας ενός ατόμου.
Η Lehmann είπε ότι επειδή η τεχνητή νοημοσύνη είναι κατασκευασμένη με λεπτομερείς πληροφορίες για εκατομμύρια ανθρώπους, οι ερευνητές θα μπορούσαν να χρησιμοποιήσουν τις εκτιμήσεις θνησιμότητας για να βρουν τις καλύτερες συμπεριφορές για καλή υγεία. Για παράδειγμα, θα μπορούσαν να ξεχωρίσουν όλους τους 40χρονους που πέθαναν νωρίς και να ρωτήσουν το σύστημα για το τι κοινό είχαν.
Το Life2vec δοκιμάστηκε επίσης σε κάτι πολύ πιο υποκειμενικό και λεπτό: Θα μπορούσε να προβλέψει εάν ένα άτομο θεωρούσε τον εαυτό του εξωστρεφή; Οι επιστήμονες συνέκριναν τις προβλέψεις με δεδομένα από χιλιάδες Δανούς που έκαναν αυτο-χορηγούμενα τεστ προσωπικότητας και διαπίστωσαν ότι το Life2vec ήταν σταθερά σε θέση να προβλέψει εάν ένα άτομο ήταν εσωστρεφές ή εξωστρεφές. Η Lehmann πιστεύει ότι η τεχνητή νοημοσύνη το υπολογίζει με βάση τις επαγγελματικές επιλογές του ατόμου και τις οικογενειακές σχέσεις.
«Οι εξωστρεφείς άνθρωποι τείνουν να ζουν εξωστρεφείς ζωές», είπε.
Σε μια τελική δοκιμή, ζητήθηκε από το Life2vec να προβλέψει εάν συγκεκριμένα άτομα στη βάση δεδομένων θα μεταναστεύσουν σε άλλη χώρα τα επόμενα τέσσερα χρόνια. Όταν οι απαντήσεις του ελέγχθηκαν σε σχέση με τις κρατικές στατιστικές μετανάστευσης, το σύστημα τεχνητής νοημοσύνης αποδείχθηκε σωστό περίπου στο 73 τοις εκατό των περιπτώσεων.
Μια σημαντική προειδοποίηση: Το Life2vec δεν θα παράγει αξιόπιστα αποτελέσματα για άτομα που ζουν στις Ηνωμένες Πολιτείες ή σε οποιαδήποτε άλλη χώρα εκτός από τη Δανία. Έχει εκπαιδευτεί στα προσωπικά δεδομένα των Δανών, οι οποίοι πιθανώς ζουν διαφορετικά από τους ανθρώπους αλλού. Επομένως, μια έκδοση των ΗΠΑ θα πρέπει να βασίζεται σε δεδομένα που συλλέγονται από κατοίκους των ΗΠΑ.
Αυτό μπορεί να συμβαίνει ήδη, είπε ο Lehmann. Το ίδιο είδος δεδομένων που αποθηκεύονται από τη Στατιστική Υπηρεσία της Δανίας έχουν ήδη κατατεθεί σε αμερικανικές εταιρείες και κυβερνητικές υπηρεσίες. Μεγάλο μέρος του κατέχεται επίσης από γιγάντια κοινωνικά δίκτυα όπως το Meta. Είναι κατανοητό, αν δεν αποδειχθεί, ότι οι οργανισμοί κατασκευάζουν συστήματα τεχνητής νοημοσύνης που επιδιώκουν να προβλέψουν το μέλλον των χρηστών τους.
«Νομίζω ότι είναι αφελές να πιστεύουμε ότι δεν το κάνουν ήδη», είπε ο Lehmann.
Αυτό θα μπορούσε να είναι καλό, σύμφωνα με τον Eliassi-Rad, ο οποίος προβλέπει τη χρήση προγνωστικής τεχνητής νοημοσύνης από μελετητές και κυβερνήσεις για την αξιολόγηση του αντίκτυπου των κοινωνικών πολιτικών.
«Μπορείτε να σαρώσετε την κοινωνία σας και να δείτε πώς οι πολιτικές σας, οι νόμοι σας, επηρεάζουν τους ανθρώπους», είπε.
Για παράδειγμα, η τεχνητή νοημοσύνη μπορεί κάποια μέρα να είναι σε θέση να προβλέψει εάν ένα παιδί θα έχει προβλήματα στο σχολείο. Αυτά θα μπορούσαν να είναι καλά νέα, είπε ο Lehmann, επειδή οι γονείς και οι δάσκαλοι θα μπορούσαν να λάβουν επανορθωτική βοήθεια για το παιδί. Αλλά θα μπορούσε επίσης να κάνει κακό με το να κάνει ορισμένους γονείς ή δασκάλους να εγκαταλείψουν το παιδί.
«Αυτό είναι το είδος της συζήτησης που πρέπει να ξεκινήσουμε, γιατί αυτά τα μηχανήματα θα αρχίσουν να φτάνουν», είπε ο Lehmann.
Μπορείτε να φτάσετε στο Hiawatha Bray στη διεύθυνση hiawatha.bray@globe.com. Ακολούθα τον @GlobeTechLab.