Το Πεντάγωνο εργάζεται για την αντιμετώπιση τρωτών σημείων στα συστήματα τεχνητής νοημοσύνης του που θα μπορούσαν να εκμεταλλευτούν επιτιθέμενοι χρησιμοποιώντας οπτικά κόλπα ή χειραγωγημένα σήματα. Το ερευνητικό τους πρόγραμμα, Guaranteeing AI Robustness Against Deception (GARD), ερευνά αυτές τις «αντίπαλες επιθέσεις» από το 2022.
Οι ερευνητές έχουν δείξει πώς τα φαινομενικά ακίνδυνα μοτίβα μπορούν να ξεγελάσουν την τεχνητή νοημοσύνη σε εσφαλμένη αναγνώριση αντικειμένων, οδηγώντας δυνητικά σε καταστροφικές συνέπειες στο πεδίο της μάχης. Για παράδειγμα, μια τεχνητή νοημοσύνη θα μπορούσε να μπερδέψει ένα λεωφορείο με επιβάτες με δεξαμενή, εάν είχε επισημανθεί με τον σωστό “οπτικό θόρυβο”.
Αυτές οι ανησυχίες έρχονται εν μέσω ανησυχιών του κοινού σχετικά με την ανάπτυξη αυτόνομων όπλων από το Πεντάγωνο. Για να αντιμετωπιστεί αυτό, το Υπουργείο Άμυνας ενημέρωσε πρόσφατα τους κανόνες ανάπτυξης AI, δίνοντας έμφαση στην «υπεύθυνη συμπεριφορά» και απαιτώντας έγκριση για όλα τα αναπτυγμένα συστήματα.
Η μέτρια χρηματοδοτούμενη Πρόγραμμα GARD έχει σημειώσει πρόοδο στην ανάπτυξη άμυνας έναντι τέτοιων επιθέσεων. Έχουν παράσχει ακόμη και κάποια εργαλεία στο νεοσύστατο Υπουργείο Άμυνας του Chief Digital and AI Office (CDAO).
Ωστόσο, ορισμένες ομάδες υπεράσπισης εξακολουθούν να ανησυχούν. Ανησυχούν ότι τα όπλα με τεχνητή νοημοσύνη θα μπορούσαν να παρερμηνεύσουν καταστάσεις και να επιτεθούν χωρίς αιτία, ακόμη και χωρίς κάποιος να χειριστεί σκόπιμα τα σήματα. Υποστηρίζουν ότι τέτοια όπλα θα μπορούσαν να οδηγήσουν σε ακούσιες κλιμακώσεις, ειδικά σε τεταμένες περιοχές.
Το Πεντάγωνο εκσυγχρονίζει ενεργά το οπλοστάσιό του με αυτόνομα όπλα, υπογραμμίζοντας την επείγουσα ανάγκη αντιμετώπισης αυτών των τρωτών σημείων και διασφαλίζοντας την υπεύθυνη ανάπτυξη αυτής της τεχνολογίας.
Σύμφωνα με δήλωση του Οργανισμός Προηγμένων Ερευνητικών Προγραμμάτων Άμυναςοι ερευνητές του GARD από τις Two Six Technologies, IBM, MITRE, University of Chicago και Google Research δημιούργησαν την ακόλουθη εικονική δοκιμαστική κλίνη, εργαλειοθήκη, συγκριτικό σύνολο δεδομένων και εκπαιδευτικό υλικό που είναι πλέον διαθέσιμα στην ευρύτερη ερευνητική κοινότητα:
- ο Οπλοστάσιο Η εικονική πλατφόρμα, διαθέσιμη στο GitHub, χρησιμεύει ως «κρεβάτι δοκιμής» για ερευνητές που χρειάζονται επαναλαμβανόμενες, επεκτάσιμες και ισχυρές αξιολογήσεις των αντιπάλων άμυνας.
- Εργαλειοθήκη αντοχής αντιπάλου (ART) παρέχει εργαλεία σε προγραμματιστές και ερευνητές για την υπεράσπιση και την αξιολόγηση των μοντέλων και των εφαρμογών ML τους έναντι μιας σειράς αντιπάλων απειλών.
- ο Ανταγωνιστικές ενημερώσεις κώδικα που αναδιατάσσονται στο πλαίσιο Το σύνολο δεδομένων (APRICOT) επιτρέπει την αναπαραγώγιμη έρευνα σχετικά με την αποτελεσματικότητα στον πραγματικό κόσμο των φυσικών επιθέσεων ενημερωμένης έκδοσης κώδικα σε συστήματα ανίχνευσης αντικειμένων.
- ο Χώρος αποθήκευσης της Google Research Self-Study περιέχει “δοκιμαστικά ανδρείκελα” που αντιπροσωπεύουν μια κοινή ιδέα ή προσέγγιση για την κατασκευή άμυνων.