Περίληψη: Οι ερευνητές ανέπτυξαν έναν ρομποτικό αισθητήρα χρησιμοποιώντας τεχνητή νοημοσύνη για να διαβάζει μπράιγ με αξιοσημείωτες 315 λέξεις το λεπτό με ακρίβεια 87%, ξεπερνώντας τη μέση ταχύτητα ανάγνωσης από τον άνθρωπο. Αυτός ο αισθητήρας χρησιμοποιεί αλγόριθμους μηχανικής μάθησης για την ερμηνεία braille με υψηλή ευαισθησία, αντικατοπτρίζοντας την ανθρώπινη συμπεριφορά ανάγνωσης.
Αν και δεν έχει σχεδιαστεί ως υποβοηθητική τεχνολογία, αυτή η ανακάλυψη έχει συνέπειες για την ανάπτυξη ευαίσθητων ρομποτικών χεριών και προσθετικών. Η επιτυχία του αισθητήρα στην ανάγνωση της γραφής μπράιγ καταδεικνύει τις δυνατότητες της ρομποτικής στην αναπαραγωγή πολύπλοκων ανθρώπινων δεξιοτήτων αφής.
Βασικά στοιχεία:
- Η ρομποτική συσκευή ανάγνωσης μπράιγ χρησιμοποιεί τεχνητή νοημοσύνη και έναν αισθητήρα «δακτύλου» εξοπλισμένο με κάμερα για ανάγνωση με διπλάσια ταχύτητα από τους περισσότερους ανθρώπους αναγνώστες.
- Η υψηλή ευαισθησία του ρομπότ το καθιστά ιδανικό μοντέλο για την ανάπτυξη προηγμένων χεριών ή προσθετικών ρομπότ.
- Αυτή η πρόοδος αμφισβητεί το μηχανολογικό έργο της αναπαραγωγής της ευαισθησίας των άκρων του ανθρώπινου δακτύλου στη ρομποτική, προσφέροντας ευρύτερες εφαρμογές πέρα από την ανάγνωση της γραφής μπράιγ.
Πηγή: Πανεπιστήμιο του Κέιμπριτζ
Οι ερευνητές ανέπτυξαν έναν ρομποτικό αισθητήρα που ενσωματώνει τεχνικές τεχνητής νοημοσύνης για την ανάγνωση της γραφής μπράιγ με ταχύτητες περίπου διπλάσιες από αυτές των περισσότερων αναγνωστών.
Η ερευνητική ομάδα, από το Πανεπιστήμιο του Κέμπριτζ, χρησιμοποίησε αλγόριθμους μηχανικής μάθησης για να διδάξει σε έναν ρομποτικό αισθητήρα να γλιστράει γρήγορα πάνω από γραμμές κειμένου μπράιγ. Το ρομπότ ήταν σε θέση να διαβάσει τη γραφή μπράιγ με 315 λέξεις το λεπτό με ακρίβεια σχεδόν 90%.
Αν και ο αναγνώστης ρομπότ μπράιγ δεν αναπτύχθηκε ως υποβοηθητική τεχνολογία, οι ερευνητές λένε ότι η υψηλή ευαισθησία που απαιτείται για την ανάγνωση της γραφής μπράιγ το καθιστά ιδανικό τεστ για την ανάπτυξη χεριών ρομπότ ή προσθετικών με παρόμοια ευαισθησία στα ανθρώπινα δάχτυλα.
Τα αποτελέσματα αναφέρονται στο περιοδικό Επιστολές IEEE Robotics and Automation.
Τα ανθρώπινα δάχτυλα είναι εξαιρετικά ευαίσθητα και μας βοηθούν να συλλέγουμε πληροφορίες για τον κόσμο γύρω μας. Οι άκρες των δακτύλων μας μπορούν να ανιχνεύσουν μικροσκοπικές αλλαγές στην υφή ενός υλικού ή να μας βοηθήσουν να ξέρουμε πόση δύναμη πρέπει να χρησιμοποιήσουμε όταν πιάνουμε ένα αντικείμενο: για παράδειγμα, να σηκώνουμε ένα αυγό χωρίς να το σπάσουμε ή μια μπάλα μπόουλινγκ χωρίς να το ρίξουμε.
Η αναπαραγωγή αυτού του επιπέδου ευαισθησίας σε ένα ρομποτικό χέρι, με ενεργειακά αποδοτικό τρόπο, είναι μια μεγάλη πρόκληση μηχανικής. Στο εργαστήριο του καθηγητή Fumiya Iida στο Τμήμα Μηχανικών του Κέμπριτζ, οι ερευνητές αναπτύσσουν λύσεις σε αυτήν και σε άλλες δεξιότητες που οι άνθρωποι βρίσκουν εύκολα, αλλά τα ρομπότ δύσκολα.
«Η απαλότητα των άκρων των ανθρώπινων δακτύλων είναι ένας από τους λόγους για τους οποίους μπορούμε να πιάνουμε τα πράγματα με τη σωστή πίεση», δήλωσε ο Parth Potdar από το Τμήμα Μηχανικών του Cambridge και προπτυχιακός στο Pembroke College, ο πρώτος συγγραφέας της εργασίας. «Για τη ρομποτική, η απαλότητα είναι ένα χρήσιμο χαρακτηριστικό, αλλά χρειάζεστε επίσης πολλές πληροφορίες αισθητήρων και είναι δύσκολο να έχετε και τα δύο ταυτόχρονα, ειδικά όταν αντιμετωπίζετε εύκαμπτες ή παραμορφώσιμες επιφάνειες».
Η γραφή Braille είναι μια ιδανική δοκιμή για ένα «άκρο δακτύλου» ενός ρομπότ, καθώς η ανάγνωσή του απαιτεί υψηλή ευαισθησία, καθώς οι τελείες σε κάθε αντιπροσωπευτικό μοτίβο γραμμάτων είναι τόσο κοντά μεταξύ τους. Οι ερευνητές χρησιμοποίησαν έναν αισθητήρα εκτός ραφιού για να αναπτύξουν έναν ρομποτικό αναγνώστη μπράιγ που αναπαράγει με μεγαλύτερη ακρίβεια την ανθρώπινη συμπεριφορά ανάγνωσης.
«Υπάρχουν ρομποτικοί αναγνώστες μπράιγ, αλλά διαβάζουν μόνο ένα γράμμα τη φορά, κάτι που δεν διαβάζουν οι άνθρωποι», δήλωσε ο συν-συγγραφέας David Hardman, επίσης από το Τμήμα Μηχανικών.
«Οι υπάρχουσες ρομποτικές συσκευές ανάγνωσης μπράιγ λειτουργούν με στατικό τρόπο: αγγίζουν ένα μοτίβο γράμματος, το διαβάζουν, τραβούν από την επιφάνεια, μετακινούνται, χαμηλώνουν στο επόμενο μοτίβο γραμμάτων και ούτω καθεξής. Θέλουμε κάτι πιο ρεαλιστικό και πολύ πιο αποτελεσματικό».
Ο ρομποτικός αισθητήρας που χρησιμοποίησαν οι ερευνητές έχει μια κάμερα στο «άκρο του δακτύλου» του και διαβάζει χρησιμοποιώντας έναν συνδυασμό των πληροφοριών από την κάμερα και τους αισθητήρες. “Αυτό είναι ένα δύσκολο πρόβλημα για τους ρομποτικούς, καθώς χρειάζεται να γίνει πολλή επεξεργασία εικόνας για να αφαιρεθεί το θάμπωμα της κίνησης, το οποίο είναι χρονοβόρο και ενεργοβόρο”, δήλωσε ο Potdar.
Η ομάδα ανέπτυξε αλγόριθμους μηχανικής μάθησης, έτσι ώστε ο ρομποτικός αναγνώστης να μπορεί να «αποθολώνει» τις εικόνες πριν ο αισθητήρας επιχειρήσει να αναγνωρίσει τα γράμματα. Εκπαίδευσαν τον αλγόριθμο σε ένα σύνολο ευκρινών εικόνων braille με ψεύτικο θάμπωμα. Αφού ο αλγόριθμος έμαθε να ξεθολώνει τα γράμματα, χρησιμοποίησαν ένα μοντέλο όρασης υπολογιστή για να εντοπίσουν και να ταξινομήσουν κάθε χαρακτήρα.
Μόλις ενσωματώθηκαν οι αλγόριθμοι, οι ερευνητές δοκίμασαν τον αναγνώστη τους σύροντάς τον γρήγορα κατά μήκος σειρών χαρακτήρων μπράιγ. Ο ρομποτικός αναγνώστης μπράιγ μπορούσε να διαβάσει με 315 λέξεις το λεπτό με ακρίβεια 87%, η οποία είναι διπλάσια ταχύτερη και περίπου τόσο ακριβής όσο ένας ανθρώπινος αναγνώστης Braille.
«Λαμβάνοντας υπόψη ότι χρησιμοποιήσαμε τον αλγόριθμο fake blur the train, ήταν εκπληκτικό το πόσο ακριβής ήταν στην ανάγνωση της γραφής μπράιγ», είπε ο Hardman. «Βρήκαμε έναν καλό συμβιβασμό μεταξύ ταχύτητας και ακρίβειας, όπως συμβαίνει και με τους ανθρώπινους αναγνώστες».
«Η ταχύτητα ανάγνωσης Braille είναι ένας πολύ καλός τρόπος για τη μέτρηση της δυναμικής απόδοσης των συστημάτων απτικής αίσθησης, επομένως τα ευρήματά μας θα μπορούσαν να εφαρμοστούν πέρα από το braille, για εφαρμογές όπως η ανίχνευση υφών επιφανειών ή ολίσθηση σε ρομποτικό χειρισμό», δήλωσε ο Potdar.
Στο μέλλον, οι ερευνητές ελπίζουν να κλιμακώσουν την τεχνολογία στο μέγεθος ενός ανθρωποειδούς χεριού ή δέρματος.
Χρηματοδότηση: Η έρευνα υποστηρίχθηκε εν μέρει από το Samsung Global Research Outreach Program.
Σχετικά με αυτά τα νέα έρευνας AI και ρομποτικής
Συγγραφέας: Σάρα Κόλινς
Πηγή: Πανεπιστήμιο του Κέιμπριτζ
Επικοινωνία: Sarah Collins – Πανεπιστήμιο του Κέιμπριτζ
Εικόνα: Η εικόνα πιστώνεται στο Neuroscience News
Πρωτότυπη έρευνα: Κλειστή πρόσβαση.
“Ανάγνωση απτικής Braille υψηλής ταχύτητας μέσω βιομιμητικών συρόμενων αλληλεπιδράσεων» από τους Parth Potdar et al. Επιστολές IEEE Robotics and Automation
Αφηρημένη
Ανάγνωση απτικής Braille υψηλής ταχύτητας μέσω βιομιμητικών συρόμενων αλληλεπιδράσεων
Οι περισσότεροι ρομποτικοί αισθητήρες ανάγνωσης μπράιγ χρησιμοποιούν μια διακριτή στρατηγική ανάγνωσης γράμμα προς γράμμα, παρά τις υψηλότερες πιθανές ταχύτητες μιας βιομιμητικής ολισθαίνουσας προσέγγισης.
Προτείνουμε μια πλήρη διοχέτευση για συνεχή ανάγνωση braille: τα καρέ συλλέγονται δυναμικά με έναν απτικό αισθητήρα που βασίζεται στην όραση. ένας αυτόματος κωδικοποιητής αφαιρεί τεχνουργήματα που θολώνουν την κίνηση. Ένα ελαφρύ μοντέλο YOLO v8 ταξινομεί τους χαρακτήρες braille. και ένα στάδιο ενοποίησης βάσει δεδομένων ελαχιστοποιεί τα σφάλματα στην προβλεπόμενη συμβολοσειρά.
Επιδεικνύουμε υπερσύγχρονη ταχύτητα 315 λέξεων ανά λεπτό με ακρίβεια 87,5%, δηλαδή διπλάσια από την ταχύτητα ανάγνωσης του ανθρώπινου braille.
Αν και αποδεικνύεται σε μπράιγ, αυτή η βιομιμητική ολισθαίνουσα προσέγγιση μπορεί να χρησιμοποιηθεί περαιτέρω για πιο πλούσια δυναμική χωρική και χρονική ανίχνευση υφών επιφανειών και εξετάζουμε τις προκλήσεις που πρέπει να αντιμετωπιστούν στην ανάπτυξή της.