Σύμφωνα με το Ethereum (ETH) συνιδρυτής Vitalik Buterin, η νέα μέθοδος συμπίεσης εικόνας Token for Image Tokenizer (TiTok AI) μπορεί να κωδικοποιεί εικόνες σε μέγεθος αρκετά μεγάλο ώστε να τις προσθέτει στην αλυσίδα.
Στα social media του στο Warpcast λογαριασμός, ο Buterin ονόμασε τη μέθοδο συμπίεσης εικόνας έναν νέο τρόπο “κωδικοποίησης μιας εικόνας προφίλ”. Συνέχισε λέγοντας ότι εάν μπορεί να συμπιέσει μια εικόνα σε 320 bit, τα οποία ονόμασε «βασικά κατακερματισμός», θα καθιστούσε τις εικόνες αρκετά μικρές ώστε να είναι αλυσιδωτές για κάθε χρήστη.
Ο συνιδρυτής του Ethereum έδειξε ενδιαφέρον για το TiTok AI από μια ανάρτηση X που έγινε από έναν ερευνητή στην πλατφόρμα παραγωγής εικόνων τεχνητής νοημοσύνης (AI) Leonardo AI.
Ο ερευνητής, ακολουθώντας τη λαβή @Ethan_smith_20, εξήγησε εν συντομία πώς η μέθοδος θα μπορούσε να βοηθήσει όσους ενδιαφέρονται για την επανερμηνεία λεπτομερειών υψηλής συχνότητας μέσα στις εικόνες να κωδικοποιήσουν με επιτυχία σύνθετα οπτικά στοιχεία σε 32 διακριτικά.
Η προοπτική του Buterin υποδηλώνει ότι η μέθοδος θα μπορούσε να διευκολύνει σημαντικά τους προγραμματιστές και τους δημιουργούς να δημιουργούν φωτογραφίες προφίλ και μη ανταλλάξιμα μάρκες (NFTs).
Επίλυση προηγούμενων προβλημάτων δημιουργίας διακριτικών εικόνων
Το TiTok AI, που αναπτύχθηκε από μια συλλογική προσπάθεια από τη μητρική εταιρεία TikTok ByteDance και το Πανεπιστήμιο του Μονάχου, περιγράφεται ως ένα καινοτόμο μονοδιάστατο πλαίσιο συμβολικής, που αποκλίνει σημαντικά από τις επικρατούσες δισδιάστατες μεθόδους που χρησιμοποιούνται.
Σύμφωνα με μια ερευνητική εργασία σχετικά με τη μέθοδο δημιουργίας διακριτικών εικόνων, η τεχνητή νοημοσύνη επιτρέπει στο TiTok να συμπιέζει εικόνες 256 επί 256 pixel σε «32 διακριτά διακριτικά».
Το έγγραφο επεσήμανε ζητήματα που παρατηρήθηκαν με προηγούμενες μεθόδους δημιουργίας διακριτικών εικόνων, όπως το VQGAN. Προηγουμένως, η δημιουργία διακριτικών εικόνων ήταν δυνατή, αλλά οι στρατηγικές περιορίζονταν στη χρήση «2D λανθάνοντων πλεγμάτων με σταθερούς παράγοντες μείωσης δειγματοληψίας».
Το 2D tokenization δεν μπορούσε να παρακάμψει τις δυσκολίες στον χειρισμό των πλεονασμάτων που βρέθηκαν στις εικόνες και οι κοντινές περιοχές παρουσίαζαν πολλές ομοιότητες.
TiTok, το οποίο χρησιμοποιεί Όλα συμπεριλαμβάνονταιυπόσχεται να λύσει ένα τέτοιο ζήτημα, χρησιμοποιώντας τεχνολογίες που ενοποιούν αποτελεσματικά τις εικόνες σε 1D λανθάνουσες ακολουθίες για να παρέχουν μια «συμπαγή λανθάνουσα αναπαράσταση» και να εξαλείψουν τον πλεονασμό περιοχής.
Επιπλέον, η στρατηγική του tokenization θα μπορούσε να βοηθήσει στον εξορθολογισμό της αποθήκευσης εικόνας σε πλατφόρμες blockchain παρέχοντας παράλληλα αξιοσημείωτες βελτιώσεις στην ταχύτητα επεξεργασίας.
Επιπλέον, μπορεί να υπερηφανεύεται για ταχύτητες έως και 410 φορές μεγαλύτερες από τις τρέχουσες τεχνολογίες, κάτι που είναι ένα τεράστιο βήμα προς τα εμπρός στην υπολογιστική απόδοση.