Υπάρχει ένα νέο πρόγραμμα επεξεργασίας εικόνας της Apple, αν ξέρετε πού να ψάξετε. Οι βασιλιάδες του iPhone συνεργάστηκαν με ερευνητές στο Πανεπιστήμιο της Καλιφόρνια στη Σάντα Μπάρμπαρα για να δημιουργήσουν ένα εργαλείο που σας επιτρέπει να επεξεργάζεστε φωτογραφίες και εικόνες με οδηγίες που βασίζονται σε κείμενο. Δεν έχει επίσημη κυκλοφορία, αλλά οι ερευνητές φιλοξενούν ένα demo που μπορείτε να δοκιμάσετε μόνοι σας, το οποίο εντοπίστηκε για πρώτη φορά από Extreme Tech.
Το έργο ονομάζεται Multimodal Large Language Model Guided Image Editing (MGIE). Υπάρχουν πολλοί επεξεργαστές εικόνας AI στην αγορά αυτή τη στιγμή. Το Photoshop έρχεται τώρα με ενσωματωμένα εργαλεία τεχνητής νοημοσύνης και άλλα, όπως το DALL-E του OpenAI, σάς επιτρέπουν να επεξεργάζεστε εικόνες εκτός από τη δημιουργία τους από ολόκληρο ύφασμα. Εάν έχετε προσπαθήσει ποτέ να τα χρησιμοποιήσετε, ωστόσο, ξέρετε ότι μπορεί να είναι λίγο απογοητευτικό. Σε πολλές περιπτώσεις, το AI δυσκολεύεται να καταλάβει τι ακριβώς ψάχνετε.
Η καινοτομία με το MGIE προσθέτει άλλο ένα επίπεδο ερμηνείας AI. Όταν λέτε στο AI τι θέλετε να δείτε, το MGIE χρησιμοποιεί πρώτα μια τεχνητή νοημοσύνη βασισμένη σε κείμενο για να κάνει τις οδηγίες σας πιο σαφείς και περιγραφικές. «Τα πειραματικά αποτελέσματα καταδεικνύουν ότι οι εκφραστικές οδηγίες είναι ζωτικής σημασίας για την επεξεργασία εικόνας που βασίζεται σε οδηγίες», είπαν οι ερευνητές σε μια χαρτί δημοσιεύτηκε στο arXiv. “Το MGIE μας μπορεί να οδηγήσει σε αξιοσημείωτη βελτίωση.”
Η Apple δημοσίευσε μια έκδοση ανοιχτού κώδικα του λογισμικού στο GitHub. Εάν είστε γνώστες, μπορείτε να πάρετε μια έκδοση του MGIE που τρέχει μόνος σας, αλλά οι ερευνητές εγκατέστησαν το εργαλείο σε Αγκαλιασμένο πρόσωπο. Λειτουργεί λίγο αργά όταν υπάρχουν πολλοί άνθρωποι που το χρησιμοποιούν, αλλά είναι ένα διασκεδαστικό πείραμα.
Γιγαντιαίες εταιρείες τεχνολογίας όπως η Apple ξοδεύουν δισεκατομμύρια δολάρια σε έργα που κανείς δεν μπορεί ποτέ να δει, επομένως είναι απολύτως πιθανό αυτό το λεγόμενο εργαλείο MGIE να μην έχει ποτέ επίσημη κυκλοφορία. Η Apple δεν απάντησε αμέσως σε ένα αίτημα για σχόλιο.
Το πήραμε μόνοι μας εδώ στο γραφείο του Gizmodo. Ανέβασα μια φωτογραφία του συναδέλφου μου και του στενότερου συμβούλου μου Kyle Barr φορώντας ένα περίεργο ζευγάρι γυαλιά ηλίου που πήρε σε ένα Netflix στο φετινό Consumer Electronics Show. Είπα στο AI «ο άνθρωπος στέκεται στην έρημο». Πριν από τη δημιουργία της εικόνας, το εργαλείο MGIE προέκτασε:
«Ο άνδρας φοράει ένα μεταλλικό κράνος και στέκεται σε ένα περιβάλλον ερήμου. Το περιβάλλον γύρω του είναι άνυδρο και άγονο, με αμμόλοφους να απλώνονται όσο μακριά μπορεί να δει το μάτι».
Αφού παίξουμε με το εργαλείο για πολύ περισσότερο από ό,τι θα έπρεπε, σαφώς υπόκειται στους ίδιους περιορισμούς με κάθε άλλη συσκευή δημιουργίας εικόνων AI. Πολλές φορές, τα αποτελέσματα είναι περίεργα και δεν μοιάζει με αυτό που ζητήσατε. Αλλά σε ορισμένες περιπτώσεις, έκανε μια εντυπωσιακή δουλειά, και για την υπεράσπιση του προγράμματος, η τεχνητή νοημοσύνη τα καταφέρνει καλύτερα με γνωστά θέματα. Το “Familiar” δεν είναι κάτι που θα αποκαλούσατε τα γυαλιά ηλίου του Kyle.