Γίνετε μέλος ηγέτες στη Βοστώνη στις 27 Μαρτίου για μια αποκλειστική βραδιά δικτύωσης, γνώσεων και συνομιλιών. Ζητήστε μια πρόσκληση εδώ.
Η δημοφιλής υπηρεσία δημιουργίας εικόνων AI Μεσοταξίδι έχει αναπτύξει ένα από τα πιο συχνά ζητούμενα χαρακτηριστικά του: τη δυνατότητα αναδημιουργίας χαρακτήρων με συνέπεια σε νέες εικόνες.
Αυτό ήταν ένα σημαντικό εμπόδιο για τις γεννήτριες εικόνων AI μέχρι σήμερα, από τη φύση τους.
Αυτό συμβαίνει επειδή οι περισσότερες γεννήτριες εικόνων AI βασίζονται σε “μοντέλα διάχυσης», εργαλεία παρόμοια ή βασισμένα σε Ο αλγόριθμος δημιουργίας εικόνων ανοιχτού κώδικα Stable Diffusion του Stability AIοι οποίες λειτουργούν κατά προσέγγιση παίρνοντας κείμενο που έχει εισαχθεί από έναν χρήστη και προσπαθώντας να συνδυάσετε μια εικόνα pixel-pixel που ταιριάζει με αυτήν την περιγραφή, όπως προκύπτει από παρόμοιες εικόνες και ετικέτες κειμένου στο τεράστιο (και αμφιλεγόμενο) σύνολο δεδομένων εκπαίδευσης εκατομμυρίων εικόνων που δημιουργήθηκαν από τον άνθρωπο.
Γιατί οι συνεπείς χαρακτήρες είναι τόσο ισχυροί – και φευγαλέοι – για δημιουργικές εικόνες τεχνητής νοημοσύνης
Ωστόσο, όπως συμβαίνει με τα μοντέλα μεγάλων γλωσσών που βασίζονται σε κείμενο (LLM) όπως π.χ ChatGPT του OpenAI ή Το νέο Command-R του Cohereτο πρόβλημα με όλες τις γενετικές εφαρμογές τεχνητής νοημοσύνης έγκειται στην ασυνέπεια των αποκρίσεών τους: η τεχνητή νοημοσύνη δημιουργεί κάτι νέο για κάθε μεμονωμένη προτροπή που εισάγεται σε αυτήν, ακόμα κι αν η προτροπή επαναλαμβάνεται ή χρησιμοποιούνται ορισμένες από τις ίδιες λέξεις-κλειδιά.
Αυτό είναι εξαιρετικό για τη δημιουργία εντελώς νέων κομματιών περιεχομένου — στην περίπτωση του Midjourney, εικόνων. Αλλά τι γίνεται αν γράφεις μια ταινία, ένα μυθιστόρημα, ένα graphic novel ή ένα κόμικ ή κάποιο άλλο οπτικό μέσο όπου θέλεις το ίδιο χαρακτήρας ή χαρακτήρες να κινούνται μέσα από αυτό και να εμφανίζονται σε διαφορετικές σκηνές, σκηνικά, με διαφορετικές εκφράσεις προσώπου και σκηνικά;
Αυτό το ακριβές σενάριο, το οποίο είναι συνήθως απαραίτητο για την αφηγηματική συνέχεια, ήταν πολύ δύσκολο να επιτευχθεί με τη γενετική τεχνητή νοημοσύνη — μέχρι στιγμής. Αλλά το Midjourney κάνει τώρα μια χαραμάδα, εισάγοντας μια νέα ετικέτα, “–cref” (συντομογραφία για “αναφορά χαρακτήρων”) που οι χρήστες μπορούν να προσθέσουν στο τέλος των μηνυμάτων κειμένου τους στο Midjourney Discord και θα προσπαθήσουν να ταιριάξουν με το πρόσωπο του χαρακτήρα χαρακτηριστικά, σωματότυπο, ακόμη και ρούχα από μια διεύθυνση URL που επικολλά ο χρήστης ακολουθώντας την εν λόγω ετικέτα.
Καθώς το χαρακτηριστικό εξελίσσεται και βελτιώνεται, θα μπορούσε να οδηγήσει το Midjourney περισσότερο από το να είναι ένα δροσερό παιχνίδι ή πηγή ιδεών σε περισσότερο επαγγελματικό εργαλείο.
Πώς να χρησιμοποιήσετε τη νέα δυνατότητα συνεπούς χαρακτήρα Midjourney
Η ετικέτα λειτουργεί καλύτερα με εικόνες Midjourney που δημιουργήθηκαν προηγουμένως. Έτσι, για παράδειγμα, η ροή εργασίας για έναν χρήστη θα ήταν να δημιουργήσει ή να ανακτήσει πρώτα τη διεύθυνση URL ενός χαρακτήρα που δημιουργήθηκε προηγουμένως.
Ας ξεκινήσουμε από το μηδέν και ας πούμε ότι δημιουργούμε έναν νέο χαρακτήρα με αυτήν την προτροπή: “ένας μυώδης φαλακρός άνδρας με μια χάντρα και ένα έμπλαστρο στα μάτια.”
Θα αναβαθμίσουμε την εικόνα που μας αρέσει περισσότερο και, στη συνέχεια, θα κάνουμε κλικ σε αυτήν στον διακομιστή Midjourney Discord για να βρείτε την επιλογή “αντιγραφή συνδέσμου”.
Στη συνέχεια, μπορούμε να πληκτρολογήσουμε μια νέα προτροπή «φορώντας ένα λευκό σμόκιν που στέκεται σε μια βίλα-cref [URL]” και επικολλήστε τη διεύθυνση URL της εικόνας που μόλις δημιουργήσαμε και το Midjourney θα προσπαθήσει να δημιουργήσει τον ίδιο χαρακτήρα από πριν στη ρύθμιση που πληκτρολογήσαμε πρόσφατα.
Όπως θα δείτε, τα αποτελέσματα απέχουν πολύ από το να είναι ακριβή με τον αρχικό χαρακτήρα (ή ακόμα και την αρχική μας προτροπή), αλλά σίγουρα ενθαρρυντικά.
Επιπλέον, ο χρήστης μπορεί να ελέγξει σε κάποιο βαθμό το «βάρος» του πόσο στενά η νέα εικόνα αναπαράγει τον αρχικό χαρακτήρα εφαρμόζοντας την ετικέτα «–cw» ακολουθούμενη από έναν αριθμό από 1 έως 100 στο τέλος της νέας προτροπής (μετά το « –κρφ [URL]” συμβολοσειρά, έτσι όπως: “–cref [URL] –cw 100.” Όσο χαμηλότερος είναι ο αριθμός “cw”, τόσο μεγαλύτερη διακύμανση θα έχει η εικόνα που προκύπτει. Όσο υψηλότερος είναι ο αριθμός “cw”, τόσο πιο κοντά η νέα εικόνα που προκύπτει θα ακολουθεί την αρχική αναφορά.
Όπως μπορείτε να δείτε στο παράδειγμά μας, η εισαγωγή ενός πολύ χαμηλού “cw 8” επιστρέφει στην πραγματικότητα αυτό που θέλαμε: το λευκό σμόκιν. Αν και τώρα έχει αφαιρέσει το χαρακτηριστικό μάτι του χαρακτήρα μας.
Λοιπόν, τίποτα από μια μικρή «διαφορετική περιοχή» δεν μπορεί να διορθωθεί — σωστά;
Εντάξει, άρα το προσοφθάλμιο είναι σε λάθος μάτι…αλλά φτάνουμε εκεί!
Μπορείτε επίσης να συνδυάσετε πολλούς χαρακτήρες σε έναν χρησιμοποιώντας δύο ετικέτες “–cref” δίπλα δίπλα με τις αντίστοιχες διευθύνσεις URL τους.
Το χαρακτηριστικό μόλις κυκλοφόρησε νωρίτερα σήμερα το απόγευμα, αλλά ήδη καλλιτέχνες και δημιουργοί το δοκιμάζουν τώρα. Δοκιμάστε το μόνοι σας αν έχετε Midjourney. Και διαβάστε το πλήρες σημείωμα του ιδρυτή David Holz σχετικά παρακάτω:
Γεια σας @everyone @εδώ δοκιμάζουμε μια νέα δυνατότητα “Αναφορά χαρακτήρων” σήμερα Αυτή είναι παρόμοια με τη δυνατότητα “Αναφορά στυλ”, εκτός από το ότι αντί να ταιριάζει με ένα στυλ αναφοράς προσπαθεί να κάνει τον χαρακτήρα να ταιριάζει με την εικόνα “Αναφορά χαρακτήρων”.
Πως δουλεύει
- Τύπος
--cref URL
μετά την προτροπή σας με μια διεύθυνση URL σε μια εικόνα ενός χαρακτήρα - Μπορείς να χρησιμοποιήσεις
--cw
για να τροποποιήσετε την «ισχύ» αναφοράς από 100 σε 0 - δύναμη 100 (
--cw 100
) είναι προεπιλεγμένη και χρησιμοποιεί το πρόσωπο, τα μαλλιά και τα ρούχα - Σε ισχύ 0 (
--cw 0
) θα επικεντρωθεί μόνο στο πρόσωπο (καλό για αλλαγή ρούχων / μαλλιών κ.λπ.)
Για ποιο σκοπό προορίζεται
- Αυτή η δυνατότητα λειτουργεί καλύτερα όταν χρησιμοποιείτε χαρακτήρες που δημιουργούνται από εικόνες Midjourney. Δεν έχει σχεδιαστεί για πραγματικούς ανθρώπους / φωτογραφίες (και πιθανότατα θα τις παραμορφώσει όπως κάνουν τα κανονικά μηνύματα προτροπής εικόνων)
- Το Cref λειτουργεί παρόμοια με τις κανονικές προτροπές εικόνας, εκτός από το ότι «εστιάζει» στα χαρακτηριστικά του χαρακτήρα
- Η ακρίβεια αυτής της τεχνικής είναι περιορισμένη, δεν θα αντιγράψει ακριβή λακκάκια / φακίδες / ή λογότυπα μπλουζάκια.
- Το Cref λειτουργεί τόσο για μοντέλα Niji όσο και για κανονικά μοντέλα MJ και μπορεί επίσης να συνδυαστεί με
--sref
Προηγμένες δυνατότητες
- Μπορείτε να χρησιμοποιήσετε περισσότερες από μία διευθύνσεις URL για να συνδυάσετε τις πληροφορίες/χαρακτήρες από πολλές εικόνες όπως αυτή
--cref URL1 URL2
(αυτό είναι παρόμοιο με πολλές προτροπές εικόνας ή στυλ)
Πώς λειτουργεί στο web alpha;
- Σύρετε ή επικολλήστε μια εικόνα στη γραμμή φαντασίας, τώρα έχει τρία εικονίδια. επιλέγοντας αυτά τα σύνολα είτε πρόκειται για μια ερώτηση εικόνας, μια αναφορά στυλ ή μια αναφορά χαρακτήρων. Shift+επιλέξτε μια επιλογή για χρήση μιας εικόνας για πολλές κατηγορίες
Θυμηθείτε, ενώ το MJ V6 είναι στο alpha, αυτό και άλλα χαρακτηριστικά μπορεί να αλλάξουν ξαφνικά, αλλά η επίσημη έκδοση beta του V6 έρχεται σύντομα. Θα θέλαμε τις σκέψεις όλων για τις ιδέες και τις δυνατότητες. Ελπίζουμε να απολαύσετε αυτήν την πρώιμη κυκλοφορία και ελπίζουμε να σας βοηθήσει να παίξετε με ιστορίες και κόσμους
Η αποστολή του VentureBeat πρόκειται να αποτελέσει μια ψηφιακή πλατεία της πόλης για τους τεχνικούς λήπτες αποφάσεων ώστε να αποκτήσουν γνώσεις σχετικά με τη μετασχηματιστική επιχειρηματική τεχνολογία και να πραγματοποιήσουν συναλλαγές. Ανακαλύψτε τις Ενημερώσεις μας.