Το Midjourney, το εργαλείο δημιουργίας εικόνας που είναι ίσως πιο γνωστό για τη λειτουργία του μέσα σε έναν διακομιστή Discord, απλώνει τα φτερά του στην τεχνητή νοημοσύνη. Οι δημιουργοί του Midjourney ανακοίνωσαν την Τρίτη ότι σχεδιάζουν να παρουσιάσουν ένα μοντέλο «κείμενο σε βίντεο» μέσα στους επόμενους μήνες.
Η εταιρεία θα ξεκινήσει την εκπαίδευση των μοντέλων βίντεο της ξεκινώντας τον Ιανουάριο, δήλωσε ο Διευθύνων Σύμβουλος David Holz κατά τη διάρκεια μιας συνεδρίας Discord “Office Hour”. Αυτή η κίνηση αντιπροσωπεύει μια φυσική εξέλιξη για την πλατφόρμα, η οποία βασίζεται σε ένα ώριμο μοντέλο εικόνας για να τονώσει την ανταγωνιστική δυναμική της βιομηχανίας παραγωγής βίντεο.
Οι σημειώσεις της συνεδρίας του Discord περιλάμβαναν προγραμματισμένες τροποποιήσεις για το V6 Niji —το μοντέλο γεννήτριας manga/anime της Midjourney—και διορθώσεις συνέπειας για την επερχόμενη επίσημη κυκλοφορία του Midjourney V6. Η εταιρεία έγραψε επίσης ότι η λίστα υποχρεώσεών της απαιτεί «να ξεκινήσει η εκπαίδευση για νέα μοντέλα βίντεο», η οποία θα μπορούσε ενδεχομένως να είναι έτοιμη «σε λίγους μήνες».
Δεν κοινοποιήθηκαν περαιτέρω πληροφορίες για το μοντέλο ούτε από τον Holz ούτε από την ομάδα του Midjourney.
Το Midjourney είναι γνωστό για την έμφαση στην ποιότητα και την εμπειρία χρήστη σε σχέση με την ακατέργαστη ταχύτητα—ακόμα κι αν αυτό σήμαινε ότι υστερούσε σε σχέση με τους ανταγωνιστές. Η εταιρεία παρουσίασε βελτιώσεις όπως το inpainting και το outpainting μήνες αφότου τα χαρακτηριστικά έγιναν de facto σε άλλες πλατφόρμες όπως Σταθερή Διάχυσηκαι η πρόσφατη εισβολή του στη δημιουργία στοιχειώδους κειμένου ήρθε αφού ήταν μια κοινή δυνατότητα σε άλλα μοντέλα όπως Dall-E 3SDXL ή ακόμα και κάποιες λιγότερο δημοφιλείς γεννήτριες όπως το Ideogram ή το IF.
Μπαίνοντας σε ένα γεμάτο χωράφι
Αυτό το εγχείρημα στο βίντεο έρχεται επίσης στον απόηχο των κυκλοφοριών από τον διαγωνισμό. Το Stability AI ανακοίνωσε πρόσφατα το Stable Video Diffusion. Η Meta μόλις παρουσίασε τη γεννήτρια βίντεο EMU της και υπάρχοντα μοντέλα όπως το Pika και το Runway ML σηματοδοτούν την επικράτειά τους, αφήνοντας την είσοδο της Midjourney να αναδυθεί σε ένα ισχυρό ανταγωνιστικό τοπίο. Επιπλέον, άλλες συσκευές παραγωγής εικόνων όπως η Leonardo AI έχουν ήδη εφαρμόσει δυνατότητες δημιουργίας βίντεο, εντείνοντας περαιτέρω τον αγώνα.
Η πρόσφατη ενημέρωση v6 από το Midjourney, με βελτιωμένη άμεση παρακολούθηση και πιο ρεαλιστικές εικόνες, είναι η πιο πρόσφατη προσπάθεια της εταιρείας να παραμείνει σχετική και ανταγωνιστική. Εάν τα μοντέλα του δείχνουν κάποια συνοχή, θα μπορούσαν να κερδίσουν σταθερό έδαφος σε ένα τόσο εκκολαπτόμενο πεδίο—ακόμη και με μοντέλα που απέχουν πολύ από το τέλειο.
Οι επιπτώσεις αυτών των εξελίξεων εκτείνονται πολύ πέρα από μια εταιρική κούρσα για την υπεροχή. Καθώς η Midjourney και άλλοι καινοτομούν και βελτιώνουν τις προσφορές τους, η δημιουργική βιομηχανία και οι βιομηχανίες των μέσων ενημέρωσης βρίσκονται στο χείλος μιας μεταμορφωτικής εποχής. Η ικανότητα δημιουργίας, χειραγώγησης και αλληλεπίδρασης με περιεχόμενο βίντεο μέσω τεχνητής νοημοσύνης ανοίγει πολλές δυνατότητες—από τη διευκόλυνση των πραγμάτων για τους διασκεδαστές και τους διαφημιστές έως την πιθανή αναμόρφωση του τρόπου με τον οποίο αντιλαμβανόμαστε την πραγματικότητα.
Επεξεργάστηκε από Ράιαν Οζάουα.