NVIDIA ανακοινώθηκε που αποκτά Run:ai, μια ισραηλινή startup που δημιούργησε έναν ενορχηστρωτή GPU με βάση την Kubernetes. Αν και η τιμή δεν αποκαλύπτεται, υπάρχουν αναφορές ότι η αξία του κυμαίνεται μεταξύ 700 και 1 δισεκατομμυρίου δολαρίων.
Η απόκτηση του Run:ai υπογραμμίζει την αυξανόμενη σημασία της Kubernetes στην εποχή της γενετικής τεχνητής νοημοσύνης. Αυτό καθιστά το Kubernetes το de facto πρότυπο για τη διαχείριση της υποδομής υπολογιστών επιτάχυνσης που βασίζεται σε GPU.
Το Run:ai είναι μια startup υποδομής τεχνητής νοημοσύνης με έδρα το Τελ Αβίβ, που ιδρύθηκε το 2018 από τον Omri Geller (CEO) και τον Dr. Ronen Dar (CTO). Έχει δημιουργήσει μια πλατφόρμα ενορχήστρωσης και εικονικοποίησης προσαρμοσμένης στις συγκεκριμένες απαιτήσεις φόρτου εργασίας AI που εκτελούνται σε GPU, η οποία συγκεντρώνει και μοιράζεται αποτελεσματικά τους πόρους. Η Tiger Global Management and Insight Partners οδήγησε έναν κύκλο 75 εκατομμυρίων δολαρίων Series C τον Μάρτιο του 2022, ανεβάζοντας τη συνολική χρηματοδότηση της εταιρείας σε 118 εκατομμύρια δολάρια.
Το πρόβλημα Run:ai λύνεται
Σε αντίθεση με τις CPU, οι GPU δεν μπορούν εύκολα να εικονικοποιηθούν έτσι ώστε να μπορούν να τις χρησιμοποιούν ταυτόχρονα πολλαπλοί φόρτοι εργασίας. Υπερεπόπτες όπως το vSphere και το KVM της VMware επέτρεψαν την εξομοίωση πολλαπλών εικονικών CPU από έναν μόνο φυσικό επεξεργαστή, δίνοντας στους φόρτους εργασίας την ψευδαίσθηση ότι εκτελούνταν σε μια αποκλειστική CPU. Όσον αφορά τις GPU, δεν μπορούν να κοινοποιηθούν αποτελεσματικά σε πολλαπλές εργασίες μηχανικής εκμάθησης, όπως η εκπαίδευση και η εξαγωγή συμπερασμάτων. Για παράδειγμα, οι ερευνητές δεν μπορούν να χρησιμοποιήσουν τη μισή GPU για εκπαίδευση και πειραματισμό ενώ χρησιμοποιούν την άλλη μισή για άλλη εργασία μηχανικής μάθησης. Ομοίως, δεν μπορούν να συγκεντρώσουν πολλές GPU για να κάνουν καλύτερη χρήση των διαθέσιμων πόρων. Αυτό θέτει μια τεράστια πρόκληση για τις επιχειρήσεις που εκτελούν φόρτους εργασίας που βασίζονται σε GPU στο cloud ή στις εγκαταστάσεις.
Το πρόβλημα που περιγράφεται παραπάνω επεκτείνεται σε κοντέινερ και Kubernetes. Εάν ένα κοντέινερ απαιτεί GPU, θα καταναλώσει αποτελεσματικά το 100% της GPU εάν δεν χρησιμοποιηθεί στο μέγιστο των δυνατοτήτων του. Η έλλειψη τσιπ AI και GPU επιδεινώνει το πρόβλημα.
Το Run:ai είδε μια ευκαιρία να λύσει αποτελεσματικά αυτό το πρόβλημα. Χρησιμοποίησαν τα πρωτόγονα και τους αποδεδειγμένους μηχανισμούς προγραμματισμού της Kubernetes για να δημιουργήσουν ένα επίπεδο που επιτρέπει στις επιχειρήσεις να χρησιμοποιούν μόνο ένα κλάσμα της διαθέσιμης GPU ή να συγκεντρώνουν πολλαπλές GPU. Αυτό είχε ως αποτέλεσμα την καλύτερη χρήση των GPU, παρέχοντας καλύτερη οικονομία.
Ακολουθούν 5 βασικά χαρακτηριστικά της πλατφόρμας Run:ai:
- Επίπεδο λογισμικού ενορχήστρωσης και εικονικοποίησης προσαρμοσμένο στους φόρτους εργασίας AI που εκτελούνται σε GPU και άλλα chipset. Αυτό επιτρέπει την αποτελεσματική συγκέντρωση και κοινή χρήση υπολογιστικών πόρων GPU.
- Ενσωμάτωση με Kubernetes για ενορχήστρωση κοντέινερ. Η πλατφόρμα του Run:ai είναι χτισμένη στο Kubernetes και υποστηρίζει όλες τις παραλλαγές Kubernetes. Επίσης, ενσωματώνεται με εργαλεία και πλαίσια τεχνητής νοημοσύνης τρίτων.
- Κεντρική διεπαφή για τη διαχείριση κοινής υπολογιστικής υποδομής. Οι χρήστες μπορούν να διαχειρίζονται συμπλέγματα, να συγκεντρώνουν GPU και να εκχωρούν υπολογιστική ισχύ για διάφορες εργασίες μέσω της διεπαφής Run:ai.
- Δυναμικός προγραμματισμός, συγκέντρωση GPU και κλασματοποίηση GPU για μέγιστη απόδοση. Το λογισμικό του Run:ai επιτρέπει τον διαχωρισμό των GPU σε κλάσματα και την κατανομή τους δυναμικά για τη βελτιστοποίηση της χρήσης.
- Η ενσωμάτωση με τη στοίβα AI της Nvidia περιλαμβάνει συστήματα DGX, Base Command, κοντέινερ NGC και λογισμικό AI Enterprise. Το Run:ai συνεργάστηκε στενά με τη Nvidia για να προσφέρει μια λύση full-stack.
Σημειωτέον, το Run:ai δεν είναι λύση ανοιχτού κώδικα, παρόλο που βασίζεται στο Kubernetes. Παρέχει στους πελάτες ιδιόκτητο λογισμικό που πρέπει να αναπτυχθεί στα συμπλέγματα Kubernetes μαζί με μια εφαρμογή διαχείρισης που βασίζεται στο SaaS.
Γιατί η NVIDIA απέκτησε το Run:ai;
Η εξαγορά του Run:ai από την NVIDIA τοποθετεί στρατηγικά την εταιρεία να ενισχύσει την ηγετική της θέση στους τομείς της τεχνητής νοημοσύνης και της μηχανικής μάθησης, ειδικά στο πλαίσιο της βελτιστοποίησης της χρήσης GPU για αυτές τις τεχνολογίες. Ακολουθούν οι κύριοι λόγοι για τους οποίους η NVIDIA επιδίωξε αυτήν την εξαγορά:
Βελτιωμένη ενορχήστρωση και διαχείριση GPU: Τα προηγμένα εργαλεία ενορχήστρωσης του Run:ai είναι ζωτικής σημασίας για την αποτελεσματικότερη διαχείριση των πόρων της GPU. Αυτή η ικανότητα είναι κρίσιμη καθώς η ζήτηση για λύσεις τεχνητής νοημοσύνης και μηχανικής μάθησης συνεχίζει να αυξάνεται, απαιτώντας πιο εξελιγμένη διαχείριση των πόρων υλικού για να διασφαλιστεί η βέλτιστη απόδοση και χρήση.
Ενσωμάτωση με το υπάρχον οικοσύστημα AI της NVIDIA: Με την απόκτηση του Run:ai, η NVIDIA μπορεί να ενσωματώσει αυτήν την τεχνολογία στην υπάρχουσα σουίτα προϊόντων τεχνητής νοημοσύνης και μηχανικής εκμάθησης. Αυτό ενισχύει τις συνολικές προσφορές προϊόντων της NVIDIA, επιτρέποντας καλύτερη εξυπηρέτηση σε πελάτες που βασίζονται στο οικοσύστημα της NVIDIA για τις ανάγκες υποδομής AI τους. Οι πελάτες NVIDIA HGX, DGX και DGX Cloud θα αποκτήσουν πρόσβαση στις δυνατότητες του Run:ai για τους φόρτους εργασίας τους με τεχνητή νοημοσύνη, ιδιαίτερα για φόρτους εργασίας τεχνητής νοημοσύνης.
Επέκταση της απήχησης στην αγορά: Οι εδραιωμένες σχέσεις του Run:ai με βασικούς παίκτες στον χώρο της τεχνητής νοημοσύνης, συμπεριλαμβανομένης της προηγούμενης ενσωμάτωσής τους με τις τεχνολογίες της NVIDIA, παρέχουν στη NVIDIA διευρυμένη εμβέλεια στην αγορά και τη δυνατότητα να εξυπηρετήσει ένα ευρύτερο φάσμα πελατών. Αυτό είναι ιδιαίτερα πολύτιμο σε τομείς που υιοθετούν γρήγορα τεχνολογίες τεχνητής νοημοσύνης, αλλά αντιμετωπίζουν προκλήσεις στη διαχείριση πόρων και την επεκτασιμότητα.
Ανάπτυξη Καινοτομίας και Έρευνας: Η εξαγορά επιτρέπει στη NVIDIA να εκμεταλλευτεί τις καινοτόμες δυνατότητες της ομάδας του Run:ai, που είναι γνωστή για την πρωτοποριακή της δουλειά στην εικονικοποίηση και διαχείριση GPU. Αυτό θα μπορούσε να οδηγήσει σε περαιτέρω προόδους στην τεχνολογία και την ενορχήστρωση GPU, διατηρώντας τη NVIDIA στην πρώτη γραμμή των τεχνολογικών εξελίξεων στην τεχνητή νοημοσύνη.
Ανταγωνιστικό πλεονέκτημα σε μια αναπτυσσόμενη αγορά: Καθώς οι επιχειρήσεις αυξάνουν τις επενδύσεις τους στην τεχνητή νοημοσύνη και τη μηχανική μάθηση, η αποτελεσματική διαχείριση GPU γίνεται ανταγωνιστικό πλεονέκτημα. Η εξαγορά του Run:ai από την NVIDIA διασφαλίζει ότι παραμένει ανταγωνιστική έναντι άλλων τεχνολογικών κολοσσών που μπαίνουν στο χώρο του υλικού και της ενορχήστρωσης της τεχνητής νοημοσύνης.
Με την απόκτηση του Run:ai, η NVIDIA όχι μόνο ενισχύει τις δυνατότητες προϊόντων της, αλλά και σταθεροποιεί τη θέση της ως ηγέτης στην αγορά υποδομής τεχνητής νοημοσύνης, διασφαλίζοντας ότι παραμένει μπροστά από την καμπύλη σε τεχνολογικές καινοτομίες και απαιτήσεις της αγοράς.
Τι σημαίνει αυτό για το οικοσύστημα Kubernetes και Cloud Native;
Η απόκτηση του Run:ai από την NVIDIA είναι σημαντική για τα οικοσυστήματα Kubernetes και cloud για διάφορους λόγους:
Βελτιωμένη ενορχήστρωση GPU στο Kubernetes: Η ενσωμάτωση των προηγμένων δυνατοτήτων διαχείρισης και εικονικοποίησης GPU του Run:ai στο Kubernetes θα επιτρέψει πιο δυναμική κατανομή και αποτελεσματική χρήση των πόρων GPU σε φόρτους εργασίας AI. Αυτό ευθυγραμμίζεται με τις δυνατότητες της Kubernetes στον χειρισμό σύνθετων εφαρμογών έντασης πόρων, ιδιαίτερα στην τεχνητή νοημοσύνη και τη μηχανική μάθηση, όπου η αποτελεσματική διαχείριση πόρων είναι ζωτικής σημασίας.
Προόδους στην υποδομή τεχνητής νοημοσύνης Cloud-Native: Αξιοποιώντας την τεχνολογία του Run:ai, η NVIDIA μπορεί να βελτιώσει περαιτέρω την ικανότητα του οικοσυστήματος Kubernetes να υποστηρίζει φόρτους εργασίας υπολογιστών υψηλής απόδοσης (HPC) και τεχνητής νοημοσύνης. Αυτή η συνέργεια μεταξύ της τεχνολογίας GPU της NVIDIA και του Kubernetes πιθανότατα θα οδηγήσει σε πιο ισχυρές λύσεις για την ανάπτυξη, τη διαχείριση και την κλιμάκωση εφαρμογών τεχνητής νοημοσύνης σε περιβάλλοντα που ανήκουν στο cloud.
Ευρύτερη υιοθέτηση και καινοτομία: Η εξαγορά θα μπορούσε να οδηγήσει στην ευρύτερη υιοθέτηση του Kubernetes σε τομείς που εξαρτώνται όλο και περισσότερο από την τεχνητή νοημοσύνη, όπως η υγειονομική περίθαλψη, η αυτοκινητοβιομηχανία και τα χρηματοοικονομικά. Η ικανότητα αποτελεσματικής διαχείρισης πόρων GPU σε αυτούς τους τομείς μπορεί να οδηγήσει σε ταχύτερους κύκλους καινοτομίας και ανάπτυξης για μοντέλα τεχνητής νοημοσύνης.
Επίδραση στην ωριμότητα Kubernetes: Η ενσωμάτωση των τεχνολογιών NVIDIA και Run:ai με το Kubernetes υπογραμμίζει την ωριμότητα και την ετοιμότητα της πλατφόρμας να υποστηρίξει προηγμένους φόρτους εργασίας AI, ενισχύοντας το Kubernetes ως το de facto σύστημα για σύγχρονες αναπτύξεις AI και ML. Αυτό θα μπορούσε επίσης να ενθαρρύνει περισσότερους οργανισμούς να υιοθετήσουν το Kubernetes για τις ανάγκες υποδομής AI.
Η κίνηση της NVIDIA να εξαγοράσει το Run:ai όχι μόνο ενισχύει τη θέση της στις αγορές τεχνητής νοημοσύνης και υπολογιστικού νέφους, αλλά ενισχύει επίσης την ικανότητα του οικοσυστήματος Kubernetes να υποστηρίζει την επόμενη γενιά εφαρμογών τεχνητής νοημοσύνης, προς όφελος ενός ευρέος φάσματος βιομηχανιών.