Η Nvidia παρουσίασε πρόσφατα τις δυνατότητες των GPU καταναλωτών RTX της σε μια εκδήλωση τύπου, σύμφωνα με Benchlife.Info. Η εταιρεία επεσήμανε πώς οι GPU της είναι καλύτερες από τις κανονικές Εξοπλισμένο με NPU Υπολογιστές στο χειρισμό εργασιών AI. Παρουσίασε επίσης αρκετές σημεία αναφοράςη οποία έδειξε ότι οι GPU της έχουν καλύτερη απόδοση από τον ανταγωνισμό τετράδια με επιτάχυνση υλικού AI, συμπεριλαμβανομένου του MacBook Pro που διαθέτει το κορυφαίο της Apple M3 Max πατατακι.
Ολόκληρη η εκδήλωση επικεντρώθηκε στο πώς οι GPU RTX της Nvidia ξεπερνούν τις σύγχρονες επιδόσεις “AI υπολογιστές” εξοπλισμένο με NPU. Σύμφωνα με την Nvidia, η βαθμολογία απόδοσης 10–45 TOPS που βρίσκεται στους σύγχρονους επεξεργαστές Intel, AMD, Apple και Qualcomm είναι αρκετή μόνο για “βασικούς” φόρτους εργασίας AI. Η εταιρεία έδωσε πολλά παραδείγματα, συμπεριλαμβανομένης της επεξεργασίας φωτογραφιών, δημιουργία εικόνων, αναβάθμιση εικόνας, και βελτιωμένη βοήθεια κωδικοποίησης μέσω AI, την οποία ισχυρίστηκε ότι οι υπολογιστές τεχνητής νοημοσύνης που διαθέτουν NPU είτε δεν μπορούν να χειριστούν είτε είναι ικανοί να εκτελέσουν μόνο σε πολύ βασικό επίπεδο. Οι GPU της Nvidia, από την άλλη, μπορούν να χειριστούν όλες τις εργασίες AI και να τις εκτελέσουν με καλύτερη απόδοση ή/και ποιότητα, φυσικά.
Η Nvidia δήλωσε ότι οι RTX GPU της είναι πολύ πιο αποδοτικές από τις NPU και μπορούν να επιτύχουν οπουδήποτε μεταξύ 100 και 1300+ TOPS, ανάλογα με τη GPU. Η εκδήλωση της Nvidia έφτασε στο σημείο να κατηγοριοποιήσει τις RTX GPU της ως εξοπλισμό “Premium AI”, ενώ ρυθμίζει τις NPU σε μια χαμηλότερη κατηγορία εξοπλισμού “Basic AI”. (Η Nvidia πρόσθεσε επίσης μια άλλη κατηγορία, cloud computingτον οποίο χαρακτήρισε ως εξοπλισμό “βαριάς τεχνητής νοημοσύνης” που διαθέτει χιλιάδες TOPS απόδοσης, χωρίς αμφιβολία ένα νεύμα για H100 και Β200 Business GPU Blackwell.)
Η Nvidia μοιράστηκε αρκετά σημεία αναφοράς εστιασμένα στην τεχνητή νοημοσύνη, τα οποία συνέκριναν τις τελευταίες GPU της σειράς RTX 40 με ορισμένους από τους ανταγωνιστές της. Για τη δημιουργία περιεχομένου, η Nvidia έδειξε ένα σημείο αναφοράς που συγκρίνει τη GPU φορητού υπολογιστή RTX 4090, τη GPU φορητού υπολογιστή RTX 4050 και το Apple Macbook Pro M3 Max σε πολλές εφαρμογές δημιουργίας περιεχομένου που χρησιμοποιούν AI — με Stable Diffusion, Arnold, Blender, Chaos V-ray, Octane, Adobe Premier Pro Enhance Speech, DaVinci Resolve και ON1 Resize AI. Το σημείο αναφοράς έδειξε ότι η GPU φορητού υπολογιστή RTX 4090 έχει καλύτερη απόδοση από το Macbook Pro που είναι εξοπλισμένο με M3 Max κατά πάνω από 7 φορές στις πιο ακραίες περιπτώσεις και η GPU φορητού υπολογιστή RTX 4050 έχει καλύτερη απόδοση από το ίδιο Macbook Pro κατά πάνω από 2 φορές. Κατά μέσο όρο, το κινητό RTX 4090 ξεπέρασε τις επιδόσεις του M3 Max κατά 5 φορές, ενώ το RTX 4050 LT το ξεπέρασε κατά 50–100 τοις εκατό.
Ένα άλλο σημείο αναφοράς της Nvidia έδειξε ενσωματωμένα μοντέλα μεγάλων γλωσσών (LLMs), χρησιμοποιώντας φόρτο εργασίας Llama 2 7B int4 LLM. Η Nvidia αντιμετώπισε το κινητό RTX 4090 με το M3 Max και το κινητό RTX 4050 με το βασικό τσιπ M3 της Apple. Το RTX 4090 ήταν 42% ταχύτερο από το M3 Max, αλλά με μέγεθος παρτίδας οκτώ, το τσιπ ήταν 90% πιο γρήγορο. Ομοίως, το κινητό RTX 4050 ήταν 48% πιο γρήγορο από το Apple M3, αλλά με μέγεθος παρτίδας οκτώ, το RTX 4050 ήταν 90% πιο γρήγορο. Οι αλλαγές μεγέθους παρτίδας είναι μια βελτιστοποίηση που μπορεί να βελτιώσει την απόδοση της τεχνητής νοημοσύνης, ανάλογα με την αρχιτεκτονική.
Η Nvidia έδειξε ένα τρίτο σημείο αναφοράς χρησιμοποιώντας το UL Procyon Stable Diffusion 1.5 έναντι της AMD. Για αυτήν τη δοκιμή, η Nvidia έβαλε σε αντίθεση με ολόκληρη τη σειρά επιτραπέζιων GPU της σειράς RTX 40 έναντι της AMD Radeon RX 7900 XTX. Κάθε GPU Nvidia, ξεκινώντας από το RTX 4070 Super και υψηλότερο, ξεπέρασε τις επιδόσεις της ναυαρχίδας της AMD — και το RTX 4090 το ξεπέρασε κατά 2,8 φορές. Το RTX 4060 Ti και το RTX 4060, ωστόσο, ήταν αισθητά πιο αργά. Το βασικό είναι ότι η ναυαρχίδα GPU της Nvidia είναι σημαντικά ταχύτερη από την αντίστοιχη GPU της AMD, τουλάχιστον σε αυτόν τον συγκεκριμένο φόρτο εργασίας. (Τα δικά μας Σταθερά σημεία αναφοράς διάχυσης πείτε μια παρόμοια ιστορία, με το 4090 να ξεπερνά το 7900 XTX κατά 2,75Χ στη γενιά 768×768 και το 2,86Χ με τη γενιά εικόνων 512×512.)
Με τα φώτα της δημοσιότητας στους φορητούς υπολογιστές τεχνητής νοημοσύνης με NPU και τους υπολογιστές AI φέτος, η Nvidia υπενθυμίζει σε όλους ότι οι GPU RTX της είναι ήδη πολύ πιο ισχυρές εναλλακτικές λύσεις. Όχι μόνο είναι πολύ ισχυρά, αλλά υπάρχουν σήμερα ουσιαστικά περισσότερες GPU RTX από ό,τι υπάρχουν υπολογιστές εξοπλισμένοι με NPU – που σημαίνει ότι πολλοί υπάρχοντες φορητοί υπολογιστές και υπολογιστές με κάρτες RTX είναι ήδη έτοιμοι για AI.
Η Nvidia κάνει κάτι καλό: Οι RTX GPU της παρέχουν περισσότερη απόδοση σε σύγκριση με τις πιο πρόσφατες NPU που εμφανίζονται στο Snapdragon X Elite της Qualcomm και στο AMD Σειρά Ryzen 8040 ομόλογοί. Ωστόσο, δεν έχουμε δει ακόμη τις GPU της Nvidia RTX να γίνονται ένα κρίσιμο μέρος των υπολογιστών AI. της Microsoft επίσημος ορισμός για υπολογιστές AI απαιτεί την προσθήκη μιας NPU παράλληλα με την CPU/GPU — που σημαίνει ότι τα περισσότερα συστήματα που είναι εξοπλισμένα με RTX εξακολουθούν να είναι “ακατάλληλα”, καθώς τα περισσότερα δεν διαθέτουν ενσωματωμένες NPU.
Η Microsoft εξετάζει επίσης σαφώς όχι μόνο την ακατέργαστη υπολογιστική ισχύ, αλλά και την αποτελεσματικότητα της εκτέλεσης της εργασίας. Το ότι μια GPU φορητού υπολογιστή RTX 4090 μπορεί να χτυπήσει τις ενσωματωμένες NPU δεν πρέπει να εκπλήσσει όλους. Αλλά το κινητό 4090 έχει επίσης βαθμολογηθεί ότι αντλεί ισχύ 80W έως 150W, περίπου 2Χ έως 5 φορές περισσότερη από ό,τι απαιτούν πολλοί από αυτούς τους επεξεργαστές για φορητές συσκευές.
Θα είναι ενδιαφέρον να δούμε αν η Microsoft αλλάξει γνώμη σχετικά με τον ορισμό ενός υπολογιστή τεχνητής νοημοσύνης στο μέλλον — ή πιο συγκεκριμένα, πότε θα αλλάξει τον ορισμό και με ποιους τρόπους. Το 45 TOPS ως βασικό επίπεδο απόδοσης, μέσω μιας ενεργειακά αποδοτικής NPU, θα φέρει επιτάχυνση AI στους κύριους καταναλωτές. Στην πραγματικότητα, η Microsoft επιμένει ακόμη και ότι είναι Δεύτερος πιλότος λογισμικό που τρέχει στη NPU αντί για την GPU, για να βελτιώσει τη διάρκεια ζωής της μπαταρίας. Αλλά είναι αναπόφευκτο ότι κάποια στιγμή θα έχουμε εργαλεία τεχνητής νοημοσύνης που χρειάζονται πολύ περισσότερα από αυτά τα αρχικά 45 TOPS υπολογισμού, και οι αποκλειστικές GPU είναι ήδη πολύ πιο κάτω.