22.10.2022

Nvidia RTX 4090 - die neue Top Leistungsklasse

Nvidia hat mit der GeForce RTX 4090 die erste Grafikkarte mit der neuen Ada Lovelace-Architektur (Codename AD102) auf den Markt gebracht. Wie bei Nvidia üblich wird zuerst das stärkste und damit auch teuerste Modell zuerst eingeführt und dient als Flaggschiff.

Bei der Ada Lovelace-Architektur kommt ein neuer filigraner Fertigungsprozess in 4 Nanometer zum tragen. Trotz kleinerer GPU Fläche im Vergleich zu den Vorgängern RTX 3080 – 3090TI hat sich die Anzahl von Transistoren um das 2.7- Fache von 28 Milliarden auf 76.3 Milliarden vergrössert.

Obwohl der Preis der RTX 4090 nur etwas höher ist als bei der vorherigen Generation RTX 3090, sind die Spezifikationen extrem beeindruckend. 56 % mehr FP32-ALUs (früher CUDA-Kerne genannt) und 46 % höherer Boost-Takt. Dazu kommen 128 Ray-Tracing Kerne (3. Gen.) was einem Zuwachs von 50% entspricht. Auch die Tensor-Recheneinheiten (4. Gen.) wachsen mit 76% auf 576 . Solche Leistung verlangt auch eine adäquate Stromversorgung. Die Leistungsaufnahme (TDP) liegt bei 450 Watt. Die Karten haben auf Grund der Kühlelemente in der Regel eine Slotbreite von 3.5.

Die Nvidia RTX 4090 wurde als Consumer Grafikkarte entwickelt und adressiert in erster Linie den enthusiastischen Gamer an. Auf Grund ihrer Leistung sowie Ausstattung mit Ray-Tracing und Tensor-Cores ist sie auch eine interessante GPU für professionelle Workloads wie Videobearbeitung, GPU-Rendering oder High Performance Computing / AI.

Performance bei professionellen Anwendungen

Wir haben die wichtigsten Benchmarks für professionelle Anwendungen wie Content Creation oder Scientific Computing im Zusammenhang mit der RTX 4090 zusammengestellt. 

Davinci Resolve


Wenn wir uns bei diesem Test den GPU-Score ansehen, sehen wir, wie die GPUs bei Aufgaben wie OpenFX und Rauschunterdrückung abschneiden, bei denen die Leistung der GPU selbst typischerweise der begrenzende Faktor ist. In diesem Fall war die RTX 4090 34 % schneller als die RTX 3090 Ti oder 42 % schneller als die RTX 3090. Die RTX 4090 kann nicht ganz mit einem Dual-RTX-3090-Setup mithalten, aber eine Dual-RTX 4090 ist immerhin 40% schneller als eine Dual-RTX 3090.

V-Ray




Die Ergebnisse zeigen, dass die RTX 4090 doppelt so schnell ist wie die RTX 3090. Sie ist sogar schneller als zwei RTX 3090 sowie viermal scheller als eine RTX 2080TI. Die Ergebnisse zeigen ausserdem, dass die RTX 4090 in V-Ray gut skaliert, wobei zwei GPUs etwa 83 % schneller sind als nur eine. Um diese Zahl weiter zu relativieren, würden zwei RTX 4090 ungefähr 4 RTX 3090 oder etwa 7-8 RTX 2080 Ti entsprechen.

Leider bietet die RTX 4090 kein NVLink. Wenn sehr grosse Szenen verwendet werden und NVLink benötigt wird um VRAM zu poolen, ist das mit der RTX 4090 nicht möglich. Die RTX A6000 mit 48 GB VRAM ist in diesem Falle besser geeignet.

Octane Render



Auch bei Octane zeigen die Benchmarks, dass die neue Nvidia GeForce RTX 4090 die Geschwindigkeit der Vorgängergeneration RTX 3090 und RTX 3090 Ti fast verdoppelt, nämlich um 92 % bzw. 83 %. Zwei RTX 4090 skalieren nahezu perfekt und ermöglichen wirklich beeindruckende Renderzeiten. GPU Render wie Blender oder weitere Rendering-Engines zeigen ein ähnliches Resultat. In den meisten Fällen ist die RTX 4090 fast doppelt so schnell wie die beste Grafikkarte der 30er-Serie.

Adobe Suite

Die Adobe Programme wie Adoe Premiere Pro oder Adobe After Effects sind vor allem prozessorlastig und profitieren weniger von High-Performance GPUs. Dies ändert sobald Render-Plugins eingesetzt werden.

ML-AI and Scientific Computing Performance

High-Performance GPUs werden auch häufig in AI und Scientific Anwendungen eingesetzt. Auch hier enttäuscht die RTX 4090 nicht! NVIDIA hat es wieder einmal geschafft, die Leistung im Vergleich zur letzten Generation fast zu verdoppeln.

HPL (Linpack)

Der HPL-Linpack Benchmark wurde für NVIDIA High-End-GPUs entwickelt und testet auch Multi-GPU Nodes. Dies ist der Standard Benchmark für die Top500 Supercomputer. Auch bei diesen Tests ist die RTX 4090 fast doppelt so schnell wie die Vorgängermodelle.

Performance Boost bei profesionellen Anwendungen

Insgesamt erreicht die neue NVIDIA GeForce RTX 4090 GPU einen massiven Leistungssprung. Wie gross der Leistungsgewinn ist hängt schlussendlich von der Anwendung ab. Den grössten Leistungssprung bringt die RTX 4090 in Anwendungen welche einen grossen Teil des Workflows auf der GPU rechnen.

Bei der Videobearbeitung erreicht die RTX 4090 bis zu 40 % Leistungssteigerung gegenüber der Vorgängergeneration RTX 3090 und 3090 Ti, oder fast doppelt so schnell wie die ältere RTX 2080 Ti. Die RTX 40-Serie bringt auch einen kleinen Leistungsschub für diejenigen, welche die GPU entweder für die Hardware-Dekodierung oder die Kodierung von H.264- und HEVC-Medien verwenden.

Schliesslich ist das GPU-Rendering der Bereich, in dem am meisten aus einem leistungsstärkeren Grafikprozessor herausgeholt werden kann, und die RTX 4090 ist hier ein echter Volltreffer. Das GPU-Rendering ist oft fast doppelt so schnell wie bei der vorherigen Generation der RTX 3090 oder 3090 Ti oder viermal schneller als bei der älteren RTX 2080 Ti. Auch die Benchmarks für High-Performance Computing / AI zeigen einen massiven Leistungszuwachs der RTX 4090 gegenüber der Vorgängergeneration RTX 3090.

Limitationen:

Leider bietet die neue RTX 4090 kein NVLink mehr an und damit ist ein VRAM Pooling nicht möglich. Für die meisten Benutzer ist dies kein Problem. Für professionellen Workloads welche hohe VRAM Kapazität fordern, sind die Profi Grafikarten NVIDA Quadro oft die besser Wahl.

Die RTX 4090 benötigt vier PCIe-Stromanschlüsse und ist mehr als drei Steckplätze breit. Damit beschränkt sich die Anzahl GPUs pro System in der Regel auf zwei.

RTX 4090 im Gaming

Nach dem wir die RTX 4090 für professionelle Workflows angeschaut haben, wenden wir uns der eigentlichen Zielgruppe hin; dem Gaming. Die ersten Tests bestätigen die brachiale Leistung der RTX 4090. Die RTX 4090 zeigt ihre Stärke bei Spielen in 4K Auflösung und höher. Sie ist bei 4K Auflösung im Durchschnitt 70% schneller als die RTX 3090. Bei tieferer Auflösung sinkt der Vorsprung da der Prozessor der limitierende Faktor ist.

Games welche Raytracing unterstützen sind bis zu 87% schneller verglichen mit einer RTX 3090. Dank der Unterstützung von Nvidia DLSS 3.0 (Nvidia DLSS 3.0) kann sich die Framerate nahezu verdoppeln. Das wird dadurch erreicht, dass jedes zweite Bild komplett von einer künstlichen Intelligenz berechnet wird. Denn anstatt nur die Unterschiede zwischen zwei Einzelbildern zu erkennen und daraus ein drittes Bild zu erstellen, erkennt DLSS 3.0 Bewegungsvektoren von Objekten und ermittelt per KI, wie sich diese wahrscheinlich fortbewegen werden. Damit kann die Limitation des Prozessors umgangen werden. Spiele wie der Microsoft Flightsimulator 2020, welche DLSS 3.0 unterstützen, verdoppeln damit die Frameraten.

Die neuen Nvidia RTX 4090 Grafikkarten können ab sofort im Online Konfigurator bei allen High End PCs und Workstations ausgewählt werden. Bei limitierter Verfügbarkeit erfolgt die Zustellung in der Reihenfolge des Bestelleingangs.

Über den/die Autor(in)

A photo of Manuel Gutierrez

 

Manuel Gutierrez / Business Development

Nach einer Berufslehre als Elektroniker hat Manuel Gutierrez ein Ingenieurstudium in Nachrichtentechnik abgeschlossen sowie Weiterbildungen an der Universität St.Gallen sowie in Boston/Harvard absolviert. Nach einem kurzen Ausflug in die Software-Entwicklung war Manuel Gutierrez als Sales Director Schweiz verantwortlich für den Vertrieb von Netzwerk-Lösungen sowie Fix- und Mobilnetze für Carriers in Europa. Manuel Gutierrez hat über 12 Jahre ausgewiesene Erfahrung als Geschäftsführer in diversen global operierenden Technologie-Unternehmungen (Ascom, Alcatel, Fujitsu-Siemens) zuletzt als Managing Director und Delegierter des Verwaltungsrates von Fujitsu Technology Solutions AG Schweiz.

Bei brenford ist Manuel Gutierrez für das Business Development zuständig.