Nachrichten

AMD RDNA 2-GPUs haben eine viel bessere Speicherlatenz als die Ampere-GPU-Architektur von NVIDIA

Die Speicherlatenzleistung der Ampere-GPU-Architekturen von AMD RDNA 2 und NVIDIA wurde von getestet Pommes und Käse. Das Tech Outlet entschied sich, die GPU-Speicherlatenzleistung der neuesten GPU-Architekturen von Teamrot und Teamgrün zu testen und fand einige interessante Ergebnisse heraus.

Die RDNA 2-GPUs von AMD bieten im Vergleich zur Ampere-GPU-Architektur von NVIDIA eine überlegene Speicherlatenzleistung

Auf der CPU-Seite ist die Messung der Cache- und Latenzleistung zu einem entscheidenden Hinweis geworden, da immer mehr Multi-Chiplet-Chips und mehrere E / A-Chips an Bord desselben Chips und in jüngster Zeit auch außerhalb des Chips (AMD Zen-Chiplets) verwendet werden. GPUs bestehen auch aus mehreren Cache-Hierarchien, die die Lücken zwischen Rechen- und Speicherleistung füllen, und die Quelle verwendete OpenCL-basierte Zeigerjagd-Benchmarks, um die Cache- und Speicherlatenzleistung auf GPUs der aktuellen Generation wie NVIDIA Ampere und AMD RDNA 2 zu messen Architekturen.

AMD Van Gogh APUs bringen die Leistung von RDNA 2 in Ryzen-Notebooks mit extrem geringem Stromverbrauch, Quad Zen 2-Kernen und bis zu 8 Navi-Recheneinheiten

NVIDIA Ampere GPU vs AMD RDNA 2 GPU Cache und Latenzleistung gemessen. (Bildnachweis: Chips und Käse)

In den Benchmarks wurden die AMD Radeon RX 6800 XT (RDNA 2-GPU) und die NVIDIA GeForce RTX 3090 (Ampere-GPU) gegeneinander positioniert. Der Cache- und Speicher-Benchmark zeigt, dass die RDNA 2-Architektur von AMD weitaus besser abschneidet als die Ampere-GPU von NVIDIA und eine geringere Latenz bietet, obwohl auf dem Weg zum Speicher zwei weitere Cache-Ebenen überprüft werden müssen. Die Verwendung des Infinity-Cache fügt nur 20 ns über L2-Treffer hinzu und ist immer noch schneller als Ampere von NVIDIA.

Der angegebene Grund ist, dass die NVIDIA Ampere-basierte GA102-GPU einfach eine viel größere GPU ist und zwar ein herkömmlicheres GPU-Speichersubsystem mit nur zwei Cache-Ebenen verwendet, jedoch viele Zyklen dauern muss und zu einer Latenz von über 100 ns führt (L1) bis L2). RDNA 2 hat dagegen eine Latenz von nur 66 ns. Beachten Sie, dass die AMD Navi 21-GPU viel kleiner ist und über einen 4-MB-L2-Cache verfügt, während die NVIDIA GA102-GPU über einen 6-MB-L2-Cache für den gesamten Chip verfügt. Die NVIDIA A100 Ampere GPU für HPC verfügt über einen riesigen 40 MB L3-Cache.

Es folgt ein Hinweis zur Leistung von Chips und Käse:

Der Cache von RDNA 2 ist schnell und es gibt viel davon. Im Vergleich zu Ampere ist die Latenz auf allen Ebenen gering. Infinity Cache fügt bei einem L2-Treffer nur etwa 20 ns hinzu und hat eine geringere Latenz als Ampere’s L2. Erstaunlicherweise entspricht die VRAM-Latenz von RDNA 2 in etwa der von Ampere, obwohl RDNA 2 auf dem Weg zum Speicher zwei weitere Cache-Ebenen überprüft.

Im Gegensatz dazu bleibt Nvidia bei einem konventionelleren GPU-Speichersubsystem mit nur zwei Cache-Ebenen und hoher L2-Latenz. Der Wechsel von Amperes SM-privatem L1 zu L2 dauert über 100 ns. RDNAs L2 ist ~ 66 ns von L0 entfernt, selbst wenn sich ein L1-Cache zwischen ihnen befindet. Es scheint viele Zyklen zu dauern, um den massiven Würfel von GA102 zu umgehen.

Dies könnte die hervorragende Leistung von AMD bei niedrigeren Auflösungen erklären. Die L2- und L3-Caches mit niedriger Latenz von RDNA 2 bieten möglicherweise einen Vorteil bei kleineren Workloads, bei denen die Belegung zu gering ist, um die Latenz zu verbergen. Im Vergleich dazu erfordern die Ampere-Chips von Nvidia mehr Parallelität, um zu glänzen.

über Chips und Käse

Im Vergleich zu älteren Pascal- und Maxwell-Chips hat die Ampere-Architektur zu deutlich verbesserten Latenzgeschwindigkeiten bei viel größeren GPUs geführt. AMD hingegen hat gegenüber älteren Chips auf Basis der GCN- und VLIW-Architektur beeindruckende Gewinne erzielt. Diese Zahlen werden auf jeden Fall zum Vergleich interessant sein, sobald die neue Runde der Chiplet-basierten GPUs in den kommenden Jahren das Spielesegment erreicht.

Ähnliche Artikel

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Schaltfläche "Zurück zum Anfang"