AMD Navi 23 Radeon RX-GPUs verfügen über 32 MB Infinity-Cache, RDNA 2-betriebene Van-Gogh-APUs und CDNA 2-betriebenen Instinct MI200 ohne Infinity-Cache
Spätestens Linux Kernel PatchAMD hat die Infinity-Cache-Größen seiner kommenden RDNA 2 Radeon RX-GPUs basierend auf der Navi 23-SKU bestätigt. Das Unternehmen hat außerdem bestätigt, dass weder Van Gogh mit RDNA 2-Antrieb noch Instinct-Beschleuniger mit CDNA 2-Antrieb über die Infinity Cache-Technologie verfügen.
AMD RDNA 2 Navi 23 GPU-fähige Radeon RX-GPUs mit 32 MB Infinity-Cache, einem Viertel des Infinity-Cache-Pools von Navi 21
Die Informationen wurden von entdeckt Coelacanth-Traum ((über Kepler_L2) und bestätigt die Cache-Größen und GPU-Konfigurationen mehrerer RDNA 2- und CDNA 2-GPUs. Der AMD Infinity Cache wurde erstmals auf den Grafikkarten der Radeon RX 6000-Serie mit der RDNA 2-Architektur eingeführt. Die Navi 21-SKU mit dem Codenamen Big Navi war die erste, die sie erhielt, aber kürzlich folgte die Navi 22-SKU. Jetzt erhalten wir auch eine dritte SKU in Form von Navi 23.
AMD RDNA 2 Powered Navi 23 GPU Für Radeon RX 6000 Grafikkarten
Der Patch bestätigt die Größe des Infinity-Cache, der als Level-3-Cache (L3) für alle drei RDNA 2-GPUs aufgeführt ist, die auf Desktop-PCs verfügbar sein werden. Die Navi 21 GPU ‘Sienna Cichlid’ verfügt über die größte Größe von 128 MB Infinity Cache, gefolgt von der Navi 22 GPU ‘Navy Flounder’ mit 96 MB L3 oder Infinity Cache. Die AMD Navi 23-GPU ‘Dimgry Cavefish’ wird die nächste GPU in der Reihe der Grafikkarten der Radeon RX 6000-Serie sein und 32 MB Infinity Cache enthalten. Das ist ein Viertel der L3-Größe der Big Navi-GPU.
Es wurde zuvor erwartet, dass Navi 23 Radeon RX 6000-GPUs 64 MB Infinity-Cache enthalten würden, aber dieses Gerücht wird jetzt entlarvt. Die Spezifikationen der Navi 23-GPU schlagen insgesamt 2048 Stream-Prozessoren und 32 Raytracing-Einheiten im GPU-Paket vor. Die GPU wird außerdem mit 32 MB Infinity-Cache ausgestattet sein, wodurch die Bandbreite erheblich gesteigert werden kann. Für den Speicher sehen wir eine GDDR6-Kapazität von bis zu 8 GB, die über eine 128-Bit-Busschnittstelle betrieben werden kann und Pin-Geschwindigkeiten von bis zu 16 Gbit / s bietet. Dies sollte die Gesamtbandbreite auf 256 GB / s bringen. Die Navi 23-GPU wird auch die kleinste der Navi 2X-Familie mit einer Chipgröße von rund 236 mm2 sein.
Grafikkarten-Aufstellung der AMD Radeon RX 6000-Serie “RDNA 2”:
Grafikkarte | AMD Radeon RX 6500 XT | AMD Radeon RX 6600 XT | AMD Radeon RX 6700 | AMD Radeon RX 6700 XT | AMD Radeon RX 6800 | AMD Radeon RX 6800 XT | AMD Radeon RX 6900 XT |
---|---|---|---|---|---|---|---|
GPU | Navi 23? | Navi 22? | Navi 22 (XL?) | Navi 22 (XT?) | Navi 21 XL | Navi 21 XT | Navi 21 XTX |
Prozessknoten | 7nm | 7nm | 7nm | 7nm | 7nm | 7nm | 7nm |
Die Größe | 236mm2? | 336mm2? | 336 mm2 | 336 mm2 | 520 mm2 | 520 mm2 | 520 mm2 |
Transistoren | TBA | 17,2 Milliarden? | 17,2 Milliarden | 17,2 Milliarden | 26,8 Milliarden | 26,8 Milliarden | 26,8 Milliarden |
Einheiten berechnen | 32 | TBA | TBA | 40 | 60 | 72 | 80 |
Stream-Prozessoren | 2048 | TBA | TBA | 2560 | 3840 | 4608 | 5120 |
TMUs / ROPs | TBA | TBA | TBA | 160/64 | 240/96 | 288/128 | 320/128 |
Spieluhr | TBA | TBA | TBA | 2424 MHz | 1815 MHz | 2015 MHz | 2015 MHz |
Boost Clock | TBA | TBA | TBA | 2581 MHz | 2105 MHz | 2250 MHz | 2250 MHz |
FP32-TFLOPs | TBA | TBA | TBA | 13.21 TFLOPs | 16.17 TFLOPs | 20,74 TFLOPs | 23.04 TFLOPs |
Speichergröße | 8 GB GDDR6 + 64 MB Infinity-Cache? | 12 GB GDDR6 + 96 MB Infinity-Cache? | 6-12 GB GDDR6 + 96 MB Infinity-Cache? | 12 GB GDDR6 + 96 MB Infinity-Cache | 16 GB GDDR6 +128 MB Infinity-Cache | 16 GB GDDR6 +128 MB Infinity-Cache | 16 GB GDDR6 +128 MB Infinity-Cache |
Speicherbus | 128-Bit? | 192-Bit | 192-Bit | 192-Bit | 256-Bit | 256-Bit | 256-Bit |
Speichertakt | 16 Gbit / s? | 14 Gbit / s? | 14 Gbit / s? | 16 Gbit / s | 16 Gbit / s | 16 Gbit / s | 16 Gbit / s |
Bandbreite | 256 GB / s? | 320 GB / s | 320 GB / s | 384 GB / s | 512 GB / s | 512 GB / s | 512 GB / s |
TDP | TBA | TBA | TBA | 230W | 250W | 300W | 300W |
Preis | TBA | TBA | TBA | 479 US-Dollar | 579 US-Dollar | 649 US-Dollar | 999 US-Dollar |
AMD CDNA 2-betriebene Aldebaran-GPU für instinktive MI200-HPC-Beschleuniger
Die andere GPU ist Aldebaran, der Codename für den Chip, der den Instinct MI200-Beschleuniger von AMD antreibt. Den Daten zufolge verfügt die GPU über 16 KB L1-Cache pro CU, was 2 MB des gesamten L1-Cache ausmacht, wenn man bedenkt, dass die GPU 128 Recheneinheiten packt. Die GPU enthält auch 8 MB gemeinsam genutzten L2-Cache, jedoch 14 CUs pro Shader Engine im Vergleich zu 16 CUs pro SE in der vorherigen Instinct-Aufstellung. Unabhängig davon wird angegeben, dass jede CU auf Aldebaran-GPUs eine deutlich höhere Rechenleistung aufweist.
Basierend auf der Namenskonvention selbst sieht es so aus, als ob der MI200 doppelt so schnell sein wird wie der Instinct MI100, aber um dies zu erreichen, wird erwartet, dass AMD mit seinem MCM-Design alles daran setzt. Beachten Sie, dass die CDNA 2-GPU von AMD auf einem brandneuen Prozessknoten hergestellt wird und eine AMD Infinity-Architektur der 3. Generation aufweist, die sich auf Exascale erstreckt, indem sie eine kohärente GPU-Konnektivität von bis zu 8-Wege ermöglicht.
AMD Radeon Instinct Accelerators 2020
Name des Beschleunigers | AMD Radeon Instinct MI6 | AMD Radeon Instinct MI8 | AMD Radeon Instinct MI25 | AMD Radeon Instinct MI50 | AMD Radeon Instinct MI60 | AMD Instinct MI100 | AMD Instinct MI100 |
---|---|---|---|---|---|---|---|
GPU-Architektur | Polaris 10 | Fidschi XT | Vega 10 | Vega 20 | Vega 20 | Arcturus | TBA |
GPU-Prozessknoten | 14 nm FinFET | 28nm | 14 nm FinFET | 7nm FinFET | 7nm FinFET | 7nm FinFET | Erweiterter Prozessknoten |
GPU-Kerne | 2304 | 4096 | 4096 | 3840 | 4096 | 7680 | 7680 x 2 (MCM)? |
GPU-Taktrate | 1237 MHz | 1000 MHz | 1500 MHz | 1725 MHz | 1800 MHz | ~ 1500 MHz | TBA |
FP16 Compute | 5.7 TFLOPs | 8.2 TFLOPs | 24.6 TFLOPs | 26.5 TFLOPs | 29,5 TFLOPs | 185 TFLOPs | TBA |
FP32 Compute | 5.7 TFLOPs | 8.2 TFLOPs | 12.3 TFLOPs | 13.3 TFLOPs | 14.7 TFLOPs | 23.1 TFLOPs | TBA |
FP64 Compute | 384 GFLOPs | 512 GFLOPs | 768 GFLOPs | 6.6 TFLOPs | 7.4 TFLOPs | 11.5 TFLOPs | TBA |
VRAM | 16 GB GDDR5 | 4 GB HBM1 | 16 GB HBM2 | 16 GB HBM2 | 32 GB HBM2 | 32 GB HBM2 | TBA |
Speichertakt | 1750 MHz | 500 MHz | 945 MHz | 1000 MHz | 1000 MHz | 1200 MHz | TBA |
Speicherbus | 256-Bit-Bus | 4096-Bit-Bus | 2048-Bit-Bus | 4096-Bit-Bus | 4096-Bit-Bus | 4096-Bit-Bus | TBA |
Speicherbandbreite | 224 GB / s | 512 GB / s | 484 GB / s | 1 TB / s | 1 TB / s | 1,23 TB / s | TBA |
Formfaktor | Einzelplatz, volle Länge | Doppelschlitz, halbe Länge | Doppelsteckplatz, volle Länge | Doppelsteckplatz, volle Länge | Doppelsteckplatz, volle Länge | Doppelsteckplatz, volle Länge | OAM |
Kühlung | Passive Kühlung | Passive Kühlung | Passive Kühlung | Passive Kühlung | Passive Kühlung | Passive Kühlung | Passive Kühlung |
TDP | 150W | 175W | 300W | 300W | 300W | 300W | TBA |
Van Gogh-APUs mit AMD RDNA 2-Stromversorgung für Notebooks mit extrem geringem Stromverbrauch
Der Patch bestätigt auch, dass die mit Spannung erwarteten Van Gogh-APUs mit RDNA 2 und Zen 2 für Notebooks mit extrem geringem Stromverbrauch nicht über Infinity Cache verfügen. Die Van Gogh-APUs verfügen zwar über einen 128-KB-GL1-Cache, 1 MB L2-Cache, der L3-Cache ist jedoch nicht vorhanden.
Dies ist sinnvoll für eine RDNA 2-iGPU der Einstiegsklasse, die für ihre primären Speicherbandbreitenanforderungen auf LPDDR4X- oder sogar LPDDR5-Speicher angewiesen ist. Diese APUs werden auf dem 7-nm-Prozessknoten hergestellt, aber wir haben keine genaue Zahl, wie hoch die maximale CU-Anzahl auf dem RDNA 2-Chip sein würde.
AMD GPU Cache-Info | RDNA L1 (GL1) | L2 (TCC) | L3 / Infinity Cache (MALL) |
---|---|---|---|
Rabe / Picasso Renoir / Lucienne / Cezanne | — —. | 1M | — —. |
Raven2 | — —. | 128K | — —. |
Vega20 | — —. | 4M | — —. |
Arcturus | — —. | 8M? | — —. |
Aldebaran | — —. | 8M | — —. |
Navi10 / Navi12 | 128K | 4M | — —. |
Navi14 | 128K | 2M | — —. |
Van Gogh | 128K | 1M | — —. |
Sienna Cichlid | 128K | 4M | 128M |
Navy Flunder | 128K | 3M | 96M |
Dimgrey Cavefish | 128K | 2M | 32M |