Connect with us

Nachrichten

AMD Instinct MI200 soll 110 Recheneinheiten pro MCM-GPU nutzen

blank

Published

blank

Webseite Quastenflosser Traum befindet sich a Github-Commit Dies könnte dem kommenden AMD Aldebaran GPU-basierten Instinct-Beschleuniger eine zukünftige Konfiguration signalisieren. Die neue GPU mit dem Codenamen ‚GFX90A‘ wird die CDNA2-Architektur verwenden, ein Derivat der GFX-Struktur der 9. Familie (Vega-Struktur).

AMD Instinct MI200 könnte zwei 110-Recheneinheiten-CDNA-2-GPU-Chips enthalten

Es gibt drei Codes, GFX906_60, GFX908_120 und GFX90A_110, die jeweils für eine andere Quelle spezifisch sind. Es wird spekuliert, dass sich der GFX906_60 auf den Instinct MI60 bezieht, der GFX908_120 ist der Instinct MI100 und der GFX90A_110 könnte für den AMD-Beschleuniger der neueren Generation verwendet werden. Bei jedem Code bezieht sich der dritte Teil auf Recheneinheiten.

AMD Zen+- und Zen 2-CPUs anfällig für Kernschmelze-ähnliche Cyber-Angriffe

Zum Beispiel verwendet der MI60 60 Recheneinheiten, der MI100 120 Einheiten und der letzte verwendet 110 Recheneinheiten. Interessant ist, dass der Next-Gen-Beschleuniger von AMD weniger Recheneinheiten benötigt als der MI100.

Quelle: VideoCardz

Es wird angegeben, dass die Aldebaran-GPU 128 Recheneinheiten präsentieren wird, was nicht mit den Informationen übereinstimmt, die über den Next-Gen-Code für den neuen AMD-Beschleuniger erhalten wurden. Jede GPU deaktiviert jedoch normalerweise einige der Cluster, was, wenn dies korrekt ist, auf 110 aktive Recheneinheiten herunterfallen würde.

In Anbetracht der Einstellungen der verschiedenen Shader-Engine und CU ist Aldebaran / MI200 eine MCM-Konfiguration mit 2 GPU-Dies. Wenn also die Einstellung für jeden Die anstelle der Shader-Engine symmetrisch ist, hat jeder Die 4 SEs. Es ist möglich, (56 CUs) zu haben und jede von ihnen zu deaktivieren, um insgesamt 110 CUs zu erhalten.

— Quastenflosser Traum

Webseite VideoCardz Zustände,

Es ist unklar, ob AMD plant, die Anzahl der FP32-Kerne auf der CDNA2-Architektur zu verdoppeln, aber angenommen, dass dies der Fall ist, würde der Beschleuniger mit einem theoretischen GPU-Takt von 1500 MHz eine Rechenleistung von 42,2 TFLOPS mit einfacher Genauigkeit bieten, 1,82x mehr als der MI100 . Ist dies nicht der Fall, müsste das MI200 mindestens 1650 MHz Takt haben, um den gleichen FP32-Durchsatz von 23 TFLOPs zu erreichen.

Bei HPC-Beschleunigern wie dem MI200 ist die FP64-Leistung weitaus wichtiger. Laut früheren Leaks soll MI200 die volle FP64-Leistung bieten, was je nach Architektur eine Verdoppelung oder Vervierfachung der Leistung gegenüber MI100 bedeutet.

AMDs MI200 soll vor Ende 2021 auf den Markt kommen. Es ist ihr revolutionärer Multi-Chip-Grafikprozessor, der mit zwei aktiven Chips und 128 Gigabyte HBM2e-Speicher ausgestattet ist.

AMD Radeon RX 6900 XTX Grafikkarte soll über 18 Gbit/s GDDR6 Speicher verfügen, höhere Taktraten mit Navi 21 XTXH GPU, schneller als RTX 3090

Das erwartet Sie vom AMD Instinct MI200 ‚CDNA 2‘ GPU-Beschleuniger

Im Inneren des AMD Instinct MI200 befindet sich eine Aldebaran-GPU mit zwei Dies, einem sekundären und einem primären. Es hat zwei Dies mit jeweils 8 Shader-Engines für insgesamt 16 SE’s. Jede Shader Engine enthält 16 CUs mit Full-Rate-FP64, gepacktem FP32 und einer Matrix-Engine der 2. Generation für FP16- und BF16-Operationen. Jeder Chip als solcher besteht aus 128 Recheneinheiten oder 8192 Stream-Prozessoren. Das ergibt insgesamt 220 Compute Units oder 14.080 Stream-Prozessoren für den gesamten Chip. Die Aldebaran-GPU wird auch von einem neuen XGMI-Interconnect angetrieben. Jedes Chiplet verfügt über eine VCN 2.6-Engine und den Haupt-IO-Controller.

Das Blockdiagramm von AMDs CDNA 2 angetriebener Aldebaran-GPU, die den Instinct MI200 HPC-Beschleuniger antreiben wird, wurde visualisiert. (Bildnachweis: Locuza)

Beim DRAM setzt AMD auf eine 8-Kanal-Schnittstelle bestehend aus 1024-Bit-Schnittstellen für eine 8192-Bit breite Busschnittstelle. Jede Schnittstelle kann 2 GB HBM2e DRAM-Module unterstützen. Dies sollte uns bis zu 16 GB HBM2e-Speicherkapazität pro Stack geben und da es insgesamt acht Stacks gibt, würde die Gesamtkapazität satte 128 GB betragen. Das sind 48 GB mehr als beim A100 mit 80 GB HBM2e-Speicher. Die vollständige Visualisierung der Aldebaran-GPU auf dem Instinct MI200 ist hier verfügbar.

AMD Radeon Instinct Beschleuniger 2020

Beschleunigername AMD Radeon Instinct MI6 AMD Radeon Instinct MI8 AMD Radeon Instinct MI25 AMD Radeon Instinct MI50 AMD Radeon Instinct MI60 AMD Instinct MI100 AMD Instinct MI200
GPU-Architektur Polaris 10 Fidschi XT Weg 10 Vega 20 Vega 20 Arkturus (CDNA 1) Aldebaran (CDNA 2)
GPU-Prozessknoten 14nm FinFET 28nm 14nm FinFET 7nm FinFET 7nm FinFET 7nm FinFET Erweiterter Prozessknoten
GPU-Kerne 2304 4096 4096 3840 4096 7680 14.080?
GPU-Taktgeschwindigkeit 1237 MHz 1000 MHz 1500 MHz 1725 MHz 1800 MHz ~1500 MHz TBA
FP16 Computing 5.7 TFLOPS 8.2 TFLOPS 24.6 TFLOPS 26.5 TFLOPS 29,5 TFLOPS 185 TFLOPS TBA
FP32-Berechnung 5.7 TFLOPS 8.2 TFLOPS 12.3 TFLOPS 13.3 TFLOPS 14.7 TFLOPS 23.1 TFLOPS TBA
FP64-Berechnung 384 GFLOPs 512 GFLOPS 768 GFLOPs 6.6 TFLOPS 7.4 TFLOPS 11,5 TFLOPS TBA
VRAM 16 GB DDR5 4 GB HBM1 16 GB HBM2 16 GB HBM2 32 GB HBM2 32 GB HBM2 64/128 GB HBM2e?
Speicheruhr 1750 MHz 500 MHz 945 MHz 1000 MHz 1000 MHz 1200 MHz TBA
Speicherbus 256-Bit-Bus 4096-Bit-Bus 2048-Bit-Bus 4096-Bit-Bus 4096-Bit-Bus 4096-Bit-Bus 8192-Bit
Speicherbandbreite 224 GB/s 512 GB/s 484 GB/s 1 TB/s 1 TB/s 1,23 TB/s ~2 TB/s?
Formfaktor Einzelschlitz, volle Länge Doppelschlitz, halbe Länge Doppelsteckplatz, volle Länge Doppelsteckplatz, volle Länge Doppelsteckplatz, volle Länge Doppelsteckplatz, volle Länge Dual Slot, volle Länge / OAM
Kühlung Passive Kühlung Passive Kühlung Passive Kühlung Passive Kühlung Passive Kühlung Passive Kühlung Passive Kühlung
TDP 150W 175W 300W 300W 300W 300W TBA

Quelle: VideoCardz, ROCm Github, Quastenflosser Traum

Click to comment

Leave a Reply

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.