Nachrichten
AMDs erste Exascale-APU soll angeblich Instinct MI300 sein: Angetrieben von Zen 4-CPU-Kernen und CDNA 3-GPU-Kernen für blitzschnelle HPC-Leistung

AMD scheint auch an seinem Exascale-APU-Produkt der ersten Generation zu arbeiten, dem Instinct MI300, der von Zen 4-CPU- und CDNA 3-GPU-Kernen angetrieben wird. Die Details dieses HPC-Chips wurden auch im neuesten Video von durchgesickert AdoredTV.
AMD Instinct MI300 wird das erste Exascale-APU-Produkt des Red Teams mit Zen 4-CPU, cDNA 3-GPU-Kernen und HBM3-Speicher
Die ersten Hinweise auf AMDs Exascale-APU reichen bis ins Jahr 2013 zurück, und im kommenden Jahr werden weitere Details enthüllt. Bereits 2015 gab das Unternehmen seinen Plan bekannt, den EHP anzubieten, einen Exascale Heterogenous Processor, basierend auf den damals kommenden Zen x86-Kernen und Grönland-GPU mit HBM2-Speicher auf einem 2,5D-Interposer. Die ursprünglichen Pläne wurden schließlich verworfen und AMD veröffentlichte seine EPYC- und Instinct-Reihe in ihren eigenen CPU- und GPU-Serversegmenten. Jetzt bringt AMD EHP- oder Exascale-APUs in Form des Instinct MI300 der nächsten Generation zurück.

AMDs erste Exascale-APU, der Instinct MI300, wurde geleakt und detailliert beschrieben. (Bildnachweis: AdoredTV)
Wieder einmal wird die AMD Exascale APU eine Harmonie zwischen den CPU- und GPU-IPs des Unternehmens bilden und die neuesten Zen 4-CPU-Kerne mit den neuesten CDNA 3-GPU-Kernen kombinieren. Dies soll die Exascale & Instinct APU der ersten Generation sein. In der von AdoredTV geposteten Folie wird erwähnt, dass die APU bis Ende dieses Monats abgeklebt wird, was bedeutet, dass wir einen möglichen Start im Jahr 2023 sehen können, gleichzeitig wird das Unternehmen voraussichtlich seine CDNA 3-GPU-Architektur für die vorstellen HPC-Segmente.
Das erste Silizium wird voraussichtlich im dritten Quartal 2022 in den Labors von AMD sein. Die Plattform selbst wird als MDC angesehen, was Multi-Die-Chip bedeuten könnte. In einem früheren Bericht wurde angegeben, dass die APU einen neuen „Exascale APU-Modus“ und Unterstützung für den SH5-Sockel bieten wird, der wahrscheinlich im BGA-Formfaktor verfügbar sein wird.
Neben den CPU- und GPU-IPs wäre ein weiterer wichtiger Treiber hinter der Instinct MI300 APU die HBM3-Speicherunterstützung. Obwohl wir uns immer noch nicht sicher sind, wie viele Chips auf der EHP APU vorhanden sind, hat Moore’s Law is Dead zuvor Chipkonfigurationen mit 2, 4 und 8 HBM3-Dies enthüllt. Der Die-Shot wird auf der Folie im neuesten Leak gezeigt und zeigt auch mindestens 6 Dies, die eine brandneue Konfiguration sein sollten. Es ist möglich, dass an mehreren Instinct MI300-Konfigurationen gearbeitet wird, von denen einige nur die CDNA 3-GPU-Dies und APU-Designs mit Zen 4- und CDNA3-IPs enthalten.
Es sieht also so aus, als würden wir die Exascale-APUs nach fast einem Jahrzehnt des Wartens definitiv in Aktion sehen. Der Instinct MI300 zielt definitiv darauf ab, den HPC-Bereich mit wahnsinnigen, noch nie dagewesenen Leistungsmengen und mit Kern- und Gehäusetechnologien zu revolutionieren, die eine Revolution für die Technologiebranche darstellen werden. Der Chip wird nächstes Jahr gegen NVIDIAs Grace+Hopper Super Chip und Intels Ponte Vecchio HPC-Beschleuniger antreten.
AMD Radeon Instinct Accelerators 2020
Beschleunigername | AMD Instinct MI300 | AMD Instinct MI250X | AMD Instinkt MI250 | AMD Instinkt MI210 | AMD Instinct MI100 | AMD Radeon Instinct MI60 | AMD Radeon Instinct MI50 | AMD Radeon Instinct MI25 | AMD Radeon Instinct MI8 | AMD Radeon Instinct MI6 |
---|---|---|---|---|---|---|---|---|---|---|
CPU-Architektur | Zen 4 (Exascale-APU) | N / A | N / A | N / A | N / A | N / A | N / A | N / A | N / A | N / A |
GPU-Architektur | TBA (cDNA 3) | Aldebaran (cDNA 2) | Aldebaran (cDNA 2) | Aldebaran (cDNA 2) | Arcturus (cDNA 1) | Weg 20 | Weg 20 | Weg 10 | Fidschi XT | Polaris 10 |
GPU-Prozessknoten | 5nm+6nm | 6nm | 6nm | 6nm | 7-nm-FinFET | 7-nm-FinFET | 7-nm-FinFET | 14-nm-FinFET | 28nm | 14-nm-FinFET |
GPU-Chiplets | 4 (MCM / 3D gestapelt) 1 (pro Würfel) | 2 (MCM) 1 (pro Würfel) | 2 (MCM) 1 (pro Würfel) | 2 (MCM) 1 (pro Würfel) | 1 (monolithisch) | 1 (monolithisch) | 1 (monolithisch) | 1 (monolithisch) | 1 (monolithisch) | 1 (monolithisch) |
GPU-Kerne | 28.160? | 14.080 | 13.312 | 6656 | 7680 | 4096 | 3840 | 4096 | 4096 | 2304 |
GPU-Taktfrequenz | TBA | 1700 MHz | 1700MHz | 1700 MHz | 1500MHz | 1800 MHz | 1725MHz | 1500MHz | 1000 MHz | 1237MHz |
FP16-Berechnung | TBA | 383 TOPS | 362 TOPS | 181 TOPS | 185 TFLOPs | 29,5 TFLOPs | 26,5 TFLOPs | 24,6 TFLOPs | 8.2 TFLOPs | 5.7 TFLOPs |
FP32-Berechnung | TBA | 95,7 TFLOPs | 90,5 TFLOPs | 45,3 TFLOPs | 23.1 TFLOPs | 14.7 TFLOPs | 13.3 TFLOPs | 12.3 TFLOPs | 8.2 TFLOPs | 5.7 TFLOPs |
FP64-Berechnung | TBA | 47,9 TFLOPs | 45,3 TFLOPs | 22.6 TFLOPs | 11,5 TFLOPs | 7.4 TFLOPs | 6.6 TFLOPs | 768 GFLOPs | 512 GFLOPs | 384 GFLOPs |
VRAM | 192 GB HBM3? | 128 GB HBM2e | 128 GB HBM2e | 64 GB HBM2e | 32 GB HBM2 | 32 GB HBM2 | 16 GB HBM2 | 16 GB HBM2 | 4 GB HBM1 | 16 GB GDDR5 |
Gedächtnisuhr | TBA | 3,2 Gbit/s | 3,2 Gbit/s | 3,2 Gbit/s | 1200MHz | 1000 MHz | 1000 MHz | 945 MHz | 500 MHz | 1750MHz |
Speicherbus | 8192-Bit | 8192-Bit | 8192-Bit | 4096 Bit | 4096-Bit-Bus | 4096-Bit-Bus | 4096-Bit-Bus | 2048-Bit-Bus | 4096-Bit-Bus | 256-Bit-Bus |
Speicherbandbreite | TBA | 3,2 TB/s | 3,2 TB/s | 1,6 TB/s | 1,23 TB/s | 1 TB/s | 1 TB/s | 484GB/Sek | 512GB/Sek | 224GB/Sek |
Formfaktor | OAM | OAM | OAM | Dual-Slot-Karte | Dual Slot, volle Länge | Dual Slot, volle Länge | Dual Slot, volle Länge | Dual Slot, volle Länge | Doppelschlitz, halbe Länge | Einzelschlitz, volle Länge |
Kühlung | Passive Kühlung | Passive Kühlung | Passive Kühlung | Passive Kühlung | Passive Kühlung | Passive Kühlung | Passive Kühlung | Passive Kühlung | Passive Kühlung | Passive Kühlung |
TDP | ~600W | 560W | 500 W | 300W | 300W | 300W | 300W | 300W | 175W | 150W |
