Connect with us

Nachrichten

AMD Instinct MI300 könnte Quad-MCM-GPUs basierend auf der CDNA 3-Architektur enthalten

blank

Published

blank

AMD ist dabei, seinen Instinct MI200 GPU-Beschleuniger auf den Markt zu bringen, der der erste Chip mit einer MCM-Grafikarchitektur sein wird, aber es sieht so aus, als würde der Instinct MI300 der nächsten Generation mit der CDNA 3-Architektur ihn mit einem Quad-MCM-Design umhauen .

AMD Instinct MI300 soll über vier MCM-GPUs verfügen, die auf der CDN-3-Grafikarchitektur basieren

Es wird erwartet, dass der AMD Instinct MI200-Beschleuniger mit seiner CDNA 2-Architektur zwei GPU-Dies auf demselben Gehäuse enthält. Diese werden über eine Infinity Fabric-Verbindung verbunden und verfügen außerdem über einen separaten Die, der als mehrstufiger Cache zwischen den beiden GPUs dient. Jeder Grafikchip wird als GCD bezeichnet, während der Cache-Chip als MCD bezeichnet wird.

MINISFORUM enthüllt EliteMini X500 SFF PC mit AMD Ryzen 7 5700G Zen 3 APU, ab 859 US-Dollar für 16 GB DDR4 & 512 GB SSD-Variante

Es wird zwei CDN-2-GPUs an Bord des Instinct MI200-Pakets geben, aber der HPC-Beschleuniger der nächsten Generation soll dies verdoppeln. Entsprechend Kepler_L2, wird der Instinct MI300 ein 4-GCD-Design aufweisen, das auf der brandneuen CDNA 3-Architektur basiert. Der kommende Instinct MI200 sollte 128 Recheneinheiten pro Die aufweisen, aber das hat sich seit dem Gerücht von letzter Woche auf 110 Recheneinheiten geändert. Insgesamt 220 Recheneinheiten würden 14.080 Kerne ergeben und wenn wir die genaue Zahl nehmen und mit 4 multiplizieren (der Anzahl der GCDs auf dem Instinct MI300), erhalten wir am Ende 440 Recheneinheiten oder wahnsinnige 28.160 Kerne.

Eine aktuelle AMD ROCm-Entwicklertools-Update das wurde entdeckt von Komachi hat maximal 4 MCM-GPUs bestätigt, aber das sind einfach ‚Aldebaran‘-SKUs. Es wird erwartet, dass es mindestens vier CDNA 2-basierte Instinct-Beschleuniger mit ihren jeweiligen (eindeutigen IDs) gibt, die unten aufgeführt sind. Beachten Sie, dass die Zahl nicht die Anzahl der Würfel auf jedem Gerät darstellt, sondern das Gerät selbst:

  • 0x7408
  • 0x740C
  • 0x740F
  • 0x7410

Komachi hat auch bereits eine Matrize-Darstellung von AMD MI300 CDNA 3-Beschleunigern der nächsten Generation bereitgestellt. Es gibt vier GCDs und vier MCDs, wobei die MCDs oben auf der GCD sitzen, aber miteinander verbunden sind.

MSI veröffentlicht als erster AMD AGESA 1.2.0.4 BIOS-Firmware für B550- und B450-Motherboards – Aktualisierte SMU und TPM standardmäßig aktiviert für Windows 11

Nun, das wäre wahr, wenn AMD beim Wechsel von CDNA 2 zu CDNA 3 keinerlei Änderungen vornimmt, aber das ist nicht der Fall. Es wird erwartet, dass CDNA 3 eine überarbeitete neue Architektur hervorbringt, die kein weiteres Vega-Derivat wie Arcturus oder Aldebaran sein wird. Die GPU-Architektur kann auch ein Layout verwenden, das der neuen WGP/SE-Anordnung auf den neuen RDNA 3-Chips ähnelt, oder ein völlig neues Design, das auf das HPC-Segment zugeschnitten ist. Aber eines ist sicher, diese Quad-MCM-GPUs sind definitiv etwas, das wir in Aktion sehen können!

AMD Radeon Instinct Beschleuniger 2020

Beschleunigername AMD Radeon Instinct MI6 AMD Radeon Instinct MI8 AMD Radeon Instinct MI25 AMD Radeon Instinct MI50 AMD Radeon Instinct MI60 AMD Instinct MI100 AMD Instinct MI200 AMD Instinct MI300
GPU-Architektur Polaris 10 Fidschi XT Weg 10 Vega 20 Vega 20 Arkturus (CDNA 1) Aldebaran (CDNA 2) TBA (CDNA 3)
GPU-Prozessknoten 14nm FinFET 28nm 14nm FinFET 7nm FinFET 7nm FinFET 7nm FinFET Erweiterter Prozessknoten Erweiterter Prozessknoten
GPU stirbt 1 (monolithisch) 1 (monolithisch) 1 (monolithisch) 1 (monolithisch) 1 (monolithisch) 1 (monolithisch) 2 (MCM) 4 (MCM)?
GPU-Kerne 2304 4096 4096 3840 4096 7680 14.080? 28.160?
GPU-Taktgeschwindigkeit 1237 MHz 1000 MHz 1500 MHz 1725 MHz 1800 MHz ~1500 MHz TBA TBA
FP16 Computing 5.7 TFLOPS 8.2 TFLOPS 24.6 TFLOPS 26.5 TFLOPS 29,5 TFLOPS 185 TFLOPS TBA TBA
FP32-Berechnung 5.7 TFLOPS 8.2 TFLOPS 12.3 TFLOPS 13.3 TFLOPS 14.7 TFLOPS 23.1 TFLOPS TBA TBA
FP64-Berechnung 384 GFLOPs 512 GFLOPS 768 GFLOPs 6.6 TFLOPS 7.4 TFLOPS 11,5 TFLOPS TBA TBA
VRAM 16 GB DDR5 4 GB HBM1 16 GB HBM2 16 GB HBM2 32 GB HBM2 32 GB HBM2 64/128 GB HBM2e? TBA
Speicheruhr 1750 MHz 500 MHz 945 MHz 1000 MHz 1000 MHz 1200 MHz TBA TBA
Speicherbus 256-Bit-Bus 4096-Bit-Bus 2048-Bit-Bus 4096-Bit-Bus 4096-Bit-Bus 4096-Bit-Bus 8192-Bit TBA
Speicherbandbreite 224 GB/s 512 GB/s 484 GB/s 1 TB/s 1 TB/s 1,23 TB/s ~2 TB/s? TBA
Formfaktor Einzelschlitz, volle Länge Doppelschlitz, halbe Länge Doppelsteckplatz, volle Länge Doppelsteckplatz, volle Länge Doppelsteckplatz, volle Länge Doppelsteckplatz, volle Länge Dual Slot, volle Länge / OAM TBA
Kühlung Passive Kühlung Passive Kühlung Passive Kühlung Passive Kühlung Passive Kühlung Passive Kühlung Passive Kühlung TBA
TDP 150W 175W 300W 300W 300W 300W TBA TBA

!function(f,b,e,v,n,t,s){if(f.fbq)return;n=f.fbq=function(){n.callMethod? n.callMethod.apply(n,arguments):n.queue.push(arguments)};if(!f._fbq)f._fbq=n; n.push=n;n.loaded=!0;n.version='2.0';n.queue=[];t=b.createElement(e);t.async=!0; t.src=v;s=b.getElementsByTagName(e)[0];s.parentNode.insertBefore(t,s)}(window, document,'script','https://connect.facebook.net/en_US/fbevents.js'); fbq('init', '1503230403325633'); fbq('track', 'PageView');

Click to comment

Leave a Reply

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.