Connect with us

Nachrichten

NVIDIA bringt A2-Tensor-Core-GPU auf den Markt, ein Einstiegsdesign mit Ampere GA107-GPU und 16 GB GDDR6-Speicher

blank

Published

blank

NVIDIA hat mit dem A2 Tensor Core GPU-Beschleuniger seine professionelle Rechenzentrums-Reihe von Ampere-GPUs weiter ausgebaut. Der neue Beschleuniger ist das Einstiegsdesign, das wir von NVIDIA gesehen haben, und bietet einige anständige Spezifikationen, basierend auf seiner Markteinstiegsbezeichnung.

NVIDIA A2 Tensor Core GPU ist ein Rechenzentrumsdesign der Einstiegsklasse mit Ampere GA107

Die NVIDIA A2 Tensor Core GPU wurde speziell für Inferencing entwickelt und ersetzt die Turing-betriebene T4 Tensor Core GPU. In Bezug auf die Spezifikationen verfügt die Karte über eine Variante der Ampere GA107 GPU SKU, die 1280 CUDA-Kerne und 40 Tensor-Kerne bietet. Diese Kerne laufen mit einer Taktfrequenz von 1,77 GHz und basieren auf dem Samsung 8nm Process Node. Nur die High-End-GA100-GPU-SKUs basieren auf dem TSMC-7-nm-Prozessknoten.

NVIDIA kündigt AGX Orin- und Jetson AGX Orin-Plattformen mit Orin-SOC an: 12 ARM Hercules-CPU-Kerne & Ampere-GPU

Das Speicherdesign umfasst eine 16-GB-GDDR6-Kapazität, die über eine 128-Bit-Bus-breite Schnittstelle läuft und mit 12,5 Gbit/s effektiv für eine Gesamtbandbreite von 200 GB/s taktet. Die GPU ist so konfiguriert, dass sie mit einer TDP zwischen 40 und 60 Watt arbeitet. Aufgrund seines Einstiegsdesigns kommt es auch in einem Small-Form-Factor-Design mit einem halbhohen und halblangen Formfaktor, der passiv gekühlt wird. Aufgrund seiner geringeren TDP benötigt er zum Booten keine externen Stromanschlüsse. Die Karte verfügt außerdem über eine PCIe Gen 4.0 x8-Schnittstelle anstelle des standardmäßigen x16-Links.

Die NVIDIA A2 Tensor Core GPU bietet Einstiegs-Inferenz mit geringem Stromverbrauch, geringem Platzbedarf und hoher Leistung für NVIDIA AI am Edge. Mit einer Low-Profile-PCIe-Gen4-Karte und einer geringen konfigurierbaren thermischen Designleistung (TDP) von 40-60 W bietet der A2 vielseitige Inferenzbeschleunigung für jeden Server für eine skalierte Bereitstellung.

über NVIDIA

In Bezug auf die Leistung werden die Rechenzahlen mit 4,5 TFLOPs (FP32), 0,14 TFLOPs (FP64), 36 TOPs (INT8), 18 TFLOPs (FP16 Tensor) und 9 TFLOPs (TF32) Tensor bewertet. Beim Vergleich der Leistung in IVA mit einer NVIDIA T4 bietet der A2 eine Verbesserung von bis zu 30 % bei einem viel geringeren Stromverbrauch. Die NVIDIA A2 Tensor-Core-GPU ist ab sofort verfügbar, obwohl es keine spezifischen Details zu den Preisen der Karte gibt.

NVIDIA Ampere Professional GPU-Reihe

GPU-Name A100 A40 A30 A16 A10 A2
Prozessknoten TSMC 7nm Samsung 8nm TSMC 7nm Samsung 8nm Samsung 8nm Samsung 8nm
GPU-SKU GA100-884 GA102-895 GA100-890 4x GA107 GA102-890 GA107
GPU-Transistoren 54,2B 28.3B 54,2B TBA 28.3B TBA
CUDA-Kerne 6912 10752 3584 2560 x 4 9216 1280
Tensorkerne 432 336 224 80 x 4 288 40
Boost-Uhr 1,41 GHz 1,74 GHz 1,44 GHz 1,69 GHz 1,69 GHz 1,77 GHz
FP32-Berechnung 19.49 TFLOPS 37,42 TFLOPS 10.32 TFLOPS 8,678 TFLOPS x4 31.24 TFLOPS 4.5 TFLOPS
FP64-Berechnung 9,74 TFLOPS 1.16 TFLOPS 5.16 TFLOPS 0,27 TFLOPS x4 0,97 TFLOPS 0,14 TFLOPS
FP16-Wettbewerb 77,97 TFLOPS 37,42 TFLOPS 10.32 TFLOPS 8,67 TFLOPS x4 31.24 TFLOPS 4.5 TFLOPS
INT8-Tensorberechnung 624 TOPS 598.6 TOPs 330 TOPS TBA 500 TOPS 36 TOPS
TF32 Tensor-Berechnung 156 TFLOPS 149,6 TOPs 82 TFLOPS TBA 125 TF 9 TFLOPS
PCIe-Verbindungen NVLink 3
12 Links
PCIe 4.0 x16 PCIe 4.0 x16 +
NVLink 3 (4 Links)
PCIe 4.0 x16 PCIe 4.0 x16 PCIe 4.0 x8
Speicherkapazität 40 GB HBM2e 48 GB DDR6 24 GB HBM2e 16 GB x4 GDDR6 24 GB DDR6 16 GB DDR6
Speicherbus 5120 Bit 384 Bit 3072 Bit 128 Bit x4 384 Bit 128-Bit
Speicheruhr 1215 MHz 1812 MHz 1215 MHz 1812 MHz 1563 MHz 1563 MHz
Bandbreite 1,55 TB/s 695,8 GB/s 933,1 GB/s 231,9 GB/s x4 600.2 GB/s 200 GB/s
TDP 400W 300W 165W 250W 150W 60W
Formfaktor SXM4 PCIe Dual-Slot, volle Länge PCIe Dual-Slot, volle Länge PCIe Dual-Slot, volle Länge PCIe-Einzelsteckplatz, FLHH PCIe-Einzelsteckplatz, HLHF