Introduktionen av grafikkort med Nvidias senaste arkitektur Ampere skedde inte med företagets konsumentkort utan istället med dess A100-grafikkort för datacenter. Utöver maximalt 8 192 CUDA-kärnor och 512 Tensorkärnor av tredje generationen bestyckades A100 också med 40 GB HBM2-minne, och det första datorsystemet som bestyckades med grafikkorten var DGX A100 AI.

data-denter-dgx-a100-technology-tensor-core-gpu-2c50-D@2x.jpg

Specifikationer: Ampere 100

Egenskap

A100 med HBM2E

A100

V100

Arkitektur

Ampere

Ampere

Volta

CUDA-kärnor

6 912

6 912

5 120

Boost-frekvens

~ 1,41 GHz

~ 1,41 GHz

1 530 MHz

Minnesfrekvens

3,2 Gbps HBM2E

2,4 Gbps HBM2

1,75 Gbps HBM2

Minnesbuss

5 120-bit

5 120-bit

4 096-bit

Minnesbandbredd

2,05 TB/s

1,54 TB/s

0,9 TB/s

Grafikminne

80 GB

40 GB

16 GB/32 GB

Enkelprecision

19,5 TFLOP/s

19,5 TFLOP/s

15,7 TFLOP/s

Dubbelprecision

9,7 TFLOP/s
(halv FP32)

9,7 TFLOP/s
(halv FP32)

7,8 TFLOP/s
(halv FP32)

INT8-Tensor

624 TOP/s

624 TOP/s

Saknas

FP16-Tensor

312 TFLOP/s

312 TFLOP/s

125 TFLOP/s

TF32-Tensor

156 TFLOP/s

156 TFLOP/s

Saknas

Kommunikationslänk

Nvlink 3
12 länkar (600 GB/s)

Nvlink 3
12 länkar (600 GB/s)

Nvlink 2
6 länkar (300 GB/s)

Grafikkrets

A100
(826 mm2)

A100
(826 mm2)

GV100
(815 mm2)

Transistorantal

54,2 miljarder

54,2 miljarder

21.1 miljarder

TDP

400 W

400 W

300 W/350 W

Tillverkningsteknik

TSMC 7nm

TSMC 7nm

TSMC 12nm FFN

Gränssnitt

SXM4

SXM4

SXM2/SXM3

Nvidia avtäcker nu datorsystemet DGX Station A100, vilken till skillnad från föregående system är en arbetsstation. Trots det mer kompakta formatet kan datorn husera bastanta beräkningsresurser då fyra A100-grafikkort tar plats på insidan. Dessa kan antingen bestå av originalkonfigurationen med 40 GB HBM2-minne, eller nya modeller som dubblerar detta till 80 GB HBM2E. Med fyra sådana ger det arbetsstationen total kapacitet om 320 GB HBM2E-minne.

Samtidigt som minnet dubbleras uppdateras standarden från HBM2 till HBM2E – där bokstaven "E" inom branschen ofta benämns som Enterprise då det endast väntas används inom datacenter. Nytt här är högre hastigheter – medan minnet i A100 med 40 GB HBM2E har en effektiv klockfrekvens om 2 400 MHz kliver A100 med 80 GB HBM2E upp till 3 200 MHz. Detta lyfter den redan skyhöga bandbredden från 1,54 TB/s till 2,05 TB/s.

Övrig konfiguration innefattar en 64-kärnig processor ur AMD:s Epyc 7000-serie. Denna sällskapas av 512 GB DDR4-primärminne och NVME-ansluten SSD-lagring med kapacitet om 7,68 TB. DGX Station A100 stöder också tekniken Multi-Instance GPU som gör det möjligt att dela upp datorns resurser mellan flera användare. Totalt kan 28 olika instanser skapas till ett av de fyra grafikkorten, vilket enligt Nvidia innebär att datorn är "ett datacentersystem utan datacentret".

Det befintliga datacentersystemet DGX A100 AI blir dock inte föråldrat med introduktionen av arbetstationen. Kunder som beställer DGX A100 AI kan nu välja A100-grafikkort med 80 GB HBM2, vilket ger systemen en total kapacitet om 640 GB grafikminne. Kunder som redan installerat system med 40 GB-modellerna kan också uppgradera till varianterna med dubblerad minnesmängd.

Läs mer om Nvidia A100: