Nvidia uvádí Voltu pro PCI Express s výkonem 14 TFLOPS. Dostupnost „později tento rok“

21. 6. 2017

Včera AMD uvádělo na trh procesory Epyc, kterými se architektura Zen dostává do serverů. Překvapivě se prakticky ve stejnou dobu objevilo také serverové oznámení Nvidie. To působí na první pohled pikantně (jako by šlo o reakci na publicitu u konkurence), nicméně vysvětlení je takové, že firma nyní prezentuje na ISC (International Supercomputing Conference) a novinky tedy přicházejí k této příležitosti. Nvidia na této akci oznámila druhou „grafiku“ založenou na čipu Volta GV100: výpočetní kartu Tesla V100 v provedení PCI Express, tedy klasické do slotu instalované karty, zatímco první představená Volta měla speciální proprietární provedení.

Tesla V100 pro PCI Express

PCI Express verze Tesly V100 staví na stejném GPU, které Nvidia představila v květnu – 815 mm² velký čip vyráběný 12nm procesem TSMC, údajně na míru upraveným pro Nvidii. Karta používá konfiguraci se stejným množstvím výpočetních jednotek, 5120 stream procesory a 640 speciálními „Tensor“ jádry, která provádějí výpočty FMA s maticemi 4×4 hodnot. Rozdíl proti proprietárnímu provedení (modul SXM2) je, že karta do PCI Express běží na nižším taktu. Místo 1455 MHz by měla mít frekvenci okolo 1370 MHz.

Snížení taktu znamená, že hrubý výkon GPU (v FP32) klesl z 15 na 14 TFLOPS, přičemž v dvojité přesnosti je poloviční (7 TFLOPS). Výpočty s poloviční přesností FP16 jsou podporovány s dvojnásobným výkonem, tedy 28 TFLOPS; tensorová jádra mají pak při plném využití teoretický výkon 112 TFLOPS. Efektivita by ovšem mohla být lepší než u modulu SXM2. Ten má totiž TDP 300 W, kdežto karta Tesla V100 jen 250 W. Strop spotřeby je tedy o šestinu nižší, ačkoliv takt šel dolů jen o 6 %. Nicméně uváděné frekvence jsou dynamické a měly by platit pro boost, takže poměr reálného výkonu v určité zátěži nemusí nutně odpovídat.

Chlazení karty je pasivní zabírající dva sloty a počítá s proudem vzduchu v rackové serverové skříni. Aktivně chlazená verze pro běžné skříně představena nebyla. Karta nemá žádné obrazové výstupy, jelikož je určená čistě pro výpočetní nasazení. A to jak pro dnes tlačené strojové učení, ale také pro vědecké výpočty, jelikož umí FP64 s plným výkonem.

Vizualizace čipu Nvidia GV100 s HBM2 (na PCB modulu SXM2)

Takt pamětí HBM2 v pouzdře je naopak zachován stejný na 1,75 GHz efektivně, což dává propustnost 900 GB/s (GPU má 4096bitovou sběrnici). Kapacita paměti je 16 GB. V minulé generaci Nvidia nabízela také verze, v nichž byl jeden čip HBM2 ze čtyř deaktivován (šlo zřejmě o zmetky z výroby), takže kapacita byla jen 12 GB a propustnost o čtvrtinu nižší. U Volty už tato konfigurace v nabídce není, alespoň prozatím. Je možné, že výroba pokročila a čipy se testují ještě před osazením, takže se zmetky nejsou problémy.

Cenu, za kterou se tato Volta bude prodávat, Nvidia nesdělila. To ovšem není neobvyklé, výpočetní karty často veřejně avizovanou cenu nemají. Včerejší odhalení je také papírové, jak je v tomto segmentu časté (a platí to i pro SXM2 model Tesly V100). Kdy přesně budou karty dostupné, řečeno nebylo, má to však nastat „později v letošním roce“. Tímto firmy většinou míní čtvrtý kvartál, ale to je jen spekulace, určitá šance na uvedení ještě v Q3 asi existuje.