Nvidia ještě zrychlila Voltu. Tesla V100S má vyšší výkon a rekordní propustnost pamětí

28. 11. 2019

Sdílet

V posledních týdnech se opět začínají objevovat zprávy o příchodu nové architektury GPU od Nvidie, čipů Ampere. Ty by asi mohly být výpočetní, jelikož GPU Volta bylo odhaleno už před dvěma a půl roky a 7nm následník umožňující výrazné zvýšení výkonu by dával smysl. Nicméně do příchodu takové novinky asi ještě zbývají nějaké ty měsíce času, Nvidia totiž teď přišla s novým modelem výpočetního akcelerátoru založeným právě ještě na 12nm čipu Volta: kartě Tesla V100S.

Už na konferenci Supercomputing 2019 si všiml Ian Cutress z AnandTechu, že v některých vystavovaných HPC serverech se nachází nový výpočetní akcelerátor Tesla „V100S“. Někteří vystavovatelé mu sdělili, že karta tam měla být původně na této akci odhalena, ale že si to Nvidia zřejmě rozmyslela na poslední chvíli (propagační materiály byly údajně připravené) a přišel příkaz tento produkt neprezentovat. Uvedení GPU Tesla V100S ale nastalo nyní, byť zdá se celkem potichu bez publicity – tento model se prostě objevil v materiálech firmy pro rodinu GPU Volta.

Tesla V100S bude dostupná jen v provedení karty do slotu PCI Express 3.0 ×16, tedy zřejmě nikoliv v kompaktním formátu SXM2 (to také Nvidia v letáku označuje jako provedení „for NVLink“). 12nm GPU Volta (GV100) má v tomto novém modelu aktivních 5120 stream procesorů, ovšem na vyšším taktu než u modelu V1000, přičemž také takt pamětí byl zvýšen. Karta by tak měla být zřejmě zatím nejvýkonnějším modelem řady Tesla.

Nvidia Tesla V100S Supercomputing 2019 AnandTech 1 Nvidia Tesla V100S na konferenci Supercomputing 2019 (Zdroj: AnandTech)

Nvidia nesdělila přesné parametry, ale uvádí, že výkon akcelerátoru v jednoduché přesnosti FP32 odpovídá 16,4 TFLOPS, v dvojité přesnosti (FP64) pak dělá 8,2 TFLOPS a výkon tensor jader pro aplikace neuronových sítí je dle Nvidie 130 TFLOPS. Podle toho by měla frekvence GPU být snad někde těsně nad 1600 MHz (VideoCardz tipuje okolo 1601 MHz). To je takt dokonce vyšší, než u SMX2 verze, která doteď byla rychlejší než verze v provedení karty do slotu PCI Express ×16.

Rekordní propustnost pamětí

Karta je osazená 32 GB paměti HBM2, přičemž jejich frekvence je také zvýšená. Standardně karty/moduly Tesla V100 měly paměti HBM2 na taktu 1760 MHz efektivně, což dávalo propustnost 900 GB/s (čip má 4096bitovou sběrnici). Karta V100S má ovšem uvedenou propustnost 1134 GB/s, což by měl být zatím vůbec nejvyšší paměťový výkon, jakého jakékoli GPU dosáhlo. Takt by měl být asi 2214 MHz efektivně. Nvidia možná použila 2,4GHz čipy HBM2 od Samsungu, o něco nižší takty by snad mohly být zvolené kvůli větší rezervě, případně také kvůli limitům paměťového řadiče. Nebo by mohlo jít o energetickou efektivitu, protože karta má vzdor zvýšeným taktům nastavené nezměněné TDP, 250 W.

bitcoin_skoleni

Parametry GPU Nvidia Tesla V100S Parametry GPU Nvidia Tesla V100S

Tato Tesla je určená pro výpočetní servery a tudíž nemá žádné obrazové výstupy, jde skutečně o čistě výpočetní akcelerátor. Provedení je plné délky a výšky, přičemž chladič je dvouslotový a pasivní. Ovšem ne ve stejném smyslu, jako v PC. U serverových šasi se počítá s tím, že skrz celé šasi tlačí vzduch větší množství velmi silných (často mají příkon i desítky wattů) ventilátorů, takže takovýto pasiv ve výsledku chladí stejně jako běžná aktivně chlazená karta s ventilátory, případně i lépe (za cenu vysoké hlučnosti serveru).

Dostupnost ani cenu firma konkrétně nestanovila, takže není jasné, kdy je začnou OEM partneři Nvidie nabízet. Standardní model Tesla V100 zůstává paralelně dál na trhu, takže verze V100S by měla být dražší. Zda bude existovat také SXM2 verze tohoto refreshového modelu, zatím nevíme.

Galerie: Nvidia Tesla V100S