Z Nvidie je výrobce superpočítačů. Její vlastní systém Selene je 7. nejrychlejší na světě

23. 6. 2020

Sdílet

 Autor: Nvidia
Nvidia se překvapivě stala provozovatelem 7. nejvýkonnějšího superpočítače na světě a se servery DGX zároveň jejich výrobcem. Paradoxně jde i o zatím nejrychlejší superpočítač s procesory AMD.

Dnes už jsme psali o tom, že byla vydána nová verze žebříčku nejvýkonnějších superpočítačů TOP500, kde je teď na čelní pozici mašina Fugaku v japonském výpočetním centru RIKEN. Ta je založená na zajímavých ARM procesorech Fujitsu a v kontrastu s dnešním mainstreamem nepoužívající GPU akcelerátory.

Ovšem v novém TOP500 je toho zajímavého víc. Docela hvězdně v něm totiž přistál privátně vlastněný a provozovaný superpočítač patřící Nvidii. Stroj nazvaný Selene využívá nové generace akcelerátorů Nvidia A100 a měl by to být skoro* nejvýkonnější takovýto „domácí“ superpočítač patřící nějaké firmě. Svým výkonem se totiž dostal na sedmé(!) místo žebříčku TOP500, tedy mezi úplně elitní, byť teď už o generaci starší zařízení velmocí (2. až 5. pozice jsou obří superpočítače USA a Číny).

7. nejvýkonnější superpočítač narychlo za 4 týdny

Stroj Selene obsahuje 2240 akcelerátorů (GPU) Nvidia A100 v celkem 280 „Superpod“ serverech Nvidia DGX A100. Je to vlastně dost málo, tento systém se dostal na vysokou pozici díky tomu, že tato nová generace GPU s architekturou Ampere výrazně zvýšila výkon a ostatní konkurenti tato GPU ještě nepoužívají. Klastr Nvidia údajně postavila za pouhé čtyři týdny. Jde tedy vlastně i o marketing ukazující, jak snadno lze ze serverů nabízených Nvidií podobné instalace stavět.

GPU jsou v DGX A100 osazena v počtu osmi kusů na jeden server, což tvoří jednu instanci. Takový 8×GPU server pak spravuje dvojice 64jádrových procesorů AMD Epyc 7742 se společnou 1TB pamětí RAM. Vedle zářezu pro Nvidii je Selene ironicky také nyní nejvýše postavený superpočítač s procesory AMD (nicméně v budoucnu by měly Epycy být vyzbrojené i špičkové Exascale systémy FrontierEl Capitan).

Galerie: GPU Nvidia A100, architektura Ampere a servery DGX A100

Nvidia je teď vlastně výrobce superpočítačů

Komunikaci obstarávají adaptéry InfiniBand od Mellanoxu, který je teď také součástí Nvidie, se 494 switchi Mellanox Quantum. Systém má celkem 7 PB úložného prostoru v NVMe SSD a kapacita RAM by měla být v souhrnu 280 TB. Mimochodem, po akvizici Mellanoxu je teď vlastně Nvidia firmou nabízející kompletní HPC systémy podobně jako Cray, Dell, IBM, Bull, Sugon a tak podobně. Jinými slovy výrobce superpočítačů.

Pole žebříčku TOP500 má Selene výkon 27,58 PFLOPS, což by měl být výkon naměřený v Linpacku. Ovšem ve výpočtech umělé inteligence, které běží na speciálních akcelerátorech Tensor Core (které provozují jen maticové operace neuronových sítí se sníženou přesností), má Selene mít výkon vyšší než 1 EFLOPS. Nvidia bude pravděpodobně využívat hlavně tensor jádra a méně FP64, přičemž na totéž asi cílí u zákazníků.

Jeden server Nvidia DGX A100 stojí oficiálně 200 000 $ (a spotřebovává maximálně 6,5 kW). Pořídit jen samotné servery by tedy stálo „jen“ nějakých 56 milionů dolarů, ovšem je třeba ještě přičíst switche, kabely, elektroinstalaci a další příslušenství.

7nm čipy přinesou velkou obměnu superpočítačů

Vysoké umístění Selene asi při poměrně malém množství uzlů/kabinetů nebude trvat tak dlouho. Je asi do značné míry dáno tím, že jde o jeden z prvních strojů se 7nm akcelerátory A100. Až je začnou používat další provozovatelé, kteří pořídí superpočítače složené už z většího klastru stejného hardwaru, budou mít výkony také větší a Selene předstihnou. Nicméně nevýznamný superpočítač Nvidie také nebude a firma pro něj určitě má svoje využití.

Nvidia se při této příležitosti pochlubila, že její GPU jsou ve 20 z 25 nejvýkonnějších superpočítačů. Současně také GPU systémy ovládají žebříček Green 500, v kterém jde o poměr mezi výkonem a spotřebou. Selene sice není úplně první, ale jen druhý systém v pořadí v této kategorii, ale pořád dodává úctyhodný výkon 20,5 GFLOPS na jeden watt spotřeby. Tyto počty ale samozřejmě platí jen tehdy, pokud běžící kód odkáže GPU dobře využít.

Galerie: Šéf Nvidie předvádí v teaseru desku superpočítačového systému DGX A100

I nejrychlejší privátní superpočítač běží na Nvidii

* Úplně nejvýkonnější superpočítač používaný komerční firmou je na šesté pozici. Systém HPC5 má naměřený výkon 35,5 PFLOPS a jde o klastr serverů Dell PowerEdge provozovaný nadnárovní energetickou a ropnou společností Eni S.p.A. v Itálii. Tento stroj je založený na procesorech Intel Xeon Gold a Gpu Nvidia Tesla V100 (tedy ještě GPU Volta). Propojení je také Infinibandem od Mellanoxu.

bitcoin_skoleni

Toto zařízení je jinak i nejvýkonnější superpočítač v Evropě. No, snad se skrze evropský program budování HPC technologií a hardwaru dostaneme výš.

Zdroje: Nvidia, TOP500