Dnes už jsme psali o tom, že byla vydána nová verze žebříčku nejvýkonnějších superpočítačů TOP500, kde je teď na čelní pozici mašina Fugaku v japonském výpočetním centru RIKEN. Ta je založená na zajímavých ARM procesorech Fujitsu a v kontrastu s dnešním mainstreamem nepoužívající GPU akcelerátory.
Ovšem v novém TOP500 je toho zajímavého víc. Docela hvězdně v něm totiž přistál privátně vlastněný a provozovaný superpočítač patřící Nvidii. Stroj nazvaný Selene využívá nové generace akcelerátorů Nvidia A100 a měl by to být skoro* nejvýkonnější takovýto „domácí“ superpočítač patřící nějaké firmě. Svým výkonem se totiž dostal na sedmé(!) místo žebříčku TOP500, tedy mezi úplně elitní, byť teď už o generaci starší zařízení velmocí (2. až 5. pozice jsou obří superpočítače USA a Číny).
7. nejvýkonnější superpočítač narychlo za 4 týdny
Stroj Selene obsahuje 2240 akcelerátorů (GPU) Nvidia A100 v celkem 280 „Superpod“ serverech Nvidia DGX A100. Je to vlastně dost málo, tento systém se dostal na vysokou pozici díky tomu, že tato nová generace GPU s architekturou Ampere výrazně zvýšila výkon a ostatní konkurenti tato GPU ještě nepoužívají. Klastr Nvidia údajně postavila za pouhé čtyři týdny. Jde tedy vlastně i o marketing ukazující, jak snadno lze ze serverů nabízených Nvidií podobné instalace stavět.
GPU jsou v DGX A100 osazena v počtu osmi kusů na jeden server, což tvoří jednu instanci. Takový 8×GPU server pak spravuje dvojice 64jádrových procesorů AMD Epyc 7742 se společnou 1TB pamětí RAM. Vedle zářezu pro Nvidii je Selene ironicky také nyní nejvýše postavený superpočítač s procesory AMD (nicméně v budoucnu by měly Epycy být vyzbrojené i špičkové Exascale systémy Frontier a El Capitan).
Galerie: GPU Nvidia A100, architektura Ampere a servery DGX A100
Nvidia je teď vlastně výrobce superpočítačů
Komunikaci obstarávají adaptéry InfiniBand od Mellanoxu, který je teď také součástí Nvidie, se 494 switchi Mellanox Quantum. Systém má celkem 7 PB úložného prostoru v NVMe SSD a kapacita RAM by měla být v souhrnu 280 TB. Mimochodem, po akvizici Mellanoxu je teď vlastně Nvidia firmou nabízející kompletní HPC systémy podobně jako Cray, Dell, IBM, Bull, Sugon a tak podobně. Jinými slovy výrobce superpočítačů.
Pole žebříčku TOP500 má Selene výkon 27,58 PFLOPS, což by měl být výkon naměřený v Linpacku. Ovšem ve výpočtech umělé inteligence, které běží na speciálních akcelerátorech Tensor Core (které provozují jen maticové operace neuronových sítí se sníženou přesností), má Selene mít výkon vyšší než 1 EFLOPS. Nvidia bude pravděpodobně využívat hlavně tensor jádra a méně FP64, přičemž na totéž asi cílí u zákazníků.
Jeden server Nvidia DGX A100 stojí oficiálně 200 000 $ (a spotřebovává maximálně 6,5 kW). Pořídit jen samotné servery by tedy stálo „jen“ nějakých 56 milionů dolarů, ovšem je třeba ještě přičíst switche, kabely, elektroinstalaci a další příslušenství.
7nm čipy přinesou velkou obměnu superpočítačů
Vysoké umístění Selene asi při poměrně malém množství uzlů/kabinetů nebude trvat tak dlouho. Je asi do značné míry dáno tím, že jde o jeden z prvních strojů se 7nm akcelerátory A100. Až je začnou používat další provozovatelé, kteří pořídí superpočítače složené už z většího klastru stejného hardwaru, budou mít výkony také větší a Selene předstihnou. Nicméně nevýznamný superpočítač Nvidie také nebude a firma pro něj určitě má svoje využití.
Nvidia se při této příležitosti pochlubila, že její GPU jsou ve 20 z 25 nejvýkonnějších superpočítačů. Současně také GPU systémy ovládají žebříček Green 500, v kterém jde o poměr mezi výkonem a spotřebou. Selene sice není úplně první, ale jen druhý systém v pořadí v této kategorii, ale pořád dodává úctyhodný výkon 20,5 GFLOPS na jeden watt spotřeby. Tyto počty ale samozřejmě platí jen tehdy, pokud běžící kód odkáže GPU dobře využít.
Galerie: Šéf Nvidie předvádí v teaseru desku superpočítačového systému DGX A100
I nejrychlejší privátní superpočítač běží na Nvidii
* Úplně nejvýkonnější superpočítač používaný komerční firmou je na šesté pozici. Systém HPC5 má naměřený výkon 35,5 PFLOPS a jde o klastr serverů Dell PowerEdge provozovaný nadnárovní energetickou a ropnou společností Eni S.p.A. v Itálii. Tento stroj je založený na procesorech Intel Xeon Gold a Gpu Nvidia Tesla V100 (tedy ještě GPU Volta). Propojení je také Infinibandem od Mellanoxu.
Toto zařízení je jinak i nejvýkonnější superpočítač v Evropě. No, snad se skrze evropský program budování HPC technologií a hardwaru dostaneme výš.