Power9 a GPU Volta pohánějí nový nejrychlejší superpočítač Summit s výkonem 200 PFLOPS

11. 6. 2018

Sdílet

 Autor: Redakce

Už je to překvapivě dlouhá doba, co si Čína drží pozici nejvýkonnějšího superpočítače. Od roku 2016 na ní dlel superpočítač Sunway TaihuLight, už před ním ale měl prvenství stroj Tianhe 2 (českou transkripcí Tchien-che 2), a to od roku 2013. V pátek ale byl oficiálně uveden do provozu americký superpočítač Summit a v příštím vydání žebříčku nejvýkonnějších superpočítačů Top 500 už podle všeho bude pozice jedničky patřit jemu.

Summit vyrobilo IBM a nachází se v Oak Ridge National Laboratory spadající pod Ministerstvo energetiky spojených států amerických a jeho přípravách už se ví delší dobu (poprvé jsme o něm psali už v roce 2014). Jeho výkon má dosahovat 200 PFLOPS (petaFLOPS, tedy 200 000 TFLOPS), zatímco TaihuLight podle žebříčku vládne výkonem 125 PFLOPS. Předchozí nejvýkonnější americký superpočítač Titan z roku 2012 měl výkon 18 PFLOPS v Linpacku. Pro potřeby srovnání se obvykle používá výkon naměřený tímto benchmarkem, jenž je nižší než teoretický. Summit by v něm v praxi měl dle očekávání dosáhnout asi 120 PFLOPS (pro TaihuLight se uvádí výsledek 93 PFLOPS).

Přes 200 000 jader, příkon 13 megawattů

Summit má hybridní architekturu, většinu výpočetního výkonu dodávají GPU. Postaven je na akcelerátorech Nvidia Tesla V100 s čipy GV100 architektury Volta. Ty lze využít jak k tradičním vědeckým výpočtům a fyzikálním simulacím (FP64), tak i pro strojové učení a neuronové sítě (tedy „umělou inteligenci“). Při použití speciálních Tensor Cores pro neuronové sítě je teoretický výkon až 3,2 peta operací za sekundu. Celý klastr je složen z 4608 uzlů, které tvoří server IBM AC922 se šesti Teslami V100 a dvěma procesory IBM Power9 o 22 jádrech. Ke komunikaci je využitá propojovací logika NVLink, kterou podporuje i IBM, a tak mohou GPU a CPU koherentně sdílet paměť. GPU je v systému celkem 27 648, procesory pak pro provoze poskytují víc jak 200 000 jader (navíc mají Power9 SMT se čtyřmi vlákny). Vše je chlazeno vodou. Pro komunikaci mězi jednotlivými uzly se používá EDR InfiniBand od Mellanoxu, propojení na každý ze serverů má propustnost 200 Gb/s. Jako OS je použit Read Hat Enterprise Linux 7.2.

Pohled n desku uzlu ze superpočítače Summit. Použité jsou servery IBM AC922 Pohled n desku uzlu ze superpočítače Summit. Použité jsou servery IBM AC922

Každý uzel má nainstalováno 512 GB RAM, čili 256 GB na jedno CPU (Power9 má osmikanálový řadič DDR4, pokud je tedy použitá scale-out verze procesoru, jakou používají třeba i stanice Talos II a levnější verze Talos II Lite). RAM je celkem před 10 petabajtů (10 000 TB). To by samo při současných cenách přišlo pěkně draho, pokud nebyly kontrakty uzavřeny někdy v lepších časech okolo roku 2016. Náklady na vybudování se odhadují okolo 200 milionů dolarů (přes čtyři miliardy korun). Summit samozřejmě také bude potřebovat velké množství energie, příkon má dosahovat až 13 megawattů.

ICTS24

Takto vypadá GPU GV100 na kartách Tesla V100 (Foto: Golem.de) Takto vypadá GPU GV100 na kartách Tesla V100 (Foto: Golem.de)

Summit by kromě výpočtů pro potřeby energetiky měl sloužit k výzkumu pokročilých materiálů včetně hledání supravodičů, umělé inteligence, astrofyzikálním simulacím, ale také genetickým, biologickým a medicínským výzkumům. Využívat by měl být například pro hledání závislostí mezi různými faktory a nádorovými onemocněními pomocí rozsáhlých analýz dat a algoritmů strojového učení.

Procesor Power9 a server IBM Power System AC922 Procesor Power9 a server IBM Power System AC922

Na stejné architektuře chystá Ministerstvo energetiky ještě druhý počítač, jenž je nazvaný Sierra a měl by být spuštěn také letos. Sierra má výkon „jen“ 125 PFLOPS. Ve skutečnosti ale nebude o moc menší, uzly tohoto klastru totiž místo šesti GPU používají jen čtyři. Rovnováha prostředků tedy bude poněkud méně vychýlená směrem k hrubému výkonu GPU. Sierra se bude nacházet v ústavu Lawrence Livermore National Laboratory.