Pokud trochu sledujete procesory
architektury Sparc, pak budete vědět, že kromě Sunu a nyní
Oraclu vyrábí tato CPU pro své servery a pro superpočítače
ještě jedna společnost – Fujitsu. Momentálně na Sparcích
od Fujitsu (konkrétně na 88 128 kusech osmijádrového Sparc64
VIIIfx) běží pátý nejvýkonnější superpočítač, japonský
stroj K. Fujitsu ale nyní oznámilo, že do budoucna dá před
tradičním Sparcem přednost 64bitové instrukční sadě ARMv8
a založí na ní následníka tohoto počítače. Tato
architektura má okolo roku 2020 umožnit dosažení výkonnostní
mety 1000 PFLOPS.
Fujitsu přejde ve svých HPC procesorech z archtiektury Sparc na 64bitový ARM
Fujitsu zřejmě v budoucnu hodlá
své HPC procesory zcela převést na architekturu ARMv8 a integrovat
je se stávající propojovací logikou řady Tofu na bázi 6D torusu, na níž běží
současné se Sparcy. Následník počítače K má mít již
její třetí generaci. Fujitsu údajně již má licenci na
instrukční sadu ARM/ARMv8 nějakou dobu a patrně pro ní
navrhne vlastní jádra, vycházející z programu Sparc64 FX.
Ta by se možná posléze mohla objevit nejen v superpočítačích,
ale také v běžných serverech, jelikož architektura ARMv8
bude patrně za pár let mainstreamovější než Sparc a mohla
by tedy firmě přinést větší záběr na trhu.
Fujitsu Sparc64 XIfx na desce pro superpočítač řady PrimeHPC FX100
HPC ARM od Fujitsu bude dle slajdů
k chystanému počítači „post-K“ typu „manycore“, tedy
zřejmě s velkým množstvím jader, srovnatelným s Xeony
Phi a podobnými procesory. Současný 20nm Sparc64 XIfx od
Fujitsu (platforma PrimeHPC FX100) má 32 jader s celkovým
výkonem 1,1 TFLOPs v dvojité přesnosti, takže bychom asi
měli čekat ještě více. Kromě toho bude čip zřejmě
spolupracovat také s vysokorychlostní integrovanou pamětí,
jelikož zmíněný Sparc64 již nyní používá HMC od Micronu.
ARMv8 ukáže „pravou sílu“
Fujitsu zřejmě do jádra přenese své
vektorové jednotky z architektury Sparc. Ty nyní pracují
s 256bitovými vektory a podporují operace FMA, což je
něco, co na rozdíl od architektury x86 dnes na ARMu neexistuje.
V nové generaci založené na ARMv8 by dokonce možná mohly
vektorové operace pracovat se šířkou 512 bitů. Podle firmy nová
instrukční sada „uvolní skutečnou sílu architektury Fujitsu“,
takže se zřejmě čeká, že konverze bude spíše přínosem než
potenciálním problémem. ARMv8 je novou a údajně poměrně
čistě navrženou architekturou, zatímco Sparc již má hodně let,
takže tato slova by mohla být podložená.
Fujitsu také pro architekturu ARMv8
v nových čipech poskytne své překladače kódu z C/C++
a Fortranu, které jsou zaměřené právě na optimalizace pro
HPC, vektorizaci a mnohovláknové procesory. Mělo by jít
o stejné nástroje jako nyní pro Sparcy, ale nově s výstupem
i pro procesory ARM.
Japonská výpočetní instituce RIKEN, pro
kterou Fujitsu nový superpočítač (a předtím K)
vyrobilo, zase svoji softwarovou vrstvu hodlá uvolnit jako open
source, který ale zároveň má být kompatibilní i s platformou
x86 a Xeony/Xeony Phi. Což je možná pojistka pro případ, že
se nástup této novinky od Fujitsu zadrhne, také to ale má umožnit
nasazení tohoto softwaru na jiných japonských ústavech.
ARM v superpočítačích chystá
i Čína
Jak se říká, jedna vlaštovka jaro
nedělá. Ostatně Fujitsu v oblasti HPC funguje léta a jeho
užívání architektury Sparc nevedlo k nějaké široké
obecné revitalizaci této architektury (i když u ARMu by
mělo být snazší dosáhnout takového efektu). Nicméně ARMv8 má
želízek v ohni více. Kromě Japonska by totiž tuto
instrukční sadu měl podpořit i HPC program Číny. Ta
nedávno spustila zatím nejvýkonnější superpočítač Sunway
TaihuLight se speciálními procesory ShenWei SW26010 (jejichž
architektura je nejasná, o ARM ale asi nejde). Ten by však
možná mohl zase předběhnout jiný čínský stroj, dnešní
dvojka Tchie-Che 2.
Ten byl původně založen na kombinaci
Xeon a Xeon Phi, ale nyní prý proběhne posílení počítače
akcelerátory na bázi 64jádrového ARMu Phytium
Mars, který byl představen loni. Firma prý vyvinula
akcelerátory s těmito čipy do slotu PCI Express, kterými má
údajně být Tchie-Che 2 doplněn či upgradován. VR World,
který tuto zprávu přinesl, nicméně hovoří i o použitá
procesorů ShenWei a není úplně jasné, jak reálná tato
informace je, mixování několika architektur by asi nebylo
optimální. Je možné, že vznikne spíše několik zvláštních
klastrů využívaných obvykle odděleně.
64bitový procesor Mars firmy Phytium (slajdy z Hot Chips 27, 2015)
Zdroje: The
Next Platform, Fujitsu,
VR
World