Zatím nejzajímavější potomek mrtvého GPU
O Xeonu Phi již delší dobu víme
to podstatné: že již nejde o poměrně „hloupý“
akcelerátor do slotu PCI Express, jakým byla první
generace. Intel totiž nahradil primitivní architekturu
jednotlivých jader a zároveň z čipu učinil autonomně
životaschopné CPU, které poběží v procesorových socketech
pro Xeony a nepotřebuje na rozdíl od výpočetních GPU jako
například Tesla
P100 žádné hostitelské CPU (což je z hlediska hustoty,
ceny a spotřeby pro superpočítače výhra).
Intel zveřejnil čtyři modely 14nm
Knights Landingu. Špičkovým typem je Xeon Phi 7290 (dvojka na
druhém místě signalizuje 14nm generaci) se 72 jádry na taktu 1,5
GHz v základu a 1,7 GHz při maximálním turbu. Tento čip
má TDP 245 W a vyjde na mastných 6254 dolarů (s DPH 182
000 Kč). Teoretický výkon v dvojité přesnosti (FP64) je
3,46 TFLOPS, běžná přesnost (FP32) pak je dvojnásobně rychlá.
Jádra jsou sdružena do párů se společnou 1MB L2 cache a jejich
architektura vychází z Atomů Silvermont. Každé má však
navíc dvě jednotky FPU podporující SIMD instrukce až po AVX-512
(respektive jeho subsety
pro HPC) a používá čtyřcestný HT. Tím pádem jeden
tento čip – mimochodem měřící údajně okolo 700 mm² a
obsahující 8 miliard tranzistorů – obsluhuje 288 vláken.
Kromě Xeonu Phi 7290 má Intel
v nabídce ještě tři levnější čipy s TDP 215 W
a 64 či 68 aktivními jádry, u nichž očekává největší
poptávku ze strany výrobců superpočítačů, kteří obvykle
nebudou pořizovat drahý „top“ model. Mimochodem, samotné čipy
mají fyzicky 76 jader, ovšem i v „nej“ modelu čtyři
slouží toliko jako rezerva pro zlepšení výtěžnosti. 76Jádrovýá
verze nebude zřejmě nikdy existovat. Všechny modely vidíte zde
v tabulce:
Modely Xeon Phi Knights Landing, srovnání s 22nm generací Knights Corner
Kromě Xeonu Phi 7210, který podporuje
paměti DDR4 jen na 2133 MHz, umí Knights Landing DDR4 na taktu 2400
MHz, a to v kapacitě až 384 GB celkem v šesti
modulech. Paměťový řadič je šestikanálový, což dodává už
tak slušnou paměťovou propustnost, ovšem tato velká RAM je jen
druhým stupněm hierarchie, dodávajícím hrubou kapacitu.
16 GB 3D paměti v procesoru
Xeony Phi Knights Landing mají totiž
všechny ještě integrovanou velmi rychlou 3D paměť MCDRAM přímo
na pouzdru, a to v kapacitě 16 GB, tvořené osmi čipy. Ta by měla být třídou
propustnosti relativně blízko GPU Fiji nebo GP100 od Nvidie
s HBM/HBM2 – Intel uvádí „přes 400 GB/s“
dosažitelných v testu Streams Triad. Xeony Phi tedy budou mít
podobně výkonné paměti jako nejrychlejší GPU, ale zároveň
budou mít i přístup do velkého paměťového prostoru,
typického pro CPU. Lze tedy říct, že mají to nejlepší z obou
světů.
Xeon Phi Knights Landing v socketu LGA 3647
100Gb/s logika přímo z procesoru
Po architektuře a integrované
paměti má ale Knights Landing ještě jeden velký trumf. Tato CPU
budou volitelně dostupná ve verzi, která má přímo z pouzdra
vyveden konektor pro speciální propojovací logiku Intel Omni-Path
s propustností 100 Gb/s, na níž může běžet komunikace ve
výpočetním klastru. Ta je volitelná, a přidá 278 dolarů
k ceně a 15 W k TDP.
Xeon Phi Knights Landing, verze s propojovací logikou Omni-Path
Procesory s integrovaným
Omni-Pathem mají na substrátu jakousi nožičku vyčnívající
z pouzdra, k níž se připojí kabel. Jak to vypadá, když
jde přímo ze
socketu LGA 3647 šňůra, můžete vidět na fotografiích.
Kromě toho má CPU také konektivitu PCI Express 3.0 (36 linek)
a DMI pro připojení k čipsetu.
Mimochodem, stejný socket pro
šestikanálové paměti a pořádně velké procesory má
příští roky sloužit jako podvozek také pro serverové
Xeony Skylake platformy Purley. Také u nich zřejmě bude
Intel volitelně nabízet logiku Omni-Path. Kromě socketové verze
nicméně Xeony Phi Knights Landing mají existovat také v klasickém
provedení karty PCI Express – díky tomu se jimi budou dát
upgradovat již existující superpočítače či běžné servery.
Tyto modely zatím ale Intel ještě neodhalil. V této podobě
ovšem nepůjde o autonomní CPU, zatímco Xeony Phi v provedení
samostatného procesoru normálně běží s operačním
systémem Linux nebo dokonce Windows Server.
Knights Landingy jsou již v provozu
Intel uvádí, že již před nynějším
oficiálním odhalením prodal více než 100 000 těchto čipů
různým odběratelům. V aktuálním žebříčku TOP500 je
díky tomu již jeden systém, který na Xeonech Phi 14nm generace
běží. Je to počítač
Stampede-KNL, v němž běží 484 Xeonů Phi 7250 (68
jader, i s logikou Omni-Path). Celkem má 32 912 jader
a dosáhl s nimi v Linpacku výkon 0,818 PFLOPS
(z teoretických 1,474 PFLOPS). Těchto 484 procesorů stačí
na umístění na 117. místě žebříčku.
Zdroje: Intel,
The
Register, ComputerBase,
The Next Platform (1,
2),
TOP500, Hermitage
Akihabara