Xeon Phi Knights Landing uveden: 72jádrový Silvermont s AVX-512, 16GB 3D pamětí

22. 6. 2016

Sdílet

 Autor: Redakce

Včera jsme informovali o čerstvém rekordmanovi mezi superpočítači z Číny, založeném na tamním speciálním procesoru ShenWei SW26010. Ten jsme zmínili jako nepřímého konkurenta Xeonů Phi 14nm generace „Knights Landing“ od Intelu. A tyto velmi zajímavé procesory, vývojově pocházející ze zrušeného programu GPU Larrabee, byly shodou okolností vypuštěny na trh prakticky současně a již se také stihly dostat do praxe, i když ne na čelním místě žebříčku TOP500. Jejich dopad na trh ale patrně bude mnohem zásadnější.

 

Zatím nejzajímavější potomek mrtvého GPU

O Xeonu Phi již delší dobu víme
to podstatné: že již nejde o poměrně „hloupý“
akcelerátor do slotu PCI Express, jakým byla první
generace
. Intel totiž nahradil primitivní architekturu
jednotlivých jader a zároveň z čipu učinil autonomně
životaschopné CPU, které poběží v procesorových socketech
pro Xeony a nepotřebuje na rozdíl od výpočetních GPU jako
například Tesla
P100
žádné hostitelské CPU (což je z hlediska hustoty,
ceny a spotřeby pro superpočítače výhra).

Xeon Phi Knights Landing
Xeon Phi Knights Landing

Intel zveřejnil čtyři modely 14nm
Knights Landingu. Špičkovým typem je Xeon Phi 7290 (dvojka na
druhém místě signalizuje 14nm generaci) se 72 jádry na taktu 1,5
GHz v základu a 1,7 GHz při maximálním turbu. Tento čip
má TDP 245 W a vyjde na mastných 6254 dolarů (s DPH 182
000 Kč). Teoretický výkon v dvojité přesnosti (FP64) je
3,46 TFLOPS, běžná přesnost (FP32) pak je dvojnásobně rychlá.

Jádra jsou sdružena do párů se společnou 1MB L2 cache a jejich
architektura vychází z Atomů Silvermont. Každé má však
navíc dvě jednotky FPU podporující SIMD instrukce až po AVX-512
(respektive jeho subsety
pro HPC
) a používá čtyřcestný HT. Tím pádem jeden
tento čip – mimochodem měřící údajně okolo 700 mm² a
obsahující 8 miliard tranzistorů – obsluhuje 288 vláken.

 

Intel Xeon Phi Knights Landing

 

Kromě Xeonu Phi 7290 má Intel
v nabídce ještě tři levnější čipy s TDP 215 W
a 64 či 68 aktivními jádry, u nichž očekává největší
poptávku ze strany výrobců superpočítačů, kteří obvykle
nebudou pořizovat drahý „top“ model. Mimochodem, samotné čipy
mají fyzicky 76 jader, ovšem i v „nej“ modelu čtyři
slouží toliko jako rezerva pro zlepšení výtěžnosti. 76Jádrovýá
verze nebude zřejmě nikdy existovat. Všechny modely vidíte zde
v tabulce:

Modely Xeon Phi Knights Landing, srovnání s 22nm generací Knights Corner
Modely Xeon Phi Knights Landing, srovnání s 22nm generací Knights Corner

Kromě Xeonu Phi 7210, který podporuje
paměti DDR4 jen na 2133 MHz, umí Knights Landing DDR4 na taktu 2400
MHz, a to v kapacitě až 384 GB celkem v šesti
modulech. Paměťový řadič je šestikanálový, což dodává už
tak slušnou paměťovou propustnost, ovšem tato velká RAM je jen
druhým stupněm hierarchie, dodávajícím hrubou kapacitu.

 

16 GB 3D paměti v procesoru

Xeony Phi Knights Landing mají totiž
všechny ještě integrovanou velmi rychlou 3D paměť MCDRAM přímo
na pouzdru, a to v kapacitě 16 GB, tvořené osmi čipy. Ta by měla být třídou
propustnosti relativně blízko GPU Fiji nebo GP100 od Nvidie
s HBM/HBM2 – Intel uvádí „přes 400 GB/s“
dosažitelných v testu Streams Triad. Xeony Phi tedy budou mít
podobně výkonné paměti jako nejrychlejší GPU, ale zároveň
budou mít i přístup do velkého paměťového prostoru,
typického pro CPU. Lze tedy říct, že mají to nejlepší z obou
světů.

Xeon Phi Knights Landing v socketu LGA 3647
Xeon Phi Knights Landing v socketu LGA 3647

 

100Gb/s logika přímo z procesoru

Po architektuře a integrované
paměti má ale Knights Landing ještě jeden velký trumf. Tato CPU
budou volitelně dostupná ve verzi, která má přímo z pouzdra
vyveden konektor pro speciální propojovací logiku Intel Omni-Path
s propustností 100 Gb/s, na níž může běžet komunikace ve
výpočetním klastru. Ta je volitelná, a přidá 278 dolarů
k ceně a 15 W k TDP.

Xeon Phi Knights Landing, verze s propojovací logikou Omni-Path
Xeon Phi Knights Landing, verze s propojovací logikou Omni-Path

Procesory s integrovaným
Omni-Pathem mají na substrátu jakousi nožičku vyčnívající
z pouzdra, k níž se připojí kabel. Jak to vypadá, když
jde přímo ze
socketu LGA 3647
šňůra, můžete vidět na fotografiích.
Kromě toho má CPU také konektivitu PCI Express 3.0 (36 linek)
a DMI pro připojení k čipsetu.

 

Mimochodem, stejný socket pro
šestikanálové paměti a pořádně velké procesory má
příští roky sloužit jako podvozek také pro serverové
Xeony Skylake platformy Purley
. Také u nich zřejmě bude
Intel volitelně nabízet logiku Omni-Path. Kromě socketové verze
nicméně Xeony Phi Knights Landing mají existovat také v klasickém
provedení karty PCI Express – díky tomu se jimi budou dát
upgradovat již existující superpočítače či běžné servery.
Tyto modely zatím ale Intel ještě neodhalil. V této podobě
ovšem nepůjde o autonomní CPU, zatímco Xeony Phi v provedení
samostatného procesoru normálně běží s operačním
systémem Linux nebo dokonce Windows Server.

 

Knights Landingy jsou již v provozu

Intel uvádí, že již před nynějším
oficiálním odhalením prodal více než 100 000 těchto čipů
různým odběratelům. V aktuálním žebříčku TOP500 je
díky tomu již jeden systém, který na Xeonech Phi 14nm generace
běží. Je to počítač
Stampede-KNL
, v němž běží 484 Xeonů Phi 7250 (68
jader, i s logikou Omni-Path). Celkem má 32 912 jader
a dosáhl s nimi v Linpacku výkon 0,818 PFLOPS
(z teoretických 1,474 PFLOPS). Těchto 484 procesorů stačí
na umístění na 117. místě žebříčku.

 

bitcoin_skoleni

Intel Xeon Phi Knights Landing

Zdroje: Intel,
The
Register
, ComputerBase,
The Next Platform (1,
2),
TOP500, Hermitage
Akihabara