Intel přináší 14 nm do serverů. Xeony E5-2600 v4 mají 22 jader a dvě v rezervě

1. 4. 2016

Sdílet

 Autor: Redakce

Datum (1. 4.) je dnes poněkud rozpustilé, ovšem v kontrastu s tím tu máme velice seriózní, ba i vážný počin. Intel totiž včera uvedl Xeony E5-2600 v4, kódově označované Broadwell-EP. Jedná se o vůbec první vysoce výkonné serverové procesory založené na 14nm procesu. Doposud měl totiž Intel kromě základních Xeonů E3 (což je přeznačený desktop) a úsporných SoC Xeon D svou hlavní a nejvýnosnější serverovou řadu Haswell-EP stále na 22nm procesu. Tedy v podstatě technologii procesorů Ivy Bridge z roku 2012. Nový 14nm proces s čipy Broadwell-EP tedy může přinést velké pokroky pro uživatele a samozřejmě i pro Intel.

Prvním a nejhmatatelnějším
přínosem nového výrobního procesu je zvýšení počtu jader.
V nejvyšší konfiguraci jich přibyla třetina, z 18
generace
Haswell-EP vydané v Q3 2014
se Intel s Broadwellem-EP
dostává na 24 jader. Ovšem s tím zádrhelem, že dnes vydané
modely řady Xeon E5-2600 v4 pro dvouprocesorové sestavy plného
počtu nevyžívají. Maximální model končí na 22 jádrech, čímž
se náskok na 22nm generaci zmenšuje na čtyři jádra k dobru.
Model s 24 jádry bude zřejmě dostupný jen v řadě Xeon
E7, založené na stejném křemíku.

Intel uvádí Xeony E5-2600 v4 (Broadwell-EP)

K tomu mají tato CPU v záloze
architektonická
zlepšení jader Broadwell
, jejichž IPC je dle úlohy obvykle až
o 3 % lepší než u Haswellu (Intel uvádí zlepšení
o 5 %, v praxi je ale obvykle procento nižší). Pro
asymetrické šifrování jako RSA má Broadwell přidány instrukce
ADCX a ADOX pro aritmetiku s libovolnou přesností.
Broadwell-EP také má konečně funkční instrukce TSX, které byly
uvedeny u Haswellu, ale poté zablokovány
kvůli chybě v návrhu čipu
. Navíc jen pro Broadwell-EP
byla zvýšen výkon instrukce PCLMULQDQ (násobení bez přenosu),
propustnost této operace vzrostla na dvojnásobek, což urychlí
symetrické šifrování AES údajně o 20–25 % a CRC
až o 90 %.

 

 

Tři verze křemíku

Broadwell-EP se bude vyrábět ve třech
verzích čipu s různou velikostí. Největší s 24 jádry
má mít zhruba 456 mm², 7,2 miliardy tranzistorů a jádra
má uspořádána v dvou prstencových sběrnicích, kde každý
má po dvou šestičlenných sloupcích. L3 cache je po blocích
distribuována u jader a podle toho, jak daleko se data
nacházejí, je latence variabilní.

Schéma 24jádrové verze čipu
Schéma 24jádrové verze čipu

Oba prstence jsou spojeny
přepínači ve dvou místech a napojují se na ně jednak
řadiče PCI Express a QPI a bloky home agent s dvěma
paměťovými řadiči, které dohromady poskytují čtyři kanály
paměti DDR4. Paměť také prošla upgradem, CPU podporují o
stupínek rychlejší takty – 2400 MHz místo 2133, 2133 místo
1866 MHz, a lowend povýšil z 1600 na 1866 MHz.

Druhá varianta má jader fyzicky
patnáct. V tomto případě stojí v pětičlenných
sloupcích a jeden z prstenců je obsazen jen jedním
sloupcem (takže na jednom je 10 jader a na druhém jen pět).
Čip má v této verzi mít výměru 306 mm² a nějakých
4,7 miliardy tranzistorů.

Patnáctijádrový a desetijádrový čip
Patnáctijádrový a desetijádrový čip

Poslední verze, která by se za nějaké
dva měsíce zřejmě měla objevit
i v desktopu
, je desetijádrová a s 3,4
miliardami tranzistorů by měla zabírat 246 mm². Zde vidíte,
jak přínosný 14nm proces je, toto je totiž velikost
28nm APU Carrizo
s čtyřmi jádry, čipsetem a velkým
integrovaným GPU. Použita je již jen jediná prstencová sběrnice,
na níž sedí všech deset jader. Mělo by to znamenat v průměru
lepší latence do L3 cache, na druhou stranu ale tyto čipy můžou
mít zhruba o 5–10 % menší propustnost pamětí,
jelikož home agent a paměťový řadič je již jen jeden,
obsluhující místo dvou všechny čtyři kanály DDR4.

Intel uvádí Xeony E5-2600 v4 (Broadwell-EP)

 

Zlepšováky pro servery

Broadwell-EP má v oblasti cache
jednu novinku: Resource Director Technology (RST) umí nejen
monitorovat, ale také regulovat využití L3 cache. Lze s ní
alokovat místo v L3 zvlášť pro jednotlivé procesy, vlákna,
nebo virtuální stroje. Při virtualizaci či podobném využití
tak lze zamezit tomu, aby jedna úloha vytěžující I/O brzdila
zaplňováním cache ostatní a technologie by měla umožnit
lepší „QoS“ i v dalších nasazeních.

Broadwell-EP má také zredukovány
výkonnostní postihy virtualizace (latence VM exitu) a umí
obsluhovat přerušení přímo uvnitř virtuálního stroje pomocí
přemapovávací tabulky. Tento tzv. „posted interrupt“ by již
měl být podporován v KVM a Xenu.

Intel uvádí Xeony E5-2600 v4 (Broadwell-EP)

Poměrně podstatné by mělo být
zlepšené řízení spotřeby při použití instrukcí AVX. Jejich
256bitové registry a datové cesty poměrně razantně zvyšují
spotřebu CPU (což se projevuje i na desktopu, kde lze jejich
použitím dostat CPU přes TDP, ačkoliv se normálně při zátěži
pohybují značně níž). Na Haswellu-EP aktivita instrukcí AVX
srážela frekvenci všech jader na čipu o zhruba 200–400
MHz, neboť pro AVX mají procesory specifikovány nižší základní
i turbo frekvence. U Broadwellu-EP je toto chování
upraveno: jádra mění takt samostatně, takže ta postižená AVX
kódem spadnou níže, ale ostatní bez SIMD zátěže mohou zároveň
běžet na vyšších taktech. Pokud na serveru pracují různé
úlohy naráz a jen některé používají AVX (či AVX2), měl
by celkový výkon být lepší.

Intel uvádí Xeony E5-2600 v4 (Broadwell-EP)

 

Víc jader, menší takty, někdy víc peněz

A teď již k specifikacím
modelů, které Intel vypouští na trh. Dobrá zpráva je, že jsou
kompatibilní s existujícími základními deskami (někdy i desktopovými platformy X99) a servery,
tedy za podmínky, že pro ně máte/dostanete aktualizaci UEFI.
Modely spolu s cenami shrnu zde do tabulky. V materiálech
od Intelu není bohužel uváděno turbo, to tudíž pochází
údajů
databáze ARK
. Základní takty procesorů se při zvýšení
počtu jader o dvě obvykle snížily o 100–200 MHz,
někde se (obvykle o 100 MHz) snížilo i turbo.

 

 Model  Jádra  Takt CPU Turbo L3 cache DDR4 QPI TDP Cena
Xeon E5-2699 v4 22 2,2 GHz 3,6 GHz 55 MB 2400 9,6 145 W 4115 USD
Xeon E5-2698 v4 20 2,2 GHz 3,6 GHz 50 MB 2400 9,6 135 W 3226 USD
Xeon E5-2697A v4 16 2,6 GHz 3,6 GHz 40 MB 2400 9,6 145 W 2891 USD
Xeon E5-2697 v4 18 2,3 GHz 3,6 GHz 45 MB 2400 9,6 145 W 2702 USD
Xeon E5-2695 v4 18 2,1 GHz 3,3 GHz 45 MB 2400 9,6 120 W 2424 USD
Xeon E5-2690 v4 14 2,6 GHz 3,5 GHz 35 MB 2400 9,6 135 W 2090 USD
Xeon E5-2683 v4 16 2,1 GHz 3,0 GHz 40 MB 2400 9,6 120 W 1846 USD
Xeon E5-2680 v4 14 2,4 GHz 3,3 GHz 35 MB 2400 9,6 120 W 1745 USD
Xeon E5-2667 v4 8 3,2 GHz 3,6 GHz 25 MB 2400 9,6 135 W 2057 USD
Xeon E5-2660 v4 14 2,0 GHz 3,2 GHz 35 MB 2400 9,6 105 W 1445 USD
Xeon E5-2650 v4 12 2,2 GHz 2,9 GHz 30 MB 2400 9,6 105 W 1166 USD
Xeon E5-2650L v4 14 1,7 GHz 2,5 GHz 35 MB 2400 9,6 65 W 1329 USD
Xeon E5-2643 v4 6 3,4 GHz 3,7 GHz 20 MB 2400 9,6 135 W 1552 USD
Xeon E5-2640 v4 10 2,4 GHz 3,4 GHz 25 MB 2133 8,0 90 W 939 USD
Xeon E5-2637 v4 4 3,5 GHz 3,7 GHz 15 MB 2400 9,6 135 W 996 USD
Xeon E5-2630 v4 10 2,2 GHz 3,1 GHz 25 MB 2133 8,0 85 W 667 USD
Xeon E5-2630L v4 8 1,8 GHz 2,9 GHz 25 MB 2133 8,0 55 W 612 USD
Xeon E5-2623 v4 4 2,6 GHz 3,2 GHz 10 MB 2133 8,0 85 W 444 USD
Xeon E5-2620 v4 8 2,1 GHz 3,0 GHz 20 MB 2133 8,0 85 W 417 USD
Xeon E5-2609 v4 8 1,7 GHz - 20 MB 1866 6,4 85 W 306 USD
Xeon E5-2603 v4 6 1,7 GHz - 15 MB 1866 6,4 85 W 213 USD
Xeon E5-2658 v4 14 2,3 GHz 2,9 GHz 35 MB 2400 9,6 105 W 2040 USD
Xeon E5-2648L v4 14 1,8 GHz 2,5 GHz 35 MB 2400 9,6 75 W 1544 USD
Xeon E5-2628L v4 12 1,9 GHz 2,5 GHz 25 MB 2133 8,0 75 W 1364 USD
Xeon E5-2618L v4 10 2,2 GHz 2,4 GHz 25 MB 2133 8,0 75 W 779 USD
Xeon E5-2608L v4 8 1,6 GHz - 20 MB 1866 6,4 50 W 441 USD
Xeon E5-2687W v4 12 3,0 GHz 3,5 GHz 30 MB 2400 9,6 160 W 2141 USD

 

Jak je zvykem, modely s „L“
v názvu značí úsporné verze, „W“ je model pro pracovní
stanice a čipy se sedmičkou na konci čísla preferují vysoké
takty před počtem jader (u zbytku je to spíš naopak). Čipy
končící na osmičku doporučuje Intel pro úložiště
a síťovou/komunikační infrastrukturu. Ceny se v některých
případech nemění, u některých modelů se ale zvýšení počtu
jader odrazilo ve zdražení (zhruba do 10 %).

bitcoin školení listopad 24

Broadwelly-EP na nerozřezaném waferu
Broadwelly-EP na nerozřezaném waferu (Zdroj: ComputerBase)

Zdroje: ComputerBase,
AnandTech,
Intel