Intel vydává „kovové“ Xeony Skylake-SP. Nesou největší inovaci platformy od roku 2011

12. 7. 2017

Sdílet

 Autor: Intel

Bylo docela dlouhé čekání, protože první zprávy o těchto CPU už jsme měli před dvěma lety, ale Intel včera definitivně uvedl na trh svou novou generaci serverových CPU. A sice Xeony rodiny Skylake-SP, vyznačující se novým systémem značení (jmény Platinum, Gold, Silver, Bronze) a zejména zcela novou platformou LGA 3647. Lze říct, že Skylake-SP je asi největším převratem v serverové rodině Intelu od uvedení generace Sandy Bridge-EP, v jejíchž stopách šly Xeony E5 a E7 až do 14nm čipů odvozených od Broadwellu a uvedených loni.  

Socket LGA 3647

Skylake-SP tak trošku navazuje na uvedení Skylake-X, což jsou highendová CPU pro desktopová PC, založená na stejném serverovém křemíku. Ovšem Xeony Skylake-SP budou mít podstatně vyšší počty jader (nejvyšší verze jich obsahuje dokonce 28), TDP (až 205 W) a zejména odlišný socket LGA 3647. Ten je jednou z hlavních inovací – je převzatý od Xeonů Phi Knights Landing a v prvé řadě dává procesorům šestikanálový řadič DDR4, schopný provozu na frekvenci 2666 MHz. Na každém kanále mohou být dva moduly, takže jedno CPU podporuje maximálně 1,5 TB RAM. To je však se 128GB DIMMy a bohužel jen u části modelů, o tom za chvíli.

Xeon pro socket LGA 3647 s výstupkem pro připojení na logiku Omni-Path Xeon pro socket LGA 3647 s výstupkem pro připojení na logiku Omni-Path

Šestikanálový řadič přináší tu výhodu, že CPU má podstatně vyšší propustnost paměti. Druhým přínosem LGA 3647 je pak možnost vyvádět z procesoru rychlou propojovací logiku Omni-Path. Vybrané procesory podporující tuto funkci budou mít navíc „ocásek“ vyčnívající z pouzdra, ke kterému se toto rozhraní připojí. O něco byla také navýšena konektivita PCI Express, z procesoru je vyvedeno 48 linek PCI Express 3.0.

10, 18, 28 jader

Samotná CPU jsou ve skutečnosti tvořena třemi různými čipy. Pro nejnižší počty jader má Intel křemík s 10 jádry („LCC“)., který měl původně být jediným, který dostane platforma X299. Jak už víte, nakonec se dostane i na druhý, jenž má fyzicky 18 jader („HCC“). Čistě serverová zůstane největší a nejnadupanější varianta XCC, na níž se nachází 28 jader – což je pro Skylake-SP maximum. Všechny tyto čipy jsou vyráběny 14nm procesem Intelu a sdílejí architektonické novinky, které už jsme probírali u Skylake-X. Nejde tedy o stejná jádra, jaká Intel používá v čipech Skylake a Kaby Lake pro socket LGA 1151 a pro notebooky.

Konfigurace čipů Skylake-SP Konfigurace čipů Skylake-SP

Jádro Skylake-SP tak mají 1 MB L2 cache a 1,375 MB L3 cache na každé jádro a zejména komunikují novým způsobem. Intel přešel z prstencových sběrnic, které už u Xeonů s velkým počtem jader (24 u Broadwellu-EP/EX) narážely na své limity, na propojení typu Mesh, tedy síť připomínající matici. Tento systém má horší latence a není optimální při nízkém počtu jader, ale dokáže škálovat mnohem dál, než prstencová sběrnice. Zatímco u desktopových Core i7 a i9 asi nyní pozorujeme spíše nevýhody, u 28jádra patrně už bude škálování lepší než u dřívějších top modelů Broadwellu-EP.

skylakedie_changevsconsumer

Vektory AVX-512

Další velkou (možná by se dalo říci i hlavní) změnou jsou instrukce AVX-512, které do jádra přidávají schopnost počítat SIMD výpočty s 512bitovým vektorem, tedy s dvojnásobným počtem hodnot naráz proti AVX a AVX2. Tyto výpočty mají teoreticky tedy až dvojnásobný výkon při plném využití, nicméně reálný přínos je nižší. Plné saturaci těchto výpočetních jednotek brání obecné problémy škálování, dále paměťová propustnost, která nevzrostla dvojnásobně, a zejména zvýšená spotřeba 512bitových jednotek. Při jejich aktivaci se udržitelná frekvence CPU sníží o stovky MHz, což bohužel část výkonnostního zlepšení vymaže. Dostupné turbo je zdá se až o 500 MHz nižší než s AVX/AVX2 (kde je již podobně sníženo oproti normálnímu kódu). U 28jádrových modelů jsou základní takty při AVX-512 dokonce jen 1,3–1,7 GHz. Podrobné údaje pro frekvence turba při různém počtu aktivních jader pro kód v AVX-512, AVX a bez AVX si můžete prohlédnout v následujících tabulkách:

AVX-512 dovoluje provést dvě 512bitové operace FMA za takt. Jedna je realizována použitím dvou 256bitových pipeline pro AVX/AVX2 na portech 0 a 1, k tomu má ale CPU ještě vyhrazenou novou plně 512bitovou pipeline na portu 5 (což údajně není moc dobře, protože to blokuje důležité shuffle instrukce, která jsou na stejném portu). Bohužel to vypadá, že jako Skylake-X (i7-7800X a i7-7820X) je i zde segmentace a část procesorů má výkon AVX-512 omezený na polovinu. U procesorů Xeon Bronze, Silver a Gold 5100 je totiž ona 512bitová jednotka vypnutá a k dispozici jsou jen ony dvě 256bitové jednotky AVX2/AVX. Tato CPU tedy nemohou dosáhnout na onen dvojnásobný výpočetní potenciál. Plně aktivní je AVX-512 až u čipů Xeon Gold 6100 a Xeon Platinum – viz přehled všech modelů dále.

Platinum, Gold, Silver, Bronze a co kde chybí

Pročež pojďme k jednotlivým procesorům, které budou na výběr. Je jich podstatně víc než pouhých 12 modelů konkurenčních CPU Epyc od AMD. Modelů je skoro šedesát – 16 kusů nejvyšší řady Platinum 81xx, 32 kusů Xeon Gold, která je nejpočetnější a ve skutečnosti se dělí na dvě řady, rozlišené číselným označením 61xx a 51xx, a nakonec 10 nejnižších modelů označených Silver 41xx a Bronze 31xx.

Logo procesorů Intel Xeon Platinum Logo procesorů Intel Xeon Platinum

Řada Platinum má podporu pro všechny funkce – AVX-512 s plnou rychlostí, DDR4 až na 2666 MHz, až 28 jader a 38,5 MB L3 cache. Tato CPU lze také provozovat až v osmisocketové desce. TDP nejvýkonnějšího modelu 8180 ale jde na 205 W a řada procesorů stojí pětimístné dolarové sumy – nejvyšší model má oficiální cenu 13 011 $, Intel tedy poměrně o dost zdražil.

Čeho si ještě všimněte jsou písmenkové sufixy. Ty znamenají některé funkce navíc, jimiž je z výchozího modelu (například 8176) vytvořena nová verze (8176M). Písmenko F značí procesor s konektivitou Omni-Path, za což je příplatek jen asi 155 $. Zrádnější je sufix M – tyto procesory podporují dvojnásobnou kapacitu paměti, tedy 1,5 TB na socket, za což už je brutální příplatek 3000 $. To jinými slovy znamená, že všechna CPU bez písmene M mají podporu paměti osekanou na maximálně 768 GB. Platí to i pro následující nižší řady. Třetím sufixem je „T“, což značí model zvládající vyšší rozsah teplot a delší životnost (údajně až 10 let).

Modely Xeon Platinum 81xx (Zdroj: AnandTech) Modely Xeon Platinum 81xx (Zdroj: AnandTech)

Řada Gold 61xx už je použitelná jen v maximálně čtyřprocesorových serverech a deskách a nejvýše má 22 jader a TDP 200 W. Měla by také přijít o některé RAS funkce pro lepší spolehlivost, které s řady Platinum dělají ekvivalent dříve vyráběných „mission critical“ Xeonů E7. Tato CPU asi budou představovat mainstream, cenově jsou od 1700 po zhruba 3600 $, tedy až na modely podporující 1,5 TB paměti, což je opět přirážka tří tisíc dolarů navrch. Šest modelů Xeon Gold 51xx s 4–14 jádry je ořezaná ještě o něco více. Přišly o jednu ze tří linek UPI pro propojení víceprocesorových konfigurací a funkci Node Controller, dále mají rychlost pamětí omezenu na 2400 MHz a co je důležité – Intel jim zařízl onu 512bitovou jednotku AVX-512 na portu 5. Tyto instrukce tedy budou mít jen poloviční výkon, neboli stejný jako 256bitové AVX/AVX2. Nižší modely Gold přijdou na 1221–1727 $.

Modely Xeon Gold 61xx a 51xx (Zdroj: AnandTech) Modely Xeon Gold 61xx a 51xx (Zdroj: AnandTech)

Řada Silver má maximálně 12 jader a podporuje už jen dvouprocesorové sestavy. Oproti Gold 51xx má UPI zpomalené z 10,4 GT/s na 9,6 GT/s, paměti jsou také na 2400 MHz a AVX-512 na polovičním výkonu. Intel u této řady uvádí jako výhodu HT a Turbo Boost, což znamená jediné: řada Bronze o tyto funkce přišla. Dále má paměti zpomalené na 2133 MHz, jen šest nebo osm jader a takt pouhých 1,7 GHz. Cena těchto modelů klesá až na 213 – 306 $, modely Silver stojí 417–1112 $.

Modely Xeon Silver 41xx a Bronze 31xx (Zdroj: AnandTech) Modely Xeon Silver 41xx a Bronze 31xx (Zdroj: AnandTech)

Zajímavé novinky v čipsetu

„Kovové“ Xeony se párují s čipsetem pojmenovaným kódově Lewisburg, jinak jako řada C620. Intel od tohoto čipsetu vyprodukoval různými omezeními funkcí rovnou sedm verzí (C621, C622, C624, C625, C626, C627 a C628, vyznat se v tom asi z hlavy nikdo nebude). Tento můstek se připojuje rozhraním DMI3 jako desktopové čipsety, což odpovídá konektivitě PCI Express 3.0 ×4. Z té pak de facto funguje jako PCI Express switch, protože poskytuje vlastních 20 linek PCIe 3.0 a dále také až 14 portů SATA 3.0 pro SSD a HDD. Nově je ale volitelně možné připojit z procesoru dalších 8 nebo 16 linek, aby mělo propojení s můstkem vyšší propustnost. Tento „uplink“ lze dokonce mít i k dalšímu CPU. Na víceprocesorové desce také může být čipsetů pro posílení konektivity více než jeden.

To se hodí zejména pro síťové I/O. Čipset totiž může poskytovat až čtyři 10Gb/s Ethernety, respektive jejich digitální části (stále jsou nutné samostatné PHY čipy venku). Pro tyto síťovky má navíc zabudované akcelerátory QuickAssist pro různé šifrovací algoritmy. Pomocí QuickAssist lze tedy zašifrovat proud dat před odesláním nebo jej rozšifrovat po příjmu, než si jej převezme CPU.

Čipset by dále měl podporovat Intel AMT a vPro a také TPM 2.0. Zajímavou funkcí je tzv. Innovation Engine. Jde o integrované jednoduché procesorové jádro či mikrořadič (architektury Quark s 1,4 MB SRAM), do něhož může výrobce serveru nebo desky nahrát vlastní kód pro správu či jiné unikátní funkce. Jádro je pak zamčené jen pro běh podepsaného kódu tohoto výrobce, takže může sloužit jako jakási alternativa pro Intel Management Engine, kterou si ale lze upravit dle potřeb.

bitcoin školení listopad 24

 

Vyvolení už naostro testují delší dobu

Ačkoliv oficiální vydání je dnes, Intel potvrdil, že na těchto procesorech ve skutečnosti „sedí“ už delší dobu a nabízel je speciálním velkým zákazníkům. Například Google údajně první Skylake-SP měl už v listopadu a Intel přes tyto „podpultovky“ údajně udal už 500 000 kusů. Dalším předběžným uživatelem byl například Amazon. Xeon-SP by měl každopádně nyní po uvedení dříve či později začít být nabízen drtivou většinou výrobců serverů. Vzhledem ke stávající dominanci Intelu v serverové oblasti je asi logické očekávat, že „kovové“ Xeony budou mít podobný úspěch jako předchozí generace značené E5, i když zvýšené ceny a „segmentace“ funkcí asi budou jen nelibě trpěny.