Krátce po sobě vyšly nové generace serverových procesorů. První byl Intel, který už na konci září uvedl na trh Xeony 6900P „Granite Rapids-AP“. Tyto procesory používají jeho vlastní 3nm proces „Intel 3“ a obsahují až 128 velkých jader Redwood Cove – ale s překvapením. Tato novinka smazala náskok procesorů AMD v počtu jader, a dokonce získala přinejmenším v některých testech výkonnostní prvenství – alespoň na nějaký čas.
Nová generace serverových procesorů od Intelu označená Xeon 6 má několik tváří, o kterých jsme psali zde. Intel nyní v serverech používá dva sockety – LGA 4710 s osmikanálovými pamětmi DDR5 a podporou až 136 linek PCIe 5.0 (u 2S desky) a LGA 7592, což je platforma už s 12kanálovými pamětmi DDR5.
Ortogonálně k těmto dvěma platformám ale jde další dělení, tvořící nakonec celkem čtyři rodiny CPU. Intel teď bude mít na obou socketech serverové procesory Xeon založené na efektivních malých jádrech E-Core bez HT a vedle nich separátní verzi s výkonnými jádry P-Core s HT. V červnu Intel vydal první Xeony 6, což byla řada 6700E – až 144jádrové procesory Sierra Forest založené právě na malých jádrech a na platformě LGA 4710.
Xeon 6900P alias Granite Rapids-AP
Teď na konci září Intel vydal další řadu Xeon 6900P s kódovým označením Granite Rapids-AP, která je opakem. Používá onu větší platformu LGA 7592 s dvanáctikanálovými pamětmi DDR5 a běží na jádrech P-Core. Později by měly vyjít ještě levnější procesory Xeon 6700P pro socket LGA 4170 (a také 288jádrová verze s E-Core pro větší platformu, Xeon 6900E).
Tato nyní vydaná verze AP ale obsahuje více CPU čipletů (tři) a díky tomu má v nejvyšších konfiguracích 128 jader – jde tedy o vůbec největší a nejvýkonnější CPU Intelu, které – alespoň dočasně – dorovnalo počet jader, který je dostupný od loňska s procesory Epyc 9704 od AMD.
Platforma AP (se socketem LGA 7592) zároveň také dorovnává AMD v paměťovém subsystému s 12kanálovým řadičem pamětí DDR5. Ten má ovšem dokonce lepší schopnosti. Oficiálně totiž už podporuje DDR5–6400 s vyšší propustností. A navíc přináší podporu tzv. „MRDIMM“, což jsou vícerankové moduly, které ještě více zvyšují využitelnou propustnost. Měly by být dostupné s rychlostí až DDR5–8800.
Procesory Xeon 6 mají obecně podporovat až 8S sestavy, tedy servery s osmi sockety/procesory v jednom systému, mají pro propojení s dalšími sockety až 6 linek UPI 2.0 s rychlostí 24 GT/s. Nicméně zrovna u zatím odhalených Xeonů 6900P je uvedeno, že podporují maximálně 2S sestavy, je tedy možné, že 4S a 8S bude podporováno jen s menšími procesory Granite Rapids, ne s verzí AP.
Xeon 6900P také přináší vylepšenou podporu CXL, nově už je podporováno CXL 2.0 s až 64 linkami na jeden procesor. Jedno CPU poskytuje celkem 96 linek PCIe 5.0.
CPU část procesorů Xeon 6900P se vyrábí 3nm procesem, přičemž na rozdíl od procesorů Arrow Lake a Lunar Lake pro PC zde nejde o 3nm proces TSMC, ale o technologii přímo od Intelu, proces „Intel 3“, který je vylepšenou verzí procesu Intel 4 používaného v procesorech Meteor Lake.
Jádro z Meteor Lake na steroidech
Procesorová jádra v Granite Rapids jsou také zděděná od procesorů Meteor Lake, je v nich použitá architektura Redwood Cove. Vzhledem k nemastným-neslaným výsledkům Meteor Lake se trochu čekalo, že jádro bude trošku slabina Granite Rapids, a nepřijde tak žádný velký pokrok proti Golden Cove v předchozích procesorech Sapphire Rapids a Emerald Rapids. Nicméně jádro Redwood Cove v serverové verzi je podle všeho značně odlišné. Jednak obsahuje podporu instrukcí AVX-512, a to plnohodnotnou, tedy i s plným výkonem 512bitových instrukcí FMA. Dále pak je přítomná i podpora maticových výpočtů AMX (která byla zavedená v generaci Sapphire Rapids). Toto ovšem mělo i předchozí jádro Golden Cove v serverové verzi.
Serverové Redwood Cove ale, zdá se, má netypicky výrazně odlišnou samotnou architekturu od klientské verze jádra v Meteor Lake. Intel prozradil, že proti 6-wide dekódování instrukcí v klientské verzi má serverové jádro 8-wide dekódování – tedy 8 paralelních instrukčních dekodérů. Na druhou stranu je jádro nezměněné ve fázi allocate (propustnost 6 operací za cyklus) a fázi retire (osm instrukcí za cyklus), také ReOrder Buffer jádra má stále stejnou kapacitu 512 operací. A je zachovaná i 2MB L2 cache (instrukční L1 cache má 64 kB, což je něco, co je přítomné už v klientské verzi architektury Redwood Cove i v P-Core procesorů Raptor Lake).
Zdá se, že jádro je v podstatě hybrid původního jádra Redwood Cove a nového velkého jádra Lion Cove, z kterého je převzatých jeho osm instrukčních dekodérů a možná i další části frontendu jádra. Toto znamená, že IPC jádra (výkon na 1 MHz) by mohlo být někde mezi Redwood Cove a Golden Cove v procesorech Meteor a Raptor Lake a novým P-Core z procesorů Lunar Lake a Arrow Lake – byť asi blíže ke staršímu jádru než k novějšímu.
Modely: 500W TDP normou
Xeony 6900P s nejvyšším počtem jader jsou zatím jen nejvyššími modely generace Granite Rapids, takže možná pro Intel netypicky má nyní tato rodina procesorů relativně málo modelů. Intel nabízí základní model se 72 jádry a 432MB L3 cache (Xeon 6960P), dva modely s 96 jádry a 480MB L3 cache (Xeon 6952P a Xeon 6972P) a dva nejvýkonnější modely se 120 jádry (Xeon 6979P) a 128 jádry (Xeon 6980P), ty mají oba 504MB L3 cache.
Základní takty jsou od 2,0 až po 2,7 GHz podle počtu jader, maximální boost mají ale všechny procesory stejný: 3,9 GHz. Liší se ovšem tzv all-core boost, tedy hodnota pro maximální takt, jakého může být dosaženo se všemi jádry aktivními. U 128jádra a 120jádra je 3,2 GHz, u nižších modelů může být až 3,5–3,8 GHz.
TDP (tedy spotřeba) je poměrně vysoké – u většiny modelů je 500W. Jen nižší z 96jádrových modelů (6952P) je výjimkou se 400W TDP. Toto je nicméně trend v celé oblasti serverů, kdy koncentrace spotřeby do méně procesorů o vyšším výkonu i příkonu umožňuje ušetřit cenný prostor v datacentrech. U výpočetních GPU dochází k ještě větší inflaci spotřeb a dosahují už 1000 W.
Podle prvních testů například od webu ServeTheHome a Phoronixu se Intelu podařilo díky 128 jádrům v Xeonech 6900P (pokud se bavíme o top modelech) získat zpět pozici nejvýkonnějšího serverového CPU. Nicméně to asi nemusí být na dlouho. Než jsme přinesli tento článek, stihlo totiž AMD odhalit vlastní novou generaci procesorů Epyc 9005, které možná zase situaci obrátí. Na ty se ale podíváme v dalším článku. Pozice Intelu by se ale i tak měla zlepšit proti tomu, jaké produkty nabízel v serverech předtím – jeho dosavadní procesory používaly 7nm proces a měly maximálně 64 jader, což řada 6900P (Granite Rapids-AP) navyšuje na dvojnásobek, což samozřejmě výkon posouvá úplně jinam.
Zdroje: Intel (1, 2), ServeTheHome