Intel „uvádí“ Max: procesory Sapphire Rapids s HBM2E a Ponte Vecchio proti novým Epycům

16. 11. 2022

Intel zkusil den před odhalením nové generace serverových procesorů AMD strhnout pozornost oznámením nové line produktů Max: Xeonů Sapphire Rapids s 64GB pamětí typu HBM a GPU Ponte Vecchio pro superpočítače. Vyjdou ale až v roce 2023.

Minulý týden přišla významná novinka pro serverový trh: procesory AMD Epyc 9004 založené na 5nm výrobním procesu a architektuře Zen 4, zároveň také s novou platformou podporující paměti DDR5, PCIe Express 5.0 nebo technologii CXL 1.1. Těsně předtím a možná ne náhodou ale ohlásil novinky také Intel. Firma představila novou linii produktů Intel Max, což budou výkonné CPU a GPU pro servery. Ale zatím byly vydané ještě jen papírově.

Odhalení souvisí také s nyní běžící konferencí Supercomputing 22, ale není to poprvé, co Intel odhalil nějaký produkt v poměrně velkém předstihu před jeho reálným vydáním v předvečer chvíle, kdy měla být prezentovaná významná novinka AMD. V roce 2019, těsně před vydáním přelomových Epyců 7002 „Rome“, které vynesly AMD vedení v serverových procesorech, Intel udělal představení vlastních Xeonů Cooper Lake. Ty přitom šly na trh až další rok, a ještě navíc jich do té doby byla značná část zrušena – po hříchu zrovna ty dvoučipové až 56jádrové modely, jejichž časným ohlášením chtěl Intel asi „řešit“ tlak 64jádrových Epyců 7002.

Je možné, že odhalení Intel Max den před příchodem Epycu 9004 mělo aspoň zčásti podobný smysl, tedy nějak vylepšit atmosféru, v níž má konkurence navrch. Ovšem nehledě na toto produkty Max jsou (nebo budou) zajímavé i samy o sobě.

Xeon Max: velká a rychlá paměť HBM2E v procesorech

Procesory Xeon Max jsou něco, o čem už dlouho přicházely úniky a Intel to nijak netajil: půjde o verzi nadcházejících serverových procesorů Xeon generace Sapphire Rapids, která bude sdílet základní společné vlastnosti, tedy osmikanálový řadič pamětí DDR5-4800, podporu PCI Expressu 5.0 a CXL 1.1. Procesory jsou složené ze čtyř 7nm dlaždic (čipletů), propojených technologií EMIB.

Můstky EMIB přímo přemosťují dlaždice na úrovni vnitřního mesh propojení, takže pro software procesor vypadá jako jediné monolitické CPU a jediný NUMA uzel. Nicméně volitelně bude možné procesor rozdělit do čtyř sub-NUMA domén po hranicích čtyř dlaždic, pak běžící procesy budou izolované do lokální paměti připojené na dva řadiče DDR5, které jsou fyzicky na stejném čipu, a je k nim tedy asi o něco rychlejší přístup (rozdíly v latenci ale nemusí být velké).

Prezentace procesorů Intel Xeon Max. Procesor na obrázku je bez kovového rozvaděče tepla, který by ho normálně zakrýval (zdroj: Intel, via: Tom's Hardware)

Sapphire Rapids také přinese novou architekturu jádra s vysokým IPC – Golden Cove z procesorů Alder Lake, ale s 2MB L2 cache a obohacenou o plnou podporu AVX-512 a maticové instrukce AMX. Ve verzi Xeon Max budou tyto procesory mít až 56 jader a 112 vláken. Jádra sdílí L3 cache s kapacitou až 112,5 MB a procesory budou mít TDP do 350 W, tedy prakticky stejné jako nyní vydané Epycy 9004.

Hlavní hvězdou procesorů Xeon Max ale bude velkokapacitní paměť zároveň s vysokou propustností, která je integrovaná velmi blízko jádrům – hned vedle křemíku procesoru. Jde o paměť HBM2E, která se používá u highendových výpočetních GPU, ale zde nebude jedinou pamětí, ale doplňkem k hlavní RAM typu DDR5. Její kapacita je 64 GB, neboli jak Intel uvádí, víc jak 1 GB na jedno jádro CPU. Její propustnost bude až 1 TB/s (pro srovnání – teoretická propustnost operační paměti DDR5 bude 307 GB/s).

Prezentace procesorů Intel Xeon Max (zdroj: Intel, via: Tom's Hardware)

HBM2E může být nakonfigurovaná pro různé funkce

Tato paměť může fungovat ve třech různých režimech. Může tvořit obří transparentní „pseudo L4“ cache mezi RAM a procesorem, která bude automaticky zvyšovat výkon aplikací pracujících s pamětí, aniž by o ní musely nějak vědět.

Nebo může HBM2E být adresována spolu s hlavní pamětí DDR5, takže získáte součet jejich kapacit, ale s tím, že část tvořená pamětí HBM2E je mnohem rychlejší. Toto bude výhodné nastavení pro aplikace, které budou speciálně optimalizované. Software a OS budou mít možnost zjistit, které části paměti jsou rychlejší a které pomalejší, a podle toho do nich rozdělí svoje data.

Prezentace procesorů Intel Xeon Max (zdroj: Intel, via: Tom's Hardware)

Třetí režim je takový, že procesor pracuje jen se svou integrovanou pamětí HBM2E jako hlavní RAM a nemá instalovanou žádnou DDR5. Toto bude asi nejvýkonnější možnost pro aplikace, které nepotřebují tolik paměti a vejdou se do 64 GB. Zde nebude třeba nijak upravovat software.

Xeon Max je produkt zaměřený zejména na sektor HPC (superpočítače), technické a vědecké simulace a podobné výpočty. Jde tedy o procesor, který má stejné zaměření jako Epycy „X“ opatřené 3D V-Cache od AMD. Obě firmy ale řeší problém jinou cestou. AMD zvětšilo L3 cache procesoru, která má ale pořád o dva řády menší kapacitu (dohromady 768 MB u generace Milan-X, v osmi 96MB blocích), kdežto Xeon Max má 64 GB. Na druhou stranu řešení AMD dodává v rámci kapacity L3 cache výrazně vyšší propustnost než HBM2E u Xeonu Max. Obě tato řešení mohou být lepší než druhé pro určité konkrétní zátěže a aplikace.

Data Center GPU Max: extrémní čipletový akcelerátor

Do řady Max firma Intel zároveň zařadila výpočetní GPU pro superpočítače, které mají poněkud krkolomné jméno Data Center GPU Max (logičtější Xe Max si už totiž Intel vyčerpal a mnohem hezčí „Arc Max“ asi není vhodné, protože Arc jsou herní a spotřebitelská GPU).

Pod tímto jménem se neskrývá nic jiného než výpočetní GPU Ponte Vecchio s architekturou Xe HPC. Jeho hlavní nasazení má být v exascale superpočítači Aurora a bylo prezentováno poprvé již před třemi roky, doznalo ale značného zpoždění (to ostatně také Xeony Max / Sapphire Rapids). Ponte Vecchio neboli Data Center GPU Max ale bude k mání i pro další zákazníky.