Už unikly detaily next-gen Xeonů Sapphire Rapids: 56 jader, 350 W, 64 GB HBM2e uvnitř

9. 4. 2021

Sdílet

 Autor: Bilibili
Prakticky hned poté, co Intel po třech letech zpoždění dokázal vydat nové 10nm Xeony Ice Lake-SP, unikly informace k příští generaci Sapphire Rapids.

Jako by nestačilo, že tento týden vydané nové serverové procesory Intelu, konečně 10nm Xeony „Ice Lake-SP“ přišly na trh s tříletým zpožděním, visí nad nimi teď ještě strašák toho, že jde o spíš provizorní generaci s krátkou životnosti, protože cca do roka po nich by prý měly vyjít procesory Sapphire Rapids, o hodně lepší. Jako by to někdo chtěl Intelu ještě víc osladit, unikly jen krátce po vydání Ice Lake informace k této příští generaci Xeonů. Ty potvrzují velmi zajímavé parametry, což skutečně trošku zavání Osborneovým efektem.

Slajd k Sapphire Rapids publikoval web VideoCardz a podle vzhledu jde zřejmě o dokument přímo z Intelu, který porovnává nyní nově vydanou platformu Ice Lake-SP s předchozími 14nm generacemi Xeonů, ale už i s nadcházejícími novými Xeony Sapphire Rapids (kódové označení Eagle Stream).

56 jader

Konečně se zdá se dozvídáme počet jader Sapphire Rapids, jenž je podle této tabulky 56, takže CPU bude s HT mít 112 vláken (a moc jsme se tedy v odhadech nestrefili). Počet jader tedy bude o něco menší než u 64jádrových Epyců 7003 od AMD, ale asi v rámci toho, co by se mohlo dát dohnat lepším škálováním a výkonem na jedno jádro. Není řečeno, jakou bude Sapphire Rapids používat architekturu – pokud by to bylo jádro Golden Cove z procesorů Alder Lake, mohlo by to být hodně zajímavé.

Tip: Detaily platformy CPU Intel Alder Lake: PCIe 5.0, DDR5, čipset, konektivita. Výkon až dvojnásobný

Procesory si zachovají osmikanálový řadič pamětí, ale již do bude s DDR5, přičemž oficiálně bude podporovaná rychlost DDR5-4800. To dává teoreticky až o 50 % lepší propustnost než dnešní DDR4-3200. Přesto budou tato CPU mít navíc ještě integrovanou paměť HBM2e v roli rychlé cache – ano, toto se tedy potvrzuje. Tyto paměti by měly sedět v pouzdru pod rozvaděčem tepla a mají podle Intelu kapacitu 64 GB v každém procesoru, s propustností 1 TB/s.

Toto by mohlo procesorům Sapphire Rapids dávat unikátní výkonnostní charakteristiky, i když je pravděpodobné, že jimi nebudou vybavené všechny modely, ale jen ty dražší a HBM2e by mohla být jen za příplatek.

SLajd s parametry procesorů Intel Xeon Sapphire Rapids Zdroj VideoCardz Slajd s parametry procesorů Intel Xeon Sapphire Rapids (Zdroj: VideoCardz)

Až 350W TDP...

Je možné, že tyto paměti jsou zodpovědné za zvýšenou spotřebu. Intel totiž uvádí, že Sapphire Rapids má mít v případě 56jádrového procesoru TDP až 350 W, což by z něj dělalo nejžravější serverové CPU od 14nm dvoučipového excesu Xeon Platinum 9200. Podle informací, které zveřejnil zase leaker Momomo_us, mají 44jádrové vzorky TDP jen 270 W (stejné jako top modely Ice Lake-SP) a 24jádrové pak 225 W. Paměti HBM2e by mohly samy o sobě konzumovat pár desítek wattů, takže je možné, že TDP jsou tak vysoká právě proto, že zahrnují i tyto paměti.

Údajná TDP ES vzorků procesorů Xeon Sapphire Rapids Zdroj Momomo us Údajná TDP ES vzorků procesorů Xeon Sapphire Rapids (Zdroj: Momomo_us)

PCI Express 5.0 a CXL jen krátce po prvních procesorech s PCIe 4.0

Posílená bude masivně také konektivita. Zatímco Ice Lake-SP přineslo PCI Express 4.0 o tři roky pozdě (a skoro dva roky po AMD), Sapphire Rapids bude už o rok později vybavený opět dvakrát rychlejším PCI Expressem 5.0, s nímž by Intel měl naopak vést peloton. Jeden procesor má mít 80 linek PCIe 50./4.0.

Navíc ale bude podporováno i next-gen rozhraní CXL (ve verzi 1.1), které má rychlosti jako PCI Express 5.0, ale je koherentní, tedy dovoluje sdílení paměti mezi procesory a připojenými zařízeními, což by mělo být hodně významné pro FPGA, GPU a další akcelerátory. CXL bude patrně brát z onoho počtu 80 linek PCIe 5.0.

Intel zdá se zapracuje i na konektivitě pro propojení procesorů mezi sebou – z UPI 1.0 bude povýšená na UPI 2.0, která bude výrazně rychlejší s rychlostí 16,0 GT/s místo 11,2 GT/s u Ice Lake-SP a 10,4 GT/s u 14nm Xeonů. Tyto linky budou k dispozici čtyři. Sapphire Rapids bude podporovat 1S, 2S, 4S i 8S servery a desky a také práci s Node Controllery, takže pokryje celé spektrum serverů, zatímco Ice Lake-SP končí dvouprocesorovými servery.

Nové instrukce

Sapphire Rapids bude podporovat nové instrukce, půjde tedy o přepracované jádro (pokud to rovnou nebude derivát onoho Golden Cove). K AVX-512 s rozšířeními jako VNNI a akceleraci SHA se přidá také rozšíření TMUL, podpora výpočtů ve formátu BFLoat16 a také úplně nové instrukce AMX, což by měla být poměrně závažná novinka – jde o specializované instrukce pro maticové operace nad širokými registry, opět tedy funkce zaměřená na operace umělé inteligence.

Vydání za necelý rok?

Podle Intelu půjde Sapphire Rapids do výroby už tento rok, ale před Silvestrem se nejspíše stihnou distribuovat jen vzorky, nájezd masové výroby patrně sklouzne až do nového roku. Kdy přesně budou tedy tyto Xeony formálně uvedené, není jasné, ale je možné, že do roka ode dneška už budou na trhu.

Jejich příchod by mohl ukončit období, kdy Intel výrazně zaostával v serverových procesorech za AMD, ale to samozřejmě bude záviset na tom, jak se povedou. AMD bude snad někdy v druhé polovině roku 2022 kontrovat 96jádrovými 5nm procesory Epyc Genoa s architekturou Zen 4, takže bez boje to pro Intel nebude.

Tip: Velké odhalení plánů Intelu: otevření továren a x86, ale i víc TSMC. budoucí CPU jsou čipletová

bitcoin školení listopad 24

Možná je dobré připomenout, že Sapphire Rapids budou čipletové procesory, nikoliv monolitické. Dokonce jsme již viděli i snímek odhaleného delidovaného CPU, podle kterého by mělo být složeno ze čtyř čtvercových 10nm „tiles“. Ovšem podle Intelu je použitá technologie Foveros, což je pokročilé 3D pouzdření, takže je možné, že pod horními dlaždicemi s CPU jádry bude vespod ještě něco jako IO čiplet/dlaždice. I v tomto tedy bude Sapphire Rapids jeden z technologicky nejzajímavějších počinů Intelu za dlouhou dobu.

Galerie: Vzorek procesoru Intel Xeon Sapphire Rapids s čiplety a FPGA

Zdroje: VideoCardz, Momomo_us