Informační únik byl tentokrát přesný – včera 21. 3. vydalo AMD oficiálně první komerčně dostupné procesory s čipletovou 3D V-Cache. Ještě předtím, než se příští měsíc začne prodávat verze pro hráče v podobě Ryzenu 7 5800X3D, jdou na trh serverové procesory Epyc 7003 „Milan-X“, které nesou rovnou osm kousků čipletové cache, která dává procesorům tři čtvrtě gigabajtu L3 cache užitečnou pro aplikace jako inženýrské výpočty a simulace.
Tyto procesory jsou založené na úspěšné koncepci procesorů Epyc 7003 „Milan“ s architekturou Zen 3 pro platformu SP3, které AMD vydalo loni a mají až 64 jader a osmikanálový řadič paměti DDR4-3200. Varianta Milan-X je nadstavba (doslova) na plné nejvýkonnější konfiguraci Epycu 7003, kde má procesor vedle 12nm centrálního IO čipletu osm 7nm CPU čipletů.
Na každém z CPU-čipletů je osazený druhý čiplet s 3D V-Cache. Funguje to tak, že v CPU čipletu se nachází 32 MB, které má architektura Zen 3 vždy připojené ke osmijádrovému bloku CCX. Ale tento čip je proděravěn a v těchto vertikálních kanálech jsou vytvořené tzv. TSV (through silicon via), které jsou vyplněné měděným vodičem a ústí do kontaktů na horní straně křemíku. Zároveň je čiplet obroušen na nižší výšku.
Na toto je pak osazen sekundární čiplet obsahující již onu V-Cache. Jde o čip vyráběný na 7nm procesu TSMC (N7, tedy stejném, jako CPU čiplet) obsahujíc 64MB SRAM (pro cache), který je připojen na kontakty na horní straně CPU čipletu. Nejde o pájení, ale přiletování přímo měděných kontaktů k sobě. Toto zlepšuje kvalitu signálu a dovoluje snížit spotřebu, kterou propojení má. Také umožňuje větší hustotu kontaktů. Čiplet s 3D V-Cache má menší plochu, vedle něj je proto po obou stranách „prázdná“ křemíková vložka. Takto složený celek má pak stejnou výšku jako běžný CPU čiplet, takže se poté procesor vloží do stejného pouzdra a pod stejný kovový rozvaděč tepla.
Více: AMD 3D V-Cache: Procesory s čipletovou 64MB cache navíc osazenou na jádra Zen 3
Přidaná cache je spojená s původní 32 MB cache, takže tyto procesory mají monolitický blok 96MB L3 cache přístupný vždy osmi jádrům v rámci jednoho CCX/CPU čipletu. Design CPU čipletu s tímto předem počítal. Při navýšení kapacity pomocí druhého čipletu se lehce zhoršuje latence, ale nijak výrazně – AMD uvádí, že o čtyři cykly. U Zenu 3 (ale stejně i u Intelu) je latence na počet cyků variabilní podle toho, do které části se přistupuje, což je i zde. Prvních 32 MB L3 cache, která asi odpovídají „lokální části“ přímo CPU čipletu, má latenci zhoršenou o čtyři cykly, přičemž v rozsahu 32 MB – 96MB tvořeném druhým čipletem se latence dál lineárně zpomaluje tím, že jde o bloky navíc. Je to vidět na tomto grafu od Iana Cutresse (dřívější redaktor AnadTechu).
https://twitter.com/IanCutress/status/1505902419804405761
Celá cache má mít 16-cestnou asociativitu. Celková propustnost z ní/do ní se nemění, ale podle AMD i tak údajně jde přes 2 TB/s. Každé z osmi jader v CCX může přímo používat celých 96 MB. Do L3 cache patřící jinému CPU čipletu jádro nemůže přistupovat přímo, ale jen přes sběrnici Infinity Fabric (a tedy s nižším výkonem). Je tedy třeba pamatovat na to, že ač má celkem cache 768 MB, jde ve skutečnosti o 8×96 MB.
Modely
AMD veřejně nabízí čtyři modely těchto procesorů Milan-X, které doplňují běžnou nabídku Epyců 7003 a od včerejška by měly být fyzicky dostupné ke koupi (velcí „hyperscale“ zákazníci je ale už měli nějakou dobu).
Tyto modely s 3D V-Cache se dají poznat podle písmenka X v názvu. Všechny modely obsahují osm CPU čipletů a na nich osm čipletů s cache, jde tedy vždy o plnou konfiguraci, takže L3 cache mají u všech modelů dohromady 768 MB. Ale liší se počet jader, která jsou aktivní. AMD nabízí plně aktivní 64jádro, vedle toho 32jádro, kde je v každém CPU čipletu aktivní jen polovina jader Zen 3. Pak ještě existují dva model jen s 24 a 16 jádry, kdy má každý CPU čiplet jen tři, respektive jen dvě aktivní jádra.
Nejvýkonnější model Epyc 7773X s 64 jádry a 128 vlákny (díky SMT) má při 280W TDP základní frekvenci 2,20 GHz a maximální boost 3,50 GHz. Stojí oficiálně 8800 $. Takty jsou nižší, než u běžného modelu Epyc 7763 (2,45–3,50 GHz). Model Epyc 7573X s 32 jádry/64 vlákny má takty 2,80–3,60 GHz. Zde už to není o tolik méně než u běžného modelu (Epyc 7543 na 2,8–3,7 GHz).
Modely s 24 a 16 jádry mají o něco nižší TDP, jen 240 W. Epyc 7473X s 24 jádry/48 vlákny má takty 2,80–3,70 GHz, 16jádro/32vlákno Epyc 7373X je na 3,05–3,80 GHz. TDP všech čtyř modelů je nicméně možné nastavovat v rozsahu 225–280 W.
Všechny modely mají plnou konektivitu a všechny funkce – osmikanálové paměti DDR4-3200 s ECC a až 128 linek PCI Express 4.0. Není zde nějaká další segmentace. Kompatibilní jsou se standardními deskami a servery platformy SP3 – Přidání 3D V-Cache je změna, izolovaná uvnitř procesoru, takže nejsou třeba nové chladiče, napájení nebo podobné změny. Deska/server pro instalaci procesoru Milan-X bude jenom potřebovat aktualizaci firmwaru.
Výhodné pro CAD/CAM aplikace a HPC
Tyto procesory nejsou určené pro běžný serverový trh – obecným serverům obvykle budou víc vyhovovat levnější standardní procesory bez 3D V-Cache. Podle AMD Milan-X má ale velké výhody pro speciální aplikace, kde 768MB L3 cache dokáže výrazně pomoci ve výkonu. Jde zejména o technické a vědecké výpočty a simulace jako analýza proudění (Computational Fluid Dynamics).
Jedním z těchto cílových použití jsou nástroje CAD/CAM. Epycy 7003 „Milan-X“ podle AMD mají například v nástrojích Ansys Fluent o 51–78 % vyšší výkon, než běžné Epycy 7003. Velké přínosy má 3D V-Cache mít také pro strukturální analýzu a mimo jiné návrh čipů (při verifikaci RTL návrhu v Synopsys VCS má prý Epyc 7003 s 3D V-Cache až o 66 % lepší výkon). Nějaké benchmarky na platformě Linux už provedl Phoronix.
Obecně mohou tyto procesory pomáhat tam, kde úloha dokáže využít to, že má velké množství dat neustále po ruce cachované přímo v procesoru. Naopak pokud při výpočtech všechna data proudí do procesoru a zase ven přes paměť, nemusí cache pomoci. Klíčové zde je, aby se ona data používala mnohokrát. Mohou se tedy objevit další aplikace, u kterých velká 3D Cache přinese velké nárůsty výkonu.
Jednou z takovýchto aplikací jsou podle AMD počítačové hry, což ale samozřejmě nebude uplatnění pro Epyc, ale pro spotřebitelskou verzi, onen Ryzen 7 5800X3D pro desktopovou platformu AM4. Ten se začne prodávat 20. dubna, takže případně může být použitý jako jakási levná platforma pro testování účinků velké cache na různé softwarové algoritmy.