Krátce po sobě vyšly nové generace serverových procesorů jak od Intelu, tak od AMD. Intel nejprve uvedl na trh 3nm Xeony 6900P „Granite Ridge“ s až 128 velkými jádry Redwood Cove, čímž nakrátko smazal náskok procesorů AMD v počtu jader. Intelu ale vítězství dlouho nevydrželo, protože AMD teď vydalo Epyc 9005 s jádry Zen 5 a zdá se, že tyto procesory přinášejí tak velký výkonnostní posun, že AMD situaci obrátilo a po pár týdnech získalo vedení nazpět.
Turin
Epyc 9005, kódovým jménem Turin, je upgradem již existující platformy se socketem SP5, která byla vytvořena okolo procesorů Epyc 9004 s architekturou Zen 4 a současně okolo zmenšeného kompaktního jádra Zen 4c (na cloud zaměřené procesory Epyc 9704 Bergamo). Tato platforma přinesla 12kanálový řadič paměti DDR5 a je schopná tvořit 1S a 2S sestavy.
Nová generace procesorů toto zachovává, a měla by dokonce stavět na stejném IO čipletu, takže zůstává značná část infrastruktury, zatímco se mění zejména jádra CPU v CPU čipletech. Je to tedy podobný případ jako mezi Epycem 7002 Rome a 7003 Milan (nebo mezi desktopovými procesory Ryzen 7000 a 9000).
Nová generace Epyc 9005 je tedy hlavně o architektuře Zen 5, kterou implementuje v její plnotučné architektuře včetně plnotučné podpory 512bitových SIMD instrukcí AVX-512. Ovšem AMD současně zvýšilo počet CPU čipletů, které mohou v pouzdru procesoru být (zdá se, že IO čiplet měl v tomto jisté rezervy), takže se také zvýšil maximální počet jader. Výkon nových Epyců tak stoupá také díky škálování v počtu jader, vedle přínosů, které přináší samotná architektura Zen 5 (například velkého nárůstu výkonu ve výpočtech s instrukcemi AVX-512).
Firma současně vydává verze procesorů s velkými jádry Zen 5 i s kompaktní verzí Zen 5c a obě varianty jsou začleněné do stejné rodiny procesorů Turin. Podle AMD je to i proto, že mezi Zenem 5 a Zenem 5c v serverech nejsou rozdíly co do výkonu na 1 MHz (tzv. IPC), jen ve frekvencích, není třeba tyto modely nějak oddělovat.
Modely: Zen 5 a Zen 5c pohromadě
Turin používající jádra Zen 5 v klasické („tlusté“) verzi existuje v modelech s 8, 16, 24, 32, 48, 64, 72, 96 a konečně 128 jádry (nejvýkonnější model Epyc 9755). To je novinka. AMD totiž sice asi používá stále CPU čiplety s osmi jádry (snad by to i měly být stejné 4nm čiplety, jaké firma používá v desktopových Ryzenech 9000), ale generace 9005 jich může obsahovat nově 16. To dává dohromady oněch 128 jader, 256 vláken a 512 MB L3 cache.
Modely s jádry Zen 5c pak mají 96, 128, 144, 160 a 192 jader, maximální kapacita L3 cache u 192jádra je 384 MB. AMD tedy kompaktní architekturu používá jen u modelů s vysokým počtem jader, u nižších konfigurací preferuje velká jádra.
Modely s kompaktní verzí jádra Zen 5c používají odlišný CPU čiplet vyráběný na 3nm procesu TSMC, jde o první 3nm produkt AMD. Jeden tento čiplet obsahuje 16 jader místo 8, takže v nejvyšším modelu je těchto čipletů 12. Oproti předchozí generaci Zen 4c je zde významná změna. Zatímco Zen 4c používal stále 8jádrové bloky CCX, které byly na čipletu dva a každý měl svůj 16MB blok L3 cache, u Zenu 5c je čiplet tvořený jediným 16jádrovým blokem CCX, který má unifikovaný blok 32MB L3 cache. Na jedno jádro tak sice stále přísluší jen polovina cache proti plnotučné verzi, ale jádro může použít až 32 MB, místo aby bylo omezené na 16 MB. Toto může být důležité v momentě, kdy jsou data v cache úlohami či procesy na jednotlivých jádrech sdílena. Zen 5c by se tedy měl chovat lépe než Zen 4c.
Modely s klasickou a kompaktní verzí jádra se liší dosaženými frekvencemi. U modelů se Zenem 5c je maximální boost vždy 3,7 GHz, zatímco základní frekvence jsou 2,1–2,4 GHz. Nejvýkonnější model Epyc 9965 má 192 jader se základním taktem 2,25 GHz a maximálním boostem 3,7 GHz.
Modely s klasickou verzí jádra mají maximální boost vyšší. Nejvýkonnější klasický model Epyc 9755 má 128 jader se základním taktem 2,7 GHz a maximálním boostem 4,1 GHz, ale AMD má další modely s maximálním boostem 4,4–4,5 GHz (například i 64jádra Epyc 9555 a 9555P a 96jádra Epyc 9655 a 9655P).
Ovšem u speciálních modelů s označením F, které prioritizují jednovláknový a málovláknový výkon, jsou maximální takty až 4,8 GHz (Epyc 9375F s 32 jádry a 9745F s 48 jádry), nebo dokonce 5,0 GHz (Epyc 9575F s 64 jádry nebo model Epyc 9175F s jen 16 jádry s takty 4,2–5,0 GHz; tento model je tvořený 16 CPU čiplety, a má tak plnou 512MB L3 cache, v každém CPU čipletu je přitom aktivní jen jedno jádro). Tyto modely jsou zamýšlené zejména pro provoz softwaru s velmi drahými „per-core“ licencemi, kde dává smyl pořídit CPU s omezeným počtem jader a maximalizovat jejich výkon a dostupnou cache.
AMD Epyc 9005 Turin (ilustrace). Tento model má 16 CPU čipletů, tedy až 128 klasických jader Zen 5 a 512 MB celkové L3 cache
Stejně jako Intel u procesorů Xeon 6900P ale AMD navýšilo maximální spotřebu serverové platformy proti předchozí generaci. Nižší modely s 8 až 32 jádry mají TDP od 125 po 210 W, většina modelů má TDP 280–400 W. Avšak vlajkové nejvýkonnější modely – tedy Epyc 9965 se 192 jádry Zen 5c a Epyc 9755 se 128 klasickými jádry Zen 5 – mají TDP už 500 W. To umožňuje maximalizovat výkon těchto konfigurací a při počtu jader je asi tato spotřeba pochopitelná, při plné zátěži na jedno jádro bude připadat (když si odmyslíme spotřebu IO čipletu) jen něco málo přes 2–3 W. A je pravda, že AMD má 500W TDP jen u těchto maximálních konfigurací, kdežto Intel používá 500W TDP u všech Xeonů 6900P, už od 72jádrového modelu.
Turin-X zatím není
Co zatím nevyšlo, jsou modely s 3D V-Cache. Podle AMD nejsou procesory se Zenem 5 a V-Cache součástí rodiny Turin (Turin-X tedy nebude), ale mají svou vlastní roadmapu (a asi tedy i odlišné kódové jméno). „X“ modely založené na Zenu 5 určené pro HPC výpočty a další specifické úlohy těžící z 3D V-Cache tak asi budou oznámené později.
CXL 2.0, DDR5–6400
Konektivita Epyců 9005 může nabízet až 160 linek PCI Express 5.0 (a 12 pomocných linek PCIe 3. 0) u 2S sestavy, přičemž Epyc 9005 podporuje nově také CXL 2.0 (čímž se vyrovnává právě vydaným Xeonům 6900P). Sestavy s jen jedním procesorem poskytují 128 linek PCIe 5.0 a osm linek PCIe 3.0.
Ne úplně očekávané je, že AMD u Epycu 9005 také povýšilo podporu pamětí DDR5 na vyšší rychlost, a to až DDR5–6400. Podpora ale není univerzální, AMD uvádí, že platí jen pro část serverů se speciální validací. Univerzálně podporovaná je jen rychlost DDR5–6000, což je ale také pokrok přinášející o 25 % vyšší propustnost proti generaci Epyc 9004 (ta oficiálně umí DDR5–4800).
Turin oficiálně podporuje kapacitu paměti až 6 TB na jeden socket. U pamětí je také podporovaná nová RAS funkce DRAM runtime post-package repair. Nově také Epycy 9005 mají funkci Out of band error management.
Nové Epycy už jsou v prodeji
Epycy 9005 by měly již být oficiálně vypuštěné na trh včetně fyzické dostupnosti pro zákazníky, a to v serverech HPE, Supermicro, Cisco, Dell a Lenovo i dalších. Mimochodem, AMD uvedení poťouchle načasovalo na 10. 10., a vydalo tak tuto novinku ve stejný den, kdy Intel odhaloval své nové desktopové procesory Core Ultra 200S.
Podle prvních testů (ServeTheHome, Phoronix) je Turin více než konkurenceschopný proti Xeonu 6900P a AMD s ním má opět výkonnější řešení, než jsou procesory Intel (pokud si ty nepomůžou použitím instrukcí AMX nebo jiných hardwarových akcelerátorů v nějaké specifické oblasti).
Epyc 9965 se 192 jádry Zen 5c by pak měl být konkurenceschopný v energetické efektivitě i proti ARM procesorům Ampere (včetně 192jádra Ampere One) a zřejmě i proti budoucímu (zatím stále nevydanému) 288jádrovému Xeonu založenému na E-Core od Intelu. Návrat na špičku tedy Intelu nevydržel dlouho ve smyslu prvenství. I když se dá argumentovat, že je nyní k AMD pořád o dost blíže než v předchozích letech.
Bude zajímavé sledovat, zda jen toto přiblížení se bude Intelu stačit k tomu, aby začal zpět získávat ztracený tržní podíl, nebo už se serverový trh natolik emancipoval z dřívější dominance, s níž ho Intel ovládal, a AMD bude po zásluze dál posilovat.
Zdroje: AMD, ServeTheHome