V posledních letech se mnoho firem pokoušelo o ARM procesory pro servery, aby to řada zase vzdala. Vedle specifického případu Amazonu se nakonec stala nejúspěšnější firma Ampere (vzniklá z někdejšího AppliedMicro, takže se dá říct, že má jednu z nejdelších tradic). A tato společnost teď uvádí svůj zbrusu nový procesor s rekordním počtem 192 jader. Tato jádra jsou přitom jeho vlastní architekturou, nikoliv již licenčními jádry ARM Neoverse, takže jde o dost zajímavé CPU.
Jak jsme zmínili, firma Ampere má delší historii. Původně šlo o divizi firmy Applied Micro, která již v roce 2013 oznámila první 64bitový procesor ARM právě pro servery (na trh to ale nakonec jako první zvládl Apple se svým mobilním čipem A6). Její procesory X-Gene měly vlastní architekturu, která se ale nakonec ukázala být slabinou – výkon nebyl příliš dobrý a ani energetická efektivita nezaujala, takže tato CPU nakonec konkurovala jen serverovým Atomům, a ani proti nim nebyla úspěšná.
AppliedMicro se této divize zbavilo a nakonec z ní vznikla samostatná firma Ampere Computing, do níž nastoupila jako CEO bývalá viceprezidentka Intelu. První procesor eMag byl přeznačený X-Gene třetí generace z linie AppliedMicro, ale poté firma přešla na licenční architekturu ARM Neoverse N1, na níž vznikly procesory Altra a Altra Max, které teprve zaznamenaly úspěch, a pokud nyní chcete ARM server, jsou vaší hlavní nebo v praxi i jedinou možností. Nicméně firma oznámila, že se chce k vlastní architektuře CPU vrátit (protože je to jedna z mála možností, jak se odlišit od procesorů na bázi ARM Neoverse, které si může licenčně vyrobit kdekdo). A to se teď vyplnilo.
AmpereOne
Nový procesor Ampere se jmenuje poněkud ztřeštěně „AmpereOne“, ačkoliv jde o ne první, ale třetí až šestou generaci podle toho, co všechno počítáte (tento styl značek je ale evidentně stále v módě). Mělo by jít o design, který byl předtím v roadmapách pod označením „Siryn“. Podobně jako předchozí Ampere Altra a Altra Max je tento procesor zaměřen na vysoký počet jader, která ale sama o sobě nemají úplně špičkový výkon – alespoň ve srovnání s dnešními Xeony a Epycy. Nepoužívají také SMT a ani nemají pokročilé SIMD instrukce typu AVX-512. Floating-point výkon pro potřeby HPC aplikací bude poměrně slabou stránkou. Výměnou za to ale procesor poskytuje až 192 samostatných jader, což se dobře hodí pro hostování cloudových instancí.
Procesory AmpereOne budou prodávány v konfiguracích se 136, 144, 160, 176 a 192 jádry. Jejich TDP má být 200 až 350 W, také tedy možná dojde k určitému navýšení spotřeby proti předchozí generaci. Mělo by jít o kompletní SoC, takže k této spotřebě už není třeba přidat žádný čipset s vlastním TDP. Procesory budou poskytovat 128 linek PCI Express 5.0 a obsahují osmikanálový řadič pamětí DDR5, tedy na úrovni procesorů Intel Xeon „Sapphire Rapids“ (zatímco Epyc 9004 „Genoa“ od AMD už má paměti 12kanálové).
AmpereOne je vyráběný na 5nm procesu TSMC a jeho fyzická implementace bude mít některé inovace. Například umí detekovat poklesy napětí a vyhnout se díky tomu potenciální nestabilitě (toto používá AMD od jádra Excavator z roku 2015). Tato technologie má současně za cíl odhalit případnou degradaci parametrů čipu časem během provozu a opět zabránit nestabilitě procesoru.
Firma současně přešla k čipletové koncepci podobně jako AMD. Procesor AmpereOne by měl být tvořen kombinací CPU čipletu (5nm) a IO čipletů obsahujících řadiče pamětí a PCIe 5.0. Čiplety jsou propojené logikou AMBA CHI, stejně jako u čipletových Gravitonů 3. Na rozdíl od návrhu AMD jsou čiplety, zdá se, posazené jeden vedle druhého, na fotkách ani není patrné, že nejde o monolit. Podle fotek zřejmě procesor nebude mít rozvaděč tepla nebo jiný kovový kryt, místo toho se bude chladit přímo čip (čiplety) podobně jako u GPU. Půjde nicméně o procesor instalovaný do socketu (FCLGA 5964), ne pájený na desku.
https://twitter.com/aschilling/status/1659264352757719045
Malá (prostřední?) úsporná jádra
Samotná architektura jádra, která má být nyní vlastní, je podle firmy navržená tak, aby měla vyvážený poměr výkonu ke spotřebě a také k velikosti jádra na čipu, což jsou cíle deklarované i pro předchozí licenční jádro ARM Neoverse N1. Proti tomu by prý jádro od Ampere mělo dosahovat vyššího IPC. Například má být lepší výkon při zotavení z nesprávně odhadnutého větvení. Také optimalizace práce s pamětí (memory disambiguation) má být lepší a Ampere také uvádí zlepšení prefetchingu dat do L1 cache.
Procesory budou mít odlišnou cache (64kB L1 pro data s čtyřcestnou asociativitou a 16kB L1 pro instrukce s čtyřcestnou asociativitou). Také L2 cache byla změněná, místo 1MB jádra Neoverse N1 bude použitá 2MB L2 cache (osmicestná asociativita). Tato L2 cache je stále privátní pro každé ze 192 jader, což cílí na ono cloudové použití, kdy jedno jádro často bude provozováno v samostatné instanci. Kromě toho procesory budou mít také L3 cache, která má být dvakrát větší než v předchozí generaci, s kapacitou až 64 MB.
Firma zatím příliš dalších podrobností o architektuře jader neuvádí, měla by ale mít instrukční sadu Armv8.6+ (ještě tedy ne ARMv9) a podporovat datový typ BFloat16 užitečný pro trénování umělé inteligence (SIMD jednotky pro tyto operace jsou dvě s šířkou 128 bitů). Frekvence by prý měly být někde okolo 2,8–3,0 GHz a procesory zřejmě nebudou mít nějaké výrazné boostování dynamicky měnící frekvenci, které je normou u x86 CPU. Firma to uvádí jako výhodu, protože je výkon jádra víceméně konstantní (ale nevysoký).
Servery s procesory AmpereOne by měly být dostupné od Gigabyte, respektive jeho serverové odnože Giga Computing, SuperMicro, HP a dalších. Také by tyto procesory zřejmě měly být nabízené v cloudech velkých společností, zmíněné jsou Microsoft, Google, Alibaba, Oracle, Tencent.
Tyto procesory budou, jak už bylo zmíněno, zaměřené na cloudové uživatele a služby, s čímž výrobci serverových CPU spojují koncepci procesoru s vysokým počtem jader, která ale mají nižší jednotlivý výkon. Také Intel a AMD chystají takové „cloud native“ procesory. U Intelu to budou Xeony Sierra Forest založené na architektuře E-Core (tedy menších efektivních jader z big.LITTLE procesorů), zatímco AMD chystá Epyc „Bergamo“, který používá výkonná jádra Zen 4 i s podporou HT a AVX-512, ale optimalizovaná na větší hustotu a efektivitu výměnou za nižší frekvence (tzv. Zen4c). Zatím teprve uvidíme, jak si AmpereOne proti této konkurenci povede. Úplně slibné není, že v prezentaci firma Ampere uvádí výkonnostní srovnání se systémem na bázi Epycu 9004, jenž měl dle dokumentace značně suboptimální nastavení a zřejmě neukázal skutečný potenciál.
Podle výrobce začíná nyní sériová výroba těchto procesorů, takže by se měly dostat do prodeje a serverů během několika měsíců. Ceny zatím řečeny nebyly.
Zdroje: Ampere Computing, ServeTheHome