Procesory Ampere Altra jsou tu: 80jádrový ARM slibuje vyšší výkon než nejrychlejší Epyc

14. 3. 2020

Sdílet

Po pozoruhodném Gravitonu2 je tu 7nm procesor ARM pro servery s 80 jádry Neoverse N1. Altra má špičkovou konektivitu i výkon, Xeon 8280 má předčit 2,23×.

Před nedávnem vzbudil značný ohlas v serverových procesorech příchod 7nm (a na rozdíl od AMD Epyců 7002 monolitického) procesoru Amazon Graviton2 s 64 jádry. U toho ale kazilo radost, že je dostupný jenom jako služba na dálku (nájemná instance) v cloudu. Ale stejná architektura ARM N1 Neoverse bude teď k mání i pro ostatní zájemce – firma Ampere, která dříve vyráběla procesory X-Gene a eMAG, nyní uvádí svůj vlastní procesor na bázi N1 Neoverse. Jmenuje se Ampere Altra, rovněž je 7nm a jader má dokonce 80, přičemž díky vyšším taktům také asi bude výkonnější.

80jádrový seriózní nástup serverových ARMů

Procesor Altra je určen zejména tzv. „hyperscale“ obřím datacentrovým hráčům a poskytovatelům cloudových služeb. Trošku jsme ho tu nakousli už v prosinci, kdy jsme o něm ale psali ještě jako o eMAG 2. Přechod na architekturu Neoverse N1 ale bude v podstatě úplně nový začátek, takže dává na místě dát čipu i nové jméno.

Altra obsahuje 80 jader ARM Neoverse N1, přičemž tato jádra nepoužívají SMT, takže CPU poskytuje pouze 80 vláken. Ve slajdech se to podává jako výhoda, kdy výkon je předvídatelnější, protože vlákno nemůže být negativně ovlivněno zátěží druhého SMT vlákna; současně také odpadají některé bezpečnostní opatření. Nicméně ve skutečnosti je to samozřejmě tak, že jádro prostě SMT neumí a hledání výhod je tu až sekundární reakce na tuto skutečnost. Je celkem pravděpodobné, že jednou ARM u architektur Neoverse SMT také přidá a lze pochybovat, že ho pak Ampere plošne deaktivuje.

Prezentace ARM procesoru pro servery Ampere Altra 10

Jádra jsou typu out of order se čtyřmi dekodéry a třemi ALU a poměrně krátkou 11stupňovou pipeline. L1 cache má 64+64 KB (data/instrukce), k tomu má každé jádro 1MB L2 cache a konečně má celý procesor společnou 32MB L3 cache. Instrukční sada je ARMv8.2, ale obsahuje již některé součásti ARMv8.3 a v8.5. Více detailů jako třeba přehled pipeline můžete vidět v galerii slajdů ARMu k architektuře N1.

Procesor poběží zprvu na frekvenci 3,0 GHz (respektive nejvýkonnější verze bude, vedle toho asi firma bude prodávat i osekané levnější modely), i když výhledově by snad mohla být až 3,3 GHz verze. Ampere 3,0 GHz uvádí jako „turbo“ ale podle zastoupení firmy údajně ve skutečnosti procesor je schopný držet tuto frekvenci permanentně při všech jádrech zatížených (včetně SIMD zátěžě), takže označení turbo se úplně nehodí. Výkonu bude pomáhat, že jádro má velmi krátkou pipeline (a tím nízké postihy za neodhadnuté větvení) a také další rysy, které asi snižují dosažitelné frekvence, ale zvyšují IPC. Například L2 cache má latenci jenom 9-11 cyklů (pro srovnání – Zen/Zen 2 nebo Skylake mají latenci L2 12 cyklů, Intel Ice Lake 13 cyklů).

Top konektivita a paměti

Procesor má osmikanálový řadič pamětí DDR4-3200 podporující ECC (ochranu ECC a RAS funkce mají i všechny cache), jeden procesor podporuje až 4 TB RAM, přičemž procesory mohou být v sestavě dva (2S systém), každý s 4 TB RAM, čili celkem až 8 TB.

Prezentace ARM procesoru pro servery Ampere Altra 11 Schopnosti řadiče pamětí

Procesor má řadič poskytující 128 linek PCI Express 4.0, čímž se vyrovná AMD Epycu 7002. U 2S systému se 32 linek vyhradí pro komunikaci s druhým CPU (v takovém případě na nich ale běží koherentní protokol ARM CCIX s celkovou propustností mezi oběma CPU 50 GB/s). 2S systém má tak pro volné použití 192 linek PCIe 4.0 – více než 2S Epyc, jenž používá více linek k projení (je možné mít konfiguraci používající 48 linek k propojení a 160 pro periférie, výchozí režim je 64 linek pro propojení a 128 linek pro periférie, i když konfigurace jako u Altra by podle webu ServeTheHome volitelně v případě zájmu byla možná také).

Prezentace ARM procesoru pro servery Ampere Altra 12 I/O konektivita

Tato konektivita bude součástí všech různých modelů procesorů Altra, které Ampere bude nabízet. Podobně jako u AMD se budou jednotlivé verze lišit jen spotřebou, počtem jader a frekvencemi (a pak cenou). Konfigurace bohužel nemáme, ale málojádrové verze mají začínat na 45W TDP a nejvýkonnější 3,0GHz 80jádro má TDP až 210 W. Vše pravděpodobně ale bude vyráběno ze stejného výchozího křemíku, který by asi mohl být dost veliký, i když číslo nemáme. Výroba na 7 nm probíhá u TSMC. Procesor se jinak vyrábí v provedení pro socket (LGA). Není pájený na desku, takže bude upgradovatelný.

ARM procesor Ampere Altra ServeTheHome ARM procesor Ampere Altra. Pouzdro LGA je hodně velké (Zdroj: ServeTheHome)

Podpora v Linuxu by měla být out of the box

Po stránce softwaru podporuje procesor standard ARM SBSA Level 4, což by mělo znamenat, že Linuxovbé OS na něm poběží bez problémů a modifikací, jako jsme na to zvyklí na platformě x86. Čip má zabudovanou řídící jednotku, která se stará o management (včetně možno vzdálené správy), řízení spotřeby a také třeba Secure Boot, jde tedy o obdobu PSP v procesorech AMD.

Prezentace ARM procesoru pro servery Ampere Altra 14 Designy serverů s procesory Altra. 1S servery chystá například Gigabyte

Výkon vyšší než Epyc 7742

Ampere slibuje výkon vyšší, než co podává nejrychlejší 7nm Epyc od AMD (64jádro Epyc 7742 – neporovnává se se speciálním HPC Epycem 7H12 s 280W TDP, což je asi ale fér). V benchmarku Specrate2017_int_base je top Altra údajně 1,04× rychlejší. Proti nejrychlejšímu 14nm Intel Xeonu Platinum 8280 (dvojčipové až 400W Xeony 9200 jsou pominuty) má být Altra až 2,23× výkonnější. Čísla pro FPU variantu testu Ampere neuvádí a asi budou horší (jádro má jen dvě 128bitové jednotky SIMD Neon), ale podle výrobce není procesor zaměřený na cloudové použití na tyto úlohy určen.

Je ale ještě třeba říct, že toto srovnání má dva háčky. Za prvé jsou penalizovány x86 procesory. Aby bylo zohledněno, že ARM verze benchmarku SPEC byla přeložena pomocí GCC, které má nižší výkon, zatímco binárky pro AMD a Intel vyplivly optimalizované kompilátory AOCC a ICC, byla reálná skóre Epycu a Xeonu před výše uvedeným srovnáním snížena o 16,5 % a 24 %. Toto není úplně neobvyklá věc (dělalo to myslím i AMD) a je to jasně přiznáno. Čistější by možná bylo přeměřit tyto procesory s GCC, ale co se dá dělat. Druhá výhrada až zrada je v tom, že číslo Ampere není pro 3,0 GHz, ale pro 3,3 GHz. Ampere údajně později uvede verzi procesoru, která bude mít až takovýto takt, ale zatím byl ohlášen jenom 3,0 GHz model 80jádra, takže toto trošku zavání snahou mít v grafu prvenství, i když k tomu podmínky ještě úplně nejsou.

Prezentace ARM procesoru pro servery Ampere Altra 06 Porovnání výkonu Altra na 3,3 GHz s Epycem 7742 (64 jader) a Xeonem Platinum 8280 (28 jader) dle Ampere

Další generace na cestě

I beztak vypadá Ampere Altra jako velmi výkonné a pozoruhodné serverové CPU, které by mělo v řadě úloh být dobře uplatnitelné, byť samozřejmě neznáme ceny, takže není jasné, jak atraktivní bude ekonomicky. Spolu s Gravitonem2 by měla tato CPU představovat moment, kdy jsou procesory ARM opravdu konkurenceschopné v serverech (i když to se snad dalo říct už i o Cavium ThunderX2, tedy před příchodem současné nové generace post14nm procesorů).

bitcoin_skoleni

Prezentace ARM procesoru pro servery Ampere Altra 15 Roadmapa procesorů Ampere Altra

A agresivně má Ampere konkurovat i v následujících letech. Po nynějším uvedení této generace Ampere Altra má už v roce 2021 přijít následník, jenž má kódové označení Mystique. A má údajně používat stejný socket, takže servery se možná budou dát upgradovat. V roce 2022 bude opět nová generace, s kódovým označením Siryn.

Zdroje: ServeTheHome, AnandTech

Galerie: ARM procesor pro servery Ampere Altra