Graviton3 přichází: první procesor s architekturou ARM Neoverse V1, 5nm proces a sedm čipletů

6. 6. 2022

Sdílet

 Autor: Next Platform
Graviton3, který nyní Amazon uvedl do své nabídky, je nejrychlejší ARM procesor pro servery. Nástup jader Neoverse V1 znamená mnohem vyšší IPC a výkon, než měla N1 v Gravitonu2, pořád ale běží na celkem nízkých taktech. A také nemá podporu ARMv9/SVE2.

Poněkud to zapadlo během Computexu, kdy se diskutovalo představení nových procesorů s architekturou Zen 4 od AMD, ale do akce teď přichází také velká novinka ve světě procesorů ARM. Amazon totiž ve svých cloudových službách zpřístupnil třetí generaci svých vlastních serverových procesorů – Graviton3. Proti předchozímu Gravitonu2 jde o výrazně ambicióznější procesor, který v některých technologických prvcích předešel AMD i Intel.

Graviton3 je ve více věcech pro serverové procesory ARM průlomový. Doposud se ty úspěšnější (Ampere Altra a Altra Max a zejména Graviton2, který se mohl prosadit díky tomu, že jej tlačí velký cloudový poskytovatel) zakládaly na architektuře Neoverse N1. To jsou poměrně energeticky a co do plochy na čipu efektivní jádra, ale výkon na jedno vlákno mají na dnešní poměry relativně nízký. Graviton3, který Amazon oficiálně oznámil před koncem roku 2021, ale reálné nasazení pro veřejnost nastalo až teď koncem května, je první procesor, který je založený na výkonnější větvi architektury ARM – Neoverse V1.

Neoverse V1: nejvýkonnější serverové jádro ARMu

Jde vlastně o první ARM procesor s touto architekturou, který byl vyroben a v praxi nasazen, ačkoliv je to už nějaká doba od jeho oznámení. ARM jej představil na podzim 2020, architektura pak byla odhalena (v tomto článku jsme popisovali její detaily) loni na jaře.

Neoverse V1 je do značné míry obdoba výkonného jádra Cortex-X1 (zatímco Neoverse N1/N2 jsou založené na slabších Cortexech-A), které již existuje v mobilech, avšak ještě navíc obohacené o serverové funkce a zejména pak o SIMD instrukce ARM SVE. Ty ale počítá na 256bitových jednotkách, zatímco Cortex-X1 má jen slabší SIMD jednotky (podporující jen starší instrukce Neon) se 128bitovou šířkou. Neoverse V1 tedy může teoreticky dosáhnout až dvakrát vyššího výpočetního výkonu v těchto operacích.

Architektura jádra procesorů Graviton3 oznámená Amazonem odpovídá jádru Neoverse V1 ačkoliv to firma přímo nepřiznala Architektura jádra procesorů Graviton3 oznámená Amazonem odpovídá jádru Neoverse V1, ačkoliv to firma přímo nepřiznala (Zdroj: Next Platform)

Nicméně toto jádro má i své nevýhody – v dnešní době, kdy už startuje nová generace instrukční sady ARMv9, je jádro Neoverse V1 ještě architektura, která spadá do generace předchozí (ARMv8.5). Vlastnosti architektury ARMv9 ještě plně nepodporuje a také má jen instrukce SVE, nikoliv rozšíření SVE2. Tudíž novou technologii SIMD instrukcí, která by v budoucnu měla na ARMu převládnout, ještě úplně nepodporuje.

Tip: ARM uvádí novou generaci CPU architektury. ARMv9 má SVE, SVE2 a bezpečnostní novinky

Jader má procesor Graviton3 celkem 64, každé s 1MB L2 cache, navíc pak je v procesoru ještě sdílená L3 cache s kapacitou 64 MB. Amazon tedy nezvýšil počet jader proti Gravitonu2 s 64 jádry Neoverse N1. Celkový výkon by ale měl být výrazně dál díky lepší architektuře s vyšším výkonem na 1 MHz. Mírně stoupla také frekvence, ale jen o 100 MHz (Graviton2 běžel na 2,5 GHz, Graviton3 je na 2,6 GHz), takže ta takové přínosy mít nebude. Celkově by prý výkon na jedno jádro mohl být asi o 25 % vyšší než u Gravitonu2, uvádí Amazon. TDP však tradičně neprozrazuje.

Čipletová konstrukce

Graviton3 je podle Amazonu složený ze zhruba 55 miliard tranzistorů, ale už ne v jednom jediném čipu. Amazon vsadil na poměrně pokročilou čipletovou konstrukci. Procesor je tvořený hlavním kusem křemíku s jádry, který je vyráběný na 5nm procesu TSMC, ale vedle něj jsou osazeny separátní čiplety implementující I/O rozhraní, pro která jsou snáze použitelné starší procesy.

Amazon Graviton3 Amazon Graviton3 (Zdroj: ServeTheHome)

Na fotce je vidět šest dalších čipletů vedle hlavního (menší křemíky po okrajích zajišťují I/O a velký uprostřed obsahuje jádra CPU, kdežto u procesorů AMD je to ironicky naopak). Dva a dva malé čiplety po levé a pravé straně by měly být řadiče pamětí DDR5, poskytující celkem osm kanálů podporujících paměti DDR5-4800 (celková teoretická propustnost 307 GB/s). Dva o něco větší čiplety na spodní straně jsou pak řadiče PCI Express 5.0. Procesor/SoC celkem podporuje 32 linek PCIe 5.0.

Graviton3 je složený ze sedmi čipletů řadiče DDR5 a PCIe 5.0 jsou na samostatných kusech křemíku Graviton3 je složený ze sedmi čipletů, řadiče DDR5 a PCIe 5.0 jsou na samostatných kusech křemíku (Zdroj: ServeTheHome)

Protože tyto procesory vyrábí Amazon jen sám pro sebe, nebudou samostatně na prodej pro externí klienty. Obchodní model zřejmě zůstane takový, že si je budete moci exkluzivně pronajímat v rámci cloudových instancí AWS. Ty jsou již nyní k dispozici, jsou s označením „C7g“. Nabízejí jedno až 64 jader, se dvěma gigabajty paměti na jádro (největší instance c7g.16xlarge má tedy 64 jader Neoverse V1 a 128 GB RAM) a konektivitu 12,5–30 Gb/s.

V serverech Amazonu jsou tyto procesory osazované ve zmenšených deskách, kdy se do jednoho bladeserveru vejdou tři instance, každá s jedním procesorem. Víceprocesorový režim (2S nebo 4S, ani v tomto případě 3S) Graviton3 zřejmě nepodporuje, takže jde toliko o umístění tří jednoprocesorových serverů k sobě. Amazonu pro cloudové služby patrně stačí 1S instance.

Graviton3 použív desky umožňující dostat tři instance do jednoho server Graviton3 používá desky umožňující dostat tři instance do jednoho serveru (Zdroj: ServeTheHome)

Testy už jsou venku

Na webu se již objevily i nezávislé benchmarky Gravitonu3 (které nicméně běží vzdáleně v cloudu Amazonu, takže nejde o úplně standardní test, protože například nelze sledovat spotřebu). Phoronix změřil výkon svou obvyklou sadou linuxových benchmarků a Chips and Cheese podrobně analyzuje výkon a parametry jádra ARM Neoverse V1, přičemž ho srovnává se serverovými architekturami Intelu (Ice Lake-SP) a AMD (Zen 3).

bitcoin_skoleni

Neoverse V1 má, zdá se, podobnou šířku jádra a schopnosti jako tyto architektury, ale dosahuje výrazně nižších taktů. Tudíž jednovláknový výkon asi pořád bude o dost nižší než u špičkových x86 procesorů. Proti nadcházejícímu Golden Cove u Intelu (procesory Xeon generace Sapphire Rapids) bude jádro Neoverse V2 ještě víc pozadu, zejména při běhu jen na 2,5 GHz – byť je pravda, že v zátěži všech vláken se frekvence jader x86 také sníží blíže k této úrovni).

Zdroje: Next Platform (1, 2), Amazon (1, 2), ServeTheHome