Grace CPU Superchip: 144jádrový ARM procesor Nvidie prý bude nejrychlejší na trhu

23. 3. 2022

Sdílet

 Autor: Nvidia
Nvidia kraluje datacentrovým GPU a akcelerátorům, ale chtěla by vládnout i světu CPU. Jejím prvním útokem na tento trh je 144jádrový procesor Grace CPU Superchip. Ten má prý být rychlejší než dvojice nejrychlejších Epyců od AMD.

Včera na konferenci GTC 2022 představila Nvidia novou architekturu GPU Hopper a na ní založené 4nm akcelerátory H100 pro AI úlohy a servery. Ale nebylo to jediné, co firma prezentovala. Současně oznámila také své první výkonné procesory s kódovým označením Grace, kterým také říká „Grace CPU Superchip“. Má jít o procesor konkurující ve výkonu těm nejrychlejším Xeonům a Epycům, dost se ale také podobá M1 Ultra od Apple.

Grace CPU Superchip

Nvidia již plány na procesor Grace předběžně představila loni, ale tehdy ještě jen s málo detaily. Teď začíná tzv. „superčip“ nabírat konkrétnější obrysy. A jsou to obrysy dvojité. Ne však proto, že by se někde pila zelená – Grace totiž zdá se bude procesor složený ze dvou kusů křemíku. Každý má obsahovat 72 jader ARM, takže celkový procesor bude mít 144 jader a 396 MB cache (patrně je to součet L2 + L3, není jasné, zda třeba nejsou zahrnuté i kapacity L1). Každý z čipů bude mít konektivitu NVLink, která je zároveň použitá k propojení obou čipů k sobě.

Tato koncepce je podobná tomu, jak AMD tvořilo serverové Epycy 7001 nebo Threadrippery 1. generace (a předtím Opterony 6100/6200/6300). Do určité míry se jedná o dvě CPU (2S systém) v jednom. Jeden čip bude schopen fungovat i samostatně coby 72jádro. Zatím nebylo sděleno, jaký výrobní proce Nvidia použije, možná by mohlo jít o stejný 4nm proces TSMC, jako u GPU Hopper.

Nvidia Grace CPU Superchip Nvidia Grace CPU Superchip (Zdroj: Nvidia)

Grace bude používat architekturu jader CPU zřejmě licencovanou od ARMu, mělo by patrně jít o nějaké jádro ARM Neoverse. Možná Neoverse N2, možná nějaké novější nebo výkonnější, například zatím neoznámená Neoverse V2. Každopádně má již mít instrukční sadu ARMv9 (a tím pádem také instrukce SVE/SVE2).

Od ARMu možná také bude licencovaná interní propojovací logika, ovšem pro vnější komunikace bude (super) čip mít konektivitu NVLink od Nvidie. Asi to není třeba připomínat, ale Nvidia se s ARMem plánovala přímo spojit, tato akvizice ale nakonec selhala. Plány Nvidie nejspíš proto počítaly se silným propojením s technologiemi ARMu. Nicméně i bez fúze/akvizice je může snadno používat pod licencí, takže toto by neměl být velký problém.

Dvě poloviny Nvidia Grace CPU Superchip propojené pomocí rozrhaní NVLink Dvě poloviny Nvidia Grace CPU Superchip propojené pomocí rozhraní NVLink (Zdroj: Nvidia)

Grace Hopper Superchip: kombo CPU+GPU v jednom

Kapacita propojení NVLink mezi dvěma čipy ve 144jádrovém „Grace CPU Superchip“ má být 900 GB/s, což odpovídá 18 linkám NVLink 4. Stejný počet poskytuje také nové GPU Nvidia H100 (čip GH100). A firma toto také bude využívat.

Vedle „Grace CPU Superchip“ má existovat také „Grace Hopper Superchip“, kde bude použitý jeden CPU čip Grace se 72 jádry a k němu se přes onu 900GB/s konektivitu NVLink připojí čip GH100 architektury Hopper. Toto bude vyvedené v jednom modulu tvořícím kompletní systém s hostitelským CPU a pamětí a akcelerátorem.

Nvidia Grace Hopper Superchip Nvidia Grace Hopper Superchip (Zdroj: Nvidia)

Superširoké paměti LPDDR5X

Procesorový čip Grace bude mít tu zvláštnost, že nebude používat klasické paměti DDR5 ve slotech. Stejně jako Apple u svých procesorů se Nvidia chce spolehnout na mobilní paměti typu LPDDR, zde by to měla být LPDDR5X. Tyto paměti mají velmi nízkou spotřebu, ale lze jimi vytvořit velkou propustnost, pokud jich osadíte velmi mnoho do značně širokého paměťového řadiče. Apple například má u procesorů M1 Max 512bitový řadič s propustností 400 GB/s a u M1 Ultra 1024bitový s propustností 800 GB/s. Při takovémto použití se z LPDDR5/5X stává levnější a úspornější náhrada pamětí GDDR nebo i typu HBM.

Dvoučipový Grace CPU Superchip má podle Nvidie mít propustnost okolo 1 TB/s, zatímco poloviční jednočipová verze (tedy CPU část v Grace Hopper Superchipu) by tedy asi měla mít propustnost 512 GB/s. Obě poloviny mají totiž pravděpodobně v sobě polovinu z celkového počtu paměťových kanálů. Nvidia tedy asi u jednoho čipu použije dvakrát tak široký paměťový řadič, jako Apple u M1 Max – 1024 bitů. To je ekvivalent šířky 16kanálového paměťového řadiče u DDR4. Dvojčipová verze Grace CPU Superchip je tedy něco jako procesor s 32kanálovými pamětmi.

Nevýhoda LPDDR je ale, že paměť bude muset být osazená napevno. Jeden čip bude mít nejspíš maximální kapacitu paměti 512 GB, protože Nvidia ve svém marketingu naznačila, že Grace Hopper SuperChip bude mít „600 GB“ paměti – což asi znamená, že jednočipové Grace dodá 512GB RAM a GPU H100 pak k tomu 80 GB grafické paměti. Dvojčipová verze Grace CPU Superchip by ale tudíž dohromady mohla mít kapacitu až 1 TB.

Procesor Nvidia Grace umožňuje další pružné konfigurace s více GPU Procesor Nvidia Grace umožňuje další pružné konfigurace s více GPU (Zdroj: Nvidia)

Paměti budou podporovat ECC, ale je možné, že to bude in-band ECC, které potřebuje nějakou část kapacity. Na druhou stranu počet kanálů je tak vysoký, že by Nvidia jednoduše mohla část čipů používat pro redundanci, takže by nakonec šířka řadiče nebyla 1024 bitů, ale fyzicky 1152 (jedna osmina navíc). Na vizualizacích modulu s procesorem Grace je ale vidět osm, nikoliv devět pouzder s pamětí, což by spíše ukazovalo spíš na in-band ECC.

Údajně top výkon, ale vydání až za rok

Podle Nvidie bude Grace CPU Superchip – tedy verze se 144 jádry – po svém vydání nejvýkonnější, nebo přinejmenším jeden z nejvýkonnějších procesorů pro servery. Jeho mnohovláknový výkon ve SPECrate2017_int_base má přesahovat 740 bodů. Podle Nvidie má Grace CPU Superchip mít víc než o 50 % vyšší výkon než dvojice 64bitových Epyců 7742, která má dosahovat 460 bodů (to je ještě generace s architekturou Zen 2, kterou Nvidia používá v serverech DGX A100).

Podle Nvidie bude Grace CPU Superchip „nejvýkonnější procesor na trhu“ v „široké škále aplikací“ jako jsou hyperscale úlohy, analýza dat a vědecké výpočty. To nemusí znamenat, že půjde o celkově nejrychlejší serverový procesor. Může asi podobně jako dnešní implementace serverových procesorů ARM Neoverse (například Ampere Altra Max) mít primát jen v menší části datacentrových úloh.

bitcoin_skoleni

Háček je tu v onom „až přijde na trh“. Nvidia totiž sice oznámila tento procesor teď, ale dostupný má být až v první polovině roku 2023. Tedy až plus minus za rok. V té době už by měla také konkurence mít na trhu výkonnější procesory než dnes – Intel čipletové Sapphire Rapids a AMD už nejen Zen 3 a teď nový Zen 3 s 3D V-Cache, ale asi už také Epyc 7004 Genoa s architekturou Zen 4. Ve srovnání s nimi už nemusí Grace CPU Superchip vypadat tolik super jako teď rok před vydáním, byť pomalý nebo slabý ve své době rozhodně nebude.

Zdroje: Nvidia, ServeTheHome, Tom's Hardware