Nvidia oznámila vlastní výkonné procesory. ARM čipy Grace mají předefinovat servery

13. 4. 2021

Pokud jste fandové Nvidie a přáli jste si, aby začala vyrábět i procesory a nandala to AMD (a Intelu), tak teď budete mít na co se těšit.

Nvidia včera pořádala svou letošní technologickou konferenci GTC, kvůli pokračující pandemii koronaviru opět virtuálně. CEO firmy Jen-Hsun Huang opět vysílal ze své kuchyně. Loni takto oznámil výpočetní akcelerátor Nvidia A100 (navazující na linii Tesla, ale tuto značku firma přestala používat), první to GPU generace Ampere. Nová generace GPU má asi ještě čas, ale letos místo toho Nvidia oznámila expanzi na nové pole: do procesorů.

Nvidia opět zaútočí na výkonná CPU

Vlastní procesory Nvidia už měla v podobně mobilních čipů Tegra, které ale neprorazily nebo možná je lepší říct neudržely ze začátku získané pozice v tabletech. Už dávno se s nimi Nvidia přeorientovala na automobily a posléze také na herní konzoli Nintendo Switch.

Současně s tím měla dokonce Nvidia i vlastní procesorovou architekturu Project Denver, ale vsadila na zřejmě nevhodnou koncepci technologicky navazující na architekturu Transmeta (což asi bylo proto, že původně asi mělo jít o procesor kompatibilní s x86). Tento dlouho vysoce očekávaný a i dost „hypovaný“ projekt nakonec dost vyšuměl, ani jádro Denver, ani jeho následník Carmel neudělaly díru do světa. A původně avizované nasazení do superpočítačů a serverů nenastalo nikdy.

Když tedy teď Nvidia oznámila vlastní procesory, není to úplně poprvé. Ale tentokrát zřejmě budou podmínky mnohem více nakloněné úspěchu: Nvidia má díky GPU a AI akcelerátorům (nemluvě o penězích) dobrou pozici ve výpočetním a serverovém sektoru a prodává i vlastní servery DGX. Právě pro tuto část trhu budou procesory, které Nvidia chystá: budou to serverová CPU pro výpočetní servery, které Nvidia bude propojovat se svými vlastními GPU.

Nvidia zatím neprozradila, jaké jméno nakonec procesor dostane, jeho kódové označení je ale Grace. Vypadá to, že podle Grace Hopperové, americké počítačové průkopnice. Je zajímavé, že již před časem se objevily informace o tom, že next-gen GPU Nvidie mají zase mít kódové označení Hopper, což by mohlo signalizovat, že tyto dva produkty budou tvořit společnou platformu.

Nvidia Grace

Grace bude procesor s architekturou ARM, což je pro Nvidii logické vzhledem k předchozímu používání, ale také proto, že ARM loni koupila – respektive kupuje, zatím se čeká na to, zda ještě třeba akvizici nebudou blokovat regulační orgány. Grace by tak mohl být výsledek této integrace, ale tyto procesory by asi mohly vzniknout i bez ní s tím, že by si Nvidia potřebné IP licencovala.

Procesor Nvidia Grace na vizualizaci (Zdroj: Nvidia)

Grace bude založený na jádrech ARM Neoverse, nepůjde tedy o nějaká nezávisle vyvinutá jádra jako byl Denver, ale o stejnou technologii, jakou používají třeba Gravitony od Amazonu nebo Altra od Ampere Computing. Nebude to ale současná architektura Neoverse N1, ale nějaká výkonnější budoucí, možná i nějaká teprve následující po již ohlášených Neoverse V1 a N2.

Zatím není jasné, kolikajádrové tyto procesory budou a jaké by třeba bylo jejich TDP. Nvidia se zdá se soustředí hlavně na jejich roli „kočího“ pro přidružená GPU. Vyzdvihuje tak hlavně to, že tyto procesory budou umět koherentní propojení NVLink 4 pro připojení k výpočetním GPU Nvidia s velmi vysokou propustností, která má údajně dosahovat až 900 GB/s, tedy řádově víc než dodává rozhraní PCI Express 4.0 ×16. NVLink 4 má také sloužit ke komunikaci více CPU mezi sebou, zde má paradoxně být rychlost nižší, „jen“ 600 GB/s. Toto asi bude proto, že na komunikaci CPU bude vyhrazeno méně linek. (Poznámka: tyto propustnosti jsou udávané jako součet propustnosti v obou směrech, protože rozhraní je duplexní. Maximum v jednom směru by tedy bylo 450 a 300 GB/s).

Jiná koncepce serveru

Co je hodně pozoruhodné a liší se to od veškeré konkurence, jsou paměti. Nvidia avizuje, že procesor Grace bude vybaven RAM s velmi vysokou propustností. Bude ale typu LPDDR5X (s ECC), tedy mobilního typu. Její propustnost má dosahovat až 500 GB/s, což by při hypotetickém 16kanálovém zapojení (16 × 32 bitů, ekvivalent osmikanálu u běžné paměti DDR4/5) potřebovalo paměti s efektivní rychlostí okolo 8000 MHz. Paměti typu LPDDR nyní mají vyšší efektivní takty než běžného typu DDR, takže Nvidia je možná zvolila i kvůli tomuto (vedle toho také mají nižší spotřebu energie, podle Nvidie až 10×).

Cenou za tyto rychlosti ale je, že paměti musí být osazené nedaleko od procesoru, a to pevně připájené na desce. Tyto paměti nepůjde upgradovat, budou se tedy dodávat napevno s deskou, což bude hodně odlišné od běžné serverové praxe.

Celý „form-factor“ platformy Grace, jak ji Nvidia zamýšlí, by ale zdá se mohl být hodně nezvyklý. Firma prý chce, aby nebyl použitý formát, kdy máte základní deska s procesorem nebo dvěma a k tomu větší množství (4–8) GPU v roli připojených akcelerátorů. Místo toho by prý v systému mohla běžet výkonná GPU tak, že by ke každému bylo přidružené jedno CPU Grace, na vizualizaci to dokonce vypadá tak, že by se akcelerátor mohl dodávat jako jeden kombinovaný modul, tvořený mezaninovou destičkou s procesorem a jeho pamětmi a na ní osazenou druhou deskou s GPU akcelerátorem. A tyto moduly by se pak osazovaly do propojovací desky serveru.

Procesory Grace (a jejich budoucí následníci, protože Nvidia má v roadmapě další pokračovatele, byť ještě nepojmenované) by v pojetí Nvidie asi nebyli ani tak „centrální procesorová jednotka“, jako spíš služebník a zprostředkovatel pro GPU. Obojí by přitom ale zřejmě díky široké komunikační cestě mezi GPU a CPU mělo zároveň spolupracovat. Cílem je údajně, aby výsledné systémy byly až 10× výkonnější, než ty současné.

Příchod v roce 2023

Z uvedeného jste asi pochopili, že zde Nvidia neprezentuje produkt, který by hned nyní šel na trh. Reálné uvedení na trh má u těchto procesorů nastat až v roce 2023, takže zatím ještě jdou dost vzdálené. Tomu odpovídá koncepční novost/jinakost. Teoreticky je asi i možné, že se třeba některé věci trochu změní.

Už jsou ohlášené dva superpočítače

Už teď má nicméně Nvidia pro toto řešení – a tedy svou procesorovou ARM platformu – první zákazníky. S procesory Grace a tím pádem i GPU Nvidia (Hopper?) mají vzniknout dva superpočítače: Swiss National Supercomputing Centre CSCS (Centro Svizzero di Calcolo Scientifico) v Luganu plánuje superpočítač Alps a další chystá Los Alamos National Laboratory v USA. Tyto superpočítače, které oba dodá Cray/HPE, budou vzhledem k využití akcelerátorů Nvidia mít zejména silný výkon pro AI aplikace. Ale nemají sloužit jen pro ně, ale i pro 3D simulace a další tradiční HPC úlohy.

Zatím Nvidia tyto procesory prezentuje jako řešení šité na míru pro své vlastní servery nebo servery s jejími GPU. Není jasné, zda je třeba vypustí i na běžný trh jako konkurenci pro Epycy, Xeony a další ARM procesory jako je Altra. Třeba to firma má v plánu, ale nechce vyhlašovat takto dopředu. Je celkem dobře možné, že řadič pro LPDDR5X bude zároveň umět i klasickou DDR5, takže by se ze stejného čipu dal vyrobit i konvenční serverový procesor.

Zda toto vše znamená, že by si Nvidia mohla výhledově brousit zuby zase i na trh procesorů pro notebooky a nebo dokonce desktopová PC, těžko říct. Příležitost do tohoto trhu vstoupit bude samozřejmě záviset na tom, zda dejme tomu za dva roky bude etablovaná platforma Windows/PC na ARMu nebo zda takové prosazení bude nablízku. Pokud by procesory ARM opravdu začínaly vytlačovat architekturu x86, jak si to fandové teď přejí, tak by Nvidia možná mohla mít zájem také vstoupit na scénu.