Serverové ARM procesory Marvell: 7nm ThunderX3 příští rok, má být lepší než Epyc Rome

15. 12. 2019

Sdílet

Poměrně hustě padají poslední měsíc kapky, pokud jde o různé procesorové výrobce, kteří by rádi zaútočili na Intel v oblasti serverů. Startup Nuvia vzešlý z mozků Applu, nové x86 procesory od Centauru, 64jádrové ARM čipy Graviton2 od Amazonu a 80jádrový eMAG 2 od Ampere. Aby toho ještě nebylo málo, přicházejí ještě informace k dalšímu bojovníku na straně architektury ARM: o následníku procesorů Cavium/Marvell ThunderX2, což byly dosud asi nejschopnější a nejkonkurenceschopnější serverové ARMy. Procesory ThunderX3, které na ně navážou, mají zvýšit výkon více než dvojnásobně a Marvell dokonce slibuje, že by měly být lepší, než 7nm Epycy od AMD.

Marvell (a Cavium, než jím bylo koupeno) už sklidil nějaké ty úspěchy s nynější 16nm generací ThunderX2, jejíž DNA pochází z architektury Broadcom Vulcan. Procesor v recenzích ukázal výkon konkurenceschopný s velkými procesory ve běžných serverových aplikacích, pakliže jsou ovšem dostupné na platformě ARM. O procesory ThunderX2 ale údajně má zájem i Microsoft pro své vlastní serverové využití, což by jim pak teoreticky také mohlo otevřít cestu k nasazení v cloudu Azure. A zajímavé je, že tyto procesory nacházejí uplatnění i v superpočítačích, což asi nikdo moc nečekal.

Procesor Cavium ThunderX2 v socketu, zdroj: ServeTheHome

Na ThunderX2 má podle roadmapy Marvellu navázat generace ThunderX3, která přijde na trh příští rok (2020). ThunderX3 s interním kódovým označením Triton bude již 7nm procesor, takže v efektivitě a výkonu tranzistorů, z nichž se bude skládat, srovná krok s Epycem 7002 (případně oním Gravitonem2) a získá v tom výhodu proti 14nm Xeonům. Další nový čip – ThunderX4 – vyjde poté opět zhruba za dva roky, tedy okolo roku 2022, u toho ale zatím plánovanou výrobní technologii neznáme (smysl by dával 5nm proces TSMC).

Ačkoliv Marvell/Cavium by měl přebírat některé technologie ARM Neoverse (jako propojovací logiku), samotné jádro CPU stále bude navrhovat sám, nepřejde tedy na licenční jádra N1 od ARMu jako Ampere. Do firmy prý proto přešli například někteří inženýři ze zrušené serverové divize Qualcommu (procesory Centriq).

Roadmapa procesoru Marvell ThunderX TheNextPlatform Roadmapa procesorů Marvell ThunderX (Zdroj: The Next Platform)

Marvell ThunderX3

Procesor Triton/ThunderX3 má zachovat osmikanálový řadič pamětí DDR4, který má již ThunderX2, nebylo tedy přikročeno ke zvýšení. Je však možné, že osmikanál bude takové nové lokální minimum, z kterého firmy výš nepůjdou, protože už s osmi kanály (zejména při 16 DMMech) je velmi komplikované nacpat na desku dva sockety.

2× výkonnější FPU

Co však bude posíleno, je výpočetní výkon v instrukcích SIMD/FPU. Toto u jádra Vulcan (ThunderX2) nebylo nejsilnější, jádro mělo jen dvě pipeline se šířkou 128bitů (SIMD instrukce ARM Neon), zatímco třeba Zen měl čtyři. Architektura Tritonu bude mít stále jen 128bitové jednotky, ale budou již čtyři, takže výkon vy SIMD kódu může teoreticky narůst až dvojnásobně. Výhledově mají v procesorech ThunderX přibýt také vektorové instrukce SVE, ale nebylo řečeno konkrétně kdy, takže dost možná nastanou až v ThunderX4, ne-li později.

Dále by zřejmě měly být zvětšené L1 a L2 cache, které v ThunderX2 mají kapacitu 32+32 KB (L1) a 256 KB (L2). Zvětšit se mají také out-of-order buffery, prediktor větvení, prefetch a algoritmy cachování, latence a snad by mohly být nějak vylepšeny ALU, ale i některé části frontendu. K těmto IPC zvyšujícím faktorům se pak podle Marvellu připojí také výrazně vyšší frekvence – ThunderX3 bude mít prý o dost vyšší takty, než jakých dosahují 16nm čipy ThunderX2.

Marvell ThunderX3 slajd WikiChip Oblasti zlepšení architektury pro Marvell ThunderX3 (Zdroj: WikiChip)

Počet jader nebyl bohužel ještě sdělen. Řečeno bylo jen, že jak IPC jader, tak jejich počet má výrazně narůst, ale už ne, zda třeba srovná laťku s Gravitonem2 a Epycem 7002 na 64 jader. Ovšem firma uvádí, že proti 32jádrovému ThunderX2 má výkon narůst podstatně více než dvojnásobně.

Zástupci Marvellu údajně uvedli, že v současnosti má 16nm ThunderX2 asi o 20 % menší plochu křemíku proti 14nm Epycu 7001 (Naples) a také údajně o podobné číslo lepší energetickou efektivitu. Až bude ThunderX3 srovnán se 7nm Epycem 7002 (Rome), tak údajně obě tyto výhody budou ještě výraznější. V energetické efektivitě a v poměru výkonu k ploše čipu má prý ThunderX3 být lepší i něž 10nm Xeony Ice Lake od Intelu. Toto jsou ale zatím jen sliby/plány firmy, takže bude třeba počkat, zda je finální křemík dokáže naplnit. Pomáhat by mělo, že ThunderX3 na rozdíl od Epycu bude monolitický čip. Na druhou stranu pokud ThunderX3 vyjde třeba už v polovině roku, bude mít AMD během pár měsíců možná už na trhu novou generaci Epyců Milan s jádry Zen 3, takže konkurovat bude místo Rome asi hlavně jim,

bitcoin školení listopad 24

We have a custom Arm core that is designed for server applications, and when we look at the performance per watt and the performance per area, we clearly see a big advantage. We have about a 20 percent die area advantage over Naples, and we have a similar power advantage. And when we move to 7 nanometers with ThunderX3, we see that our area and power advantage actually gets better. Our area compared to AMD Rome and Intel Ice Lake is better, and our power efficiency will be significantly better.

ThunderX4 bude opět velký skok

K ThunderX4 ještě firma nic bližšího neřekla, ale kromě pokročilejšího procesu má opět mít novou architekturu, protože se zase má zlepšit IPC (tedy výkon na 1 MHz). Tento procesor má i opět přidat jádra oproti ThunderX3 a zároveň má zase zlepšit energetickou efektivitu. Takto prý bude nastávat v každé nové generaci těchto procesorů, Marvell tedy neplánuje dělat evoluční mezigenerace, ale každý krok by měl přinášet novou architekturu, nový proces a ještě ono zvýšení počtu jader.

Srovnání ThunderX2, procesoru Epyc a Xeonů (Skylake-SP, Broadwell-EP a Sandy Bridge-EP)

Marvell má údajně dva vývojové týmy, které se trochu jako u tick-ticku Intelu střídají vždy po generaci, což umožňuje mít novou architekturu každé dva roky. Společnost (která má poměrně široké portfolio produktů a je o dost větší, než původní Cavium) by se tedy mohla do budoucna stát v docela významným hráčem a patřit do první ligy výrobců serverových procesorů.

Galerie: Křemíkové firmy, které vyrábějí procesory s technologií ARM