ARM oznámil budoucí jádra Matterhorn a Makalu: +30 % výkonu v roce 2022 a konec 32 bitů

8. 10. 2020

Sdílet

 Autor: ServeTheHome
ARM odhalil plán dalších generací jader Cortex. Možná se trochu zpomalí růst výkonu, ale architekturu čekají velké změny. Od roku 2022 budou velká jádra čistě 64bitová, bez 32bitové kompatibility.

Teprve letos ARM oznámil jádro Cortex-A78 (a jeho výkonnějšího bratra/sestru Cortex-X1), takže ještě není čas pro vydání další generace. Ovšem podobně jako při nedávnem předběžném ohlášení nových jader Neoverse N2 a V1 pro servery se firma rozhodla trošku upřesnit plány na další dva roky a poodhalit, jaká výkonnostní zlepšení máme čekat u budoucích jader.

Firma publikovala zjednodušenou roadmapu, podle níž se na příští rok chystá jádro nebo generace více jader zatím kódově označená Matterhorn. Na těchto jádrech by zřejmě měla být založená už představená serverová architektura Neoverse N1. Přesná označení mobilních/spotřebitelských jader/jádra ale zatím nemáme. Poté v roce 2022 bude následovat generace jader Makalu, od kterých pochopitelně také ještě není jasné finální obchodní jméno.

Od roku 2022 už jen 64bitová architektura

S těmito jádry přijde poměrně významná změna. ARM uvádí, že přejde na čistě 64bitovou instrukční sadu, což znamená, že bude zahozena kompatibilita s 32bitovým kódem (ARMv7 a dřívější). Toto umožní ušetřit tranzistory a zmenšit jádra. Také to může rozvázat ruce k určitému zlepšení výkonu, mikroarchitektura jádra bude optimálnější.

ARM uvádí, že toto zahození kompatibility má nastat od roku 2022 – od tohoto bodu mají „velká jádra“ mít už jen podporu pro 64bitovou instrukční sadu. Zřejmě se to tedy týká architektury Makalu, i když dříve se objevovaly informace, že již Matterhorn má být velká architektonická změna a počátek nové linie. Matterhorn snad měl být také první architektura, kde ARM zavede novou generaci instrukční sady ARMv9, obsahující SVE+SVE2 a právě možná odstraňující kompatibilitu s 32bitovým režimem (poznámka: 64bitová architektura nyní se označuje ARMv8).

Prezentace serverových architektur ARM Neoverse V1 a ARM Neoverse N2 06 Instrukční rozšíření SVE: list z prezentace serverových architektur ARM Neoverse V1 a ARM Neoverse (Zdroj: ARM). Jádra Matterhorn a Makalu už by mohla mít SVE také.

Ovšem tyto detaily ještě firma oficiálně nepotvrzuje a je možné, že onou velkou změnou by mohlo být až Makalu. Nebo Matterhorn už bude ARMv9, ale dočasně v něm ještě pořád nějaká provizorní zpětná kompatibilita bude zachována.

Tato nová generace jader má také zlepšovat bezpečnost. V Matterhornu bude zavedeno rozšíření Memory Tagging Extension, které bude pomáhat v ochraně proti zranitelnostem/útokům, které se snaží přistupovat do paměti, ke které nemají přístupová práva. Díky štítkování bude snadnější je odhalit a zamezit jim. Zatím není jasné, zda jde hlavně o funkci pro servery, nebo se objeví i v mobilních zařízeních s Androidem.

Makalu bude o 30 % rychlejší než Cortex-A78

Pro vás nejzajímavější ale možná bude údaj o výkonu těchto budoucích jader, který ARM také předestřel. Mezi generacemi Cortex-A73, 75, 76, 77 a 78 respektive X1 byly velké skoky v IPC, díky kterým výkon jader Cortex hodně stoupl a vyvolal i velké očekávání do budoucna. Podle nové roadmapy toto bude pokračovat i dále, ale možná v trošku menším tempu. To může teoreticky indikovat, že s přiblížením k výkonu nejrychlejších x86 jader se projevuje zákon klesajícího užitku a další zrychlení jsou obtížnější. Ale je také možné, že zatím ARM dává takticky jen konzervativní odhad a reálný křemík pak bude o hodně lepší.

Podle roadmapy přinese jádro Makalu až o 30 % vyšší výkon proti dnešnímu Cortexu-A78 (který má o jednociferná procenta vyšší výkon proti Cortexu-A77). Toto 30% číslo je pro celočíselný (integer) výkon, a to jednovláknový. Jde o skóre v benchmarku SPEC CPU 2006, specificky v komponentě SPECintbase2006. Pokud jádra přinesou SVE/SVE2 a k tomu třeba i rozšíření SIMD jednotek, jako má architektura Neoverse V2, tak multimediální a HPC výkon v SIMD kódu zrychlí o dost víc. A vícevláknový výkon pak samozřejmě může narůst ještě víc přidáním dalších jader.

Roadmapa jader ARM Matterhorn a Makalu Measured estimates on SPECint*_base2006 (SPECspeed* Integer component of SPEC CPU* 2006), Arm single-core performance estimated for compute platform. Results are measured estimates using specific computer systems, software, components, operations, and functions and changes to any of these factors will cause the results to vary. Graph not to scale. (Zdroj: ARM)

Všimněte si také, že ARM nesrovnává s Cortexem-X1, který má prý mít o 30 % vyšší výkon než Cortex-A77 a tedy dejme tomu 20–25% nárůstu výkonu nad jádrem A78. Jen +30 % pro Makalu by pak bylo dost málo. Zde je to ale možná vysvětlitelné tím, že ARM srovnává jen jablka a jablka a 30% nárůst mezi A78 a Makalu platí pro nějakou variantu generace Makalu, která efektivitou kategorií odpovídá áčkové řadě Cortexů nyní. Ale nad tímto Makalu by opět zase mohla existovat nějaká „verze X“ s navýšeným výkonem, možná zase i o desítky procent. Takové „Makalu X“ by pak mohlo mít zase 30% nárůst výkonu i proti Cortexu-X1. Nebo třeba i větší – co my teď víme.

Také je dobré podotknout, že plány na tyto architektury byly asi načrtnuty před tím, než ARM koupila Nvidia (tedy pokud antimonopolní úřady svolí). Ta by teoreticky teď mohla strategii ještě upravovat.

Tip: Potvrzeno: Nvidia koupila za 40 miliard $ ARM. Vzniká čipová velmoc a prý také „svět AI“

Zpomalení tempa u ARMu?

Toto 30% skóre ovšem platí společně pro dvě generace, jde tedy o zlepšení mezi Cortexem A78 z roku 2020 a mezi Makalu z roku 2022. Každoroční mezigenerační nárůst v Matterhornu a poté mezi Matterhornem a Makalu by tedy již měl být nižší.

Vkrádá se tím otázka, zda tedy ARM trošku nezvolňuje a trošku nebere vítr z plachet fandům této architektury, kteří někdy poukazují na to, že jádra ARM vykazují 20–30% zvýšení IPC (tedy výkonu na 1 MHz) každý rok, zatímco jádra Intelu a AMD mají zvýšení IPC třeba jen o 12–18 % a ještě jen jednou za dva roky. Pokud by dřívější tempo trvalo, měl by ARM výrobce x86 procesorů brzo rozdrtit v jednovláknovém i vícevláknovém výkonu. Pokud teď ale tempo velkých inovací zpomalí třeba na dvouletý cyklus, mohou obě platformy třeba spíš konvergovat k podobné úrovni výkonu.

bitcoin školení listopad 24

Ale na druhou stranu se tu bavíme o dva roky vzdálené budoucnosti – respektive třeba i tři roky vzdálené, protože Makalu reálně bude v zařízeních o něco později, typicky až v roce 2023. Je možné, že nakonec i toto volnější tempo bude stačit k vítězství (zvlášť když se přidá vyšší počet jader). A také je tu ona možnost „Makalu X“ (a předtím „Matterhornu X“) s vyšším výkonem. Konkurenční boj by tedy pořád měl být dravý.

Prezentace serverových architektur ARM Neoverse V1 a ARM Neoverse N2 01 Prezentace serverových architektur ARM Neoverse V1 a ARM Neoverse N2. Jádro N2 by mělo zřejmě patřit ke generaci Matterhorn

Galerie: Prezentace serverových architektur ARM Neoverse V1 a ARM Neoverse N2

Zdroj: ARM