A) Revoluční SVE/SVE2 tu máme prakticky tyto (z rozsahu 128...2048-bit):
1) 512-bit .......... ARM Fujitsu A64FX
2) 256-bit ......... ARM Neoverse V1
3) 128-bit .......... všechny ostatní ARMy od little až po big X4 jádra
Ukaž mi x86 SIMD sadu co umí alespoň tyto 3 délky a zůstala navzájem kompatibilní. Neukážeš, protože x86 jede pořád 30 let staré fixní délky registrů. Naposledy Intel portoval BF16 a NI z AVX512 zpět do 256-bit AVX2 pro jádra Gracemont. Což je prasárna a další sub-verze AVX2 a další fragmentace. Právě proto že 256-bit verze AVX512 neexistuje. A už vůbec si může nechat zdát o 128-bit verzi AVX512, kterou by potřeboval pro Gracemont, protože ten má vnitřně 128-bit SIMD. Tohle vše má ARM s pomocí flexibilních SVE vyřešené. To je ta revoluce.
1024-bit SVE2 za dva roky? Není problém. Už teď je to kompatibilní a tvůj dnešní SW ti na tom poběží 4x rychleji.
Nedivím se, že to uživatelé x86 nechápou.
.
.
.
B) Výkon
Tady někdo zapomíná na ARM CPU-only superpočítač, v době vydání nejvýkonnější na světě, který výkonstně porazil i obří GPU Nvidia Volta. Až tohle alespoň vzdáleně dokáže x86 CPU tak dej vědět.
.
Neoverse V2 má ....... 4x 128-bit FMA
AMD Zen 4 má ........... 2x 256-bit FMA
Takže stejný max teoretický výkon když už.
Navíc při čistě obyč nevektorovém FP64 kódu bude mít V2 výhodu v teoreticky 2x větší IPC než ten Zen 4, protože má 4 vs 2 FPU jednotky.