SVE vektory nejsou revoluční tím, že umí 2048-bit šířku vektoru, ale hlavně tím, že instrukce SVE neobsahují informaci o šířce toho vektoru. Proto lze naprogramovat SW tak, že umí pracovat s jakoukoliv šířkou SIMD v CPU, tedy od základních 128-bit, přes 256-bit .... až po těch 2048-bit. Podle toho jak širokou SIMD ten SW po spuštění detekuje, tak si ty vstupní data rozseká automaticky.
To je na tom to geniální. Jeden a ten samý SW běží maximálně rychle na všech 16-ti různých SIMD šířkách SVE. Dnes ti tvůj SW poběží na těch 512-bit SVE, ale za pár let až někdo udělá 2048-bit SVE tak ten samý SW poběží automaticky 4x rychleji. Tohle x86 s fixníma vektorama neumí, starý SW který používá 128-bit SSE ti na moderním Zen 4 co umí AVX512 nepoběží 4x rychleji v 512-bit módu. SVE tohle umí.