Já fakt nemůžu z těch revolučních flexibilních vektorů... Fakt vám nepřijdou tyhle řeči dost ironické?
"revoluční vektory SVE2 v mobilech" jsou reálně jenom 128bitové. *žádná architektura* nemá SVE2 na širších SIMD jednotkách.
x86 procesory mají 128bitové vektory (SSEx), 256bitové (AVX/AVX2) i 512bitové (AVX-512) vektory, takže programátor buď s těma širšíma může vytěžit mnohem vyšší celkový výkon, nebo použije ty užší, když se mu to víc hodí do algoritmů. To ovšem ale skutečně, skutečně vůbec není flexibilní /s
Dokonce některé x86 procesory používají určitou šířku SIMD operací jednotky s nižší šířkou. Vždyť je to skoro to samé, jako u toho konceptu SVE (ale vzniklo to ve špatném táboře, počítám rozhodující faktor...), akorát je maximální šířka zvolená nižší.
Zajímavé je, že když se diskutuje o fyzických SIMD jednotkách v jádře, tak je podle vás super nápad to místo zpracování jednoho širokého vektoru počítat zvlášť několikrát po kouskách, ale na úrovni instrukční sady to máte přesně obráceně...