Díky za link, Rémi Denis-Courmont je nebo aspoň byl vývojář VLC (a ffmpegu?).
Jinak když se tam podíváte, tak je tam patrná jedna věc - kód se u těchhle rozšíření ptá hardwaru na to, jakou má šířku implementace (tj. kolik bitů jsou jednotky široké, a jestli jsem si dobře všiml i na implementaci shuffle?) a podle toho se zařizuje.
Takže v reálu se toho zas tak moc nemění proti x86 - program musí dělat runtime CPU detection a podle toho volit codepath. Jenom budete mít v programu 2-3 codepathy pro SVE2 místo SSE4, AVX2 a AVX-512.
BTW zkoušel jsem si rychle gogolit jeho aktivitu v ffmpegu a první výsledek:
"[FFmpeg-devel,1/3] lavc/opusdsp: RISC-V V postfilter"
"This is optimised for a vector size of 128-bit. Or maybe it would be
more accurate to state that this is not properly optimised for larger
vector sizes, as they would work just fine with a smaller vector group
multiplier."
¨mimochodem tam je poznámka že ARM má přes 1000 instrukcí a rozhodně není RISC ve smyslu jednoduchých instrukcí"
To je rozhodně pravda. Ty rozlišení už dneska v praxi nemají smysl ale podle nich by to byl CISC - akorát s fixní délkou instrukcí (což je to rozlišení mezi x86 a ARM, které ještě dnes smysl má).