Specializovaný procesor by byl ten hardwarový blok pro dekódování/enkódování videa (to už nějaké API, ovladač a obsluhu potřebuje), DSP v Qualcommech, obvody pro zpracování obrázu z kamery, GPU.
Proti tomu jsou IMHO AVX-512 úplně standardní instrukce, dělají to jednotky které jsou napojené pod stejných schedulerem v CPU jako všechno ostatní, nepotřebuje to žádný ovladač nebo framework nebo speciální API, je to jedna z instrukcí x86. Sice není všude, ale to ani třeba SSE4. To, že je to SIMD, IMHO není rozhodující, SIMD by v žádném CPU nemělo chybět.
To, že program si nejdřív musí nějak nasypat hodnoty do SIMD registru, to bych nepovažoval za podstatné. Když chci FPU výpočet, tak taky nejdřív musím konvertovat datový formát z integeru, ale FPU už je neodmyslitelná součást CPU 25-30 let, byť se třeba v mikrořadičích dá odebrat.
Jako ne že by to nebyly instrukce používané pro speciální účely a ne úplně permanentně, ale pořád je to součást procesoru. Přes SIMD registry/instrukce se jinak dneska dělají i základní operace jako MEMCPY a to je už úplně běžná práce přítomná v jakémkoli programu.
Přes AVX-512 zrovna asi ještě ne kvůli malému rozšíření, ale jednou se to tak nejspíš používat bude, mezi SSE(2) a AVX-512 není nějaký principiální rozdíl, jen jsou to jiné registry a jiná šířka vektoru.