No já nevím... ta jednotka SIMD/FPU (to SIMD je dneska důležitější, protože skalární fp výpočty x87 už dneska jsou fakt legacy, pro HPC se používá SIMF floating-point) je v jádře Zen taková kompromisní. Je hodně dobrá na SSE-SSE4 díky čtyřem pipe, ale zase když se vhodně použije AVX2, tak má Intel potenciál výkonu na jedno jádro vyšší (ale bacha, to zase zvyšuje spotřebu). Spíš by se dalo říct, že je ta architektura optimalizovaná na to, aby bylo rychlé co nejširší spektrum softwaru a zároveň to nežralo (energetická efektivita...).
Osobně by se mi teda líbilo, kdyby se v náročných úlohách AVX2 víc šířilo a AMD taky zvětšilo interní šířku SIMD, aby se ty operace dělaly jedním průchodem (rychleji). Bohužel teda tomu ani Intel moc nepomáhá, když pořád vypíná AVX/AVX2 na Pentiích a Celeronech. Vývojáři se ještě strašně dlouho nebudou moct spolehnout na to, že ty instrukce většina CPU má. Taky by to asi potřebovalo, aby CPU vykazovala menší propad frekvence při 256bit. výpočtech, protože to optimalizaci hodně komplikuje a může vést k tomu, AVX/AVX2 naopak program zpomalí.