Mají jednu 512bitovou jednotku a dvě 256bitové (které umí dohromady udělat 512bitovou operaci za cyklus).
(u AMD jsou čtyři 256bitové, ale třeba FMA nebo násobení se dají udělat jenom ve dvou, takže tam vznikne ten 2× rozdíl; myslím, že v těch jednodušších operacích jako integer SIMD sčítání to umí víc než dvě jednotky současně, ale celkově má ta FPU nižší kapacitu).