To teoreticky nemusí být úplná nevýhoda, pokud by ty shadery zabíraly míň místa na čipu (jednotky Turing jsou zdá se celkem velké - TU116 má 284 mm2 na 12nm, Polaris 10 byl 232 mm2 na 14nm...), i když je asi jednoduší škálovat výkon s menším počtem výkonnějších. Ale vzhledem k tomu, že dneska běžně máme 3000-4000 (5000 Volta) shaderů, tak tady ta paralelizovatelnost je a tzv. "flock of chickens" přístup může fungovat.