Tady někdo očividně důvěrně studoval whitepapary AMD a Nvidie. Doporučím osvěžit pamět:
http://amd-dev.wpengine.netdna-cdn.com/wordpress/media/2012/10/Asynchronous-Shaders-White-Paper-FINAL.pdf
http://international.download.nvidia.com/geforce-com/international/pdfs/GeForce_GTX_1080_Whitepaper_FINAL.pdf
Je mi úplně fuk co bylo za éry DX11, to na to nemá absolutně vliv. Ještě Maxwell používal pouze statické rozdělování CU, což mohlo stačit pro účely GPGPU, ale rozhodně ne pro hry, kde délka výpočtu může dramaticky měnit prakticky každý snímek. Až Pascal začal vůbec nějak řešit stalling pomocí "Dynamic Load Balancing", ale pořád to není na úrovni CGN. CGN má dedikovanou cache pro přepínání kontextu, kdežto i Pascal s tím musí do VRAM, což je řádově pomalejší. CGN taky umožňuje daleko větší granularitu až na úroveň 1CU díky ACE a rychlému přepínání kontextu. Tady zdůrazním, že se stále nejedná o situaci "AMD má větší výkon pro výpočty", pouze o "v tomto konkrétním případě není architektura Nvidie dostatečně pružná a bude mít nevyhnutelně výkonové propady".
A jako jsem zmínil o kus níž, co se týče hrubého výkonu, tak Nvidia nemá konkurenci a v drtivé většině případů nemá s efektivitou problémy.