Pánové, ty TFLOPS jsou skutečně objektivní veličina, tam opravdu nemůže být řeč o tom, že by se u jednoho GPU počítaly jinak než u jiného.
Že je aplikace využívají různě dobře, to jsem snad nerozporoval, ne? V superpočítačích v žebříčku TOP500 se uvádí TFLOPS odvozené ne teoreticky (což dělají výrobci GPU, takže mě za to nenahánějte),a le změřené v Linpacku. A na těch výsledcích je docela dobře vidět, jak různé architektury/GPGPU/CPU/akcelerátory mají odlišnou výtěžnost výkonu proti teorii. A to je ještě Linpack na škálování dost snadnej, realita je u GPGPU těžší.
Vy do toho pořád taháte herní výkon, ale tady je řeč o tom výpočetním! Ten nepoměr výkonu ve hrách k TFLOPS u AMD a Nvidie není ale o tom, že by Nvidia měla lepší FLOPS a AMD šizené. Jak říkám, FLOPS udávají sílu ALU, což jsou shadery. A AMD má *reálně* těch ALU v shaderech víc, a při vynásobení frekvencí dají víc operací, přesně jak to udává ten počet FLOPS. Tam není žádnej podvod, marketing, žádnej dvojí metr.
Důvod, proč je NVidia při stejných TFLOPS rychlejší ve hrách totiž není v shaderech, ona fakt má menší souhrný výkon ALU. Jenže má výkonnější geometrii, teselaci, rasterizaci, možná lepší práci s pamětí, lepší delta kompresi. Jo a myslím taky nahrazování shaderů z her optimalizovanýma verzema přibalenýma v ovladači (proto je tak velkej). Jenže to jsou věci používané ve hrách. Ve výpočtech samozřejmě ne, tam se někdy třeba projeví ta větší hrubá propustnost (řekněmě u Hawaii, Fiji proti dobové konkurenci) ale prostě tam hlavně záleží na těch ALU - TFLOPS.
Kromě toho k tomu přistupuje ještě kompilátor a kvalita programu, a když bude nástroj u CUDA lepší a programátor to líp zoptimalizuje, tak může NVidia zase získat náskok. Jenže to už je softwarová stránka, stejná věc jako u CPU konec konců.
Ještě jednou, Maudit tohle začal čistě o AI, tedy výpočetním použití (když se mluví o TFLOPS, tak co jiného). Já jsem teda taky mluvil o výpočetním použití. Doufám, že jsem to teď vysvětlil?