Majitelé posledního titulu ze série Tomb Raider si možná před pár dny všimli, že jim v menu přibyla možnost otestovat výkon pomocí zabudovaného benchmarku (Start benchmark) a v nastavení pak možnost volby DirectX 12 API. Pátý patch RoTR hru dostane do sestavení 1.0.638.8 a kromě benchmarku a DX12 přináší ještě funkční technologii VXAO (Nvidia Voxel Ambient Occlusion vypadá ještě o něco lépe než HBAO+, viz třeba zde ).
RoTR jsem začal testovat v březnu klasicky Frapsem a tak nějak v souladu s metodikou mnoha webů hned spolehlivě opakovatelným začátkem ve sněhové bouři na hřebeni velehor. S novým patchem jsem mohl naměřené výsledky nejen zahodit, ale stejnou metodiku jsem nemohl použít ani pro srovnání DX11 vs. DX12. Fraps totiž pod API DX12 nefunguje (resp. nefunguje overlay Frapsu, takže je potřeba testovat „naslepo“). Naštěstí byl do hry přidán zmíněný integrovaný benchmark, který mi stejně ukázal, že existují výrazně náročnější lokace než zasněžené hřebeny hor (v benchmarku jsou celkem tři různé lokace).
Pro otestování výkonu v RoTR používám následující nastavení:
Vypnuty tedy nechávám absurdní efekty napodobující nedokonalosti objektivů, ale jinak jde v podstatě o testování na maximum (o anti-aliasing se pak stará především vysoké rozlišení, což je koneckonců nejlepší způsob). Pro 1440p i 2160p uvidíte vždy dva grafy – v prvním je průměrná snímková frekvence ze všech tří lokací v benchmarku, minimum je pak opravdu tím minimem ze všech tří částí.
Jak vidíte, průměrná snímková frekvence je po přepnutí na API DX12 při stejné kvalitě obrazu nižší než s API DX11. Naopak minima se kromě jediné výjimky (GTX 980) s DX12 vždy zlepší. To je trochu v rozporu s tím, co bychom obecně od přechodu k API DX12 očekávali. Pokud se ale podíváte na vývojářský blog , uvidíte příklad s Core i7-2600K a specifickou scénu, kde optimalizace s DX12 pomohla odstranit úzké hrdlo v podobě CPU a lepší paralelizací zkrátit časy zpracování v tomto místě.
Integrovaný benchmark je však zaměřen zřejmě více na prověření GPU a zatím s tím asi nic neuděláme. Jak jsem zmínil, Fraps pod DX12 (aspoň zatím) nepracuje a po přepnutí na API DX12 nefunguje třeba ani overlay Steamu. Další věcí je, že testujeme na přece jen silnějším Sandy Bridge-E (šest jader přetaktovaných na 4 GHz, čtyřkanálová RAM, 15MB L3 cache…):
A pro pořádek ještě doplním detaily o čtyř v grafech zastoupených highendových grafikách a použitých ovladačích:
GeForce GTX 980 Ti | Radeon R9 Fury X | GeForce GTX 980 OC | Radeon R9 390X OC | |
Výrobce karty | Nvidia | AMD | Asus | Sapphire |
Označení modelu | ref. karta | ref. karta | Strix-GTX980-DC2OC-4GD5 | 390X Tri-X |
Takt GPU [MHz] | 1000 | 1050 | 1178 | 1055 |
Takt Boost [MHz] | 1076 | – | 1279 | – |
Takt pamětí (efektivně) [MHz] | 7012 | 1000 | 7012 | 6000 |
Velikost grafické paměti [MB] | 6144 | 4096 | 4096 | 8192 |
Šířka paměťové sběrnice [bit] | 384 | 4096 | 256 | 512 |
Verze ovladače | 364.51 | 16.2.1 Crimson | 364.51 | 16.2.1 Crimson |
Zjištěný takt GPU v zátěži [MHz] | 1177 (občas na 1152) | 1050 (občas padá na 800) | 1291 | často throttlí na 858 |
Cena vč. DPH [Kč] | 18 400 | 18 500 | 15 300 | 11 500 |