Úvod druhé části testu: průběhy fps
Jedná se o druhou část testu dvou SLI konfigurací. V první části jste si mohli porovnat průměrný výkon karet v jednotlivých hrách, v této části jsou pruhové grafy s průměrnými fps nahrazeny grafy průběhu fps v závislosti na čase. V další části (či částech) pak uvidíte další typické součásti testů grafických karet na ExtraHardware (shrnující grafy, vliv anti-aliasingu na výkon, spotřebu, teploty, poměr výkon/cena) i přehledné zobrazení škálování SLI a srovnání s dosud otestovanými konfiguracemi CrossFire.
Jak číst grafy v této části: První dva grafy v každé kapitole obsahují čtyři křivky. Normálně by mělo jít spíše o bodový graf (diskrétní hodnoty), spojitá křivka je jen přehlednějším zobrazením s lehkou újmou na přesnosti. Zapamatujte si, že modrou barvou má GeForce GTX 260, zelenou dvě GTX 260 v SLI, červenou pak 8800 GT a fialovou dvě 8800 GT v SLI. Pak už se budete snadno moci soustředit na tvar křivky: sledujte a srovnávejte propady, případně celý tvar křivky. Všimněte si společných propadů samotných karet i jejich SLI dvojic v mnoha hrách: v některých scénách je buď limitem zbytek systému (typicky procesor) nebo SLI (či Multi-GPU obecně) jednoduše nezapracovalo (třeba z důvodu aplikace postprocessing efektů anebo ještě častěji kvůli limitu frame buffer každé z osazených karet).
Abyste nemuseli chodit do starších recenzí, umístil jsem do každé kapitoly přímo pod dva grafy s SLI ještě další dvě dvojice grafů: jedna ilustruje plynulost (průběh fps) u Radeonu HD 4870 X2 (a HD 4870), další dvojice pak znázorňuje, jak si vede CrossFire dvou Radeonů HD 4770.
GeForce 8800 GT SLI (pouze ilustrační obrázek, zdroj: Nvidia)
Připomeňme si, jaký hardware vlastně v tomto článku testujeme. První SLI konfiguraci tvoří dvě referenční karty Nvidia GeForce 8800 GT s 512 MB paměti a 65nm jádrem G92 (112 SP, 56 bilineárních texturovacích jednotek, takt jádra: 600 MHz, takt SP: 1500 MHz). Paměťová sběrnice těchto karet je široká 256 bitů a celkem 512 MB GDDR3 běží na efektivní frekvenci 1800 MHz. Stejný výkon by měly i dvě GeForce 9800 GT (na referenčních taktech).
Silnější a dražší SLI systém představují dvě GeForce GTX 260. Jedná se o jádra G200 s 216 aktivními stream procesory (a 72 texturovacími jednotkami), ale vyráběná stále ještě 65nm výrobním procesem. Takty obou karet byly nastaveny na referenční úroveň: 576/1242/1998 MHz (jádro/SP/paměti efektivně). 448bitové paměťové sběrnici odpovídá také 896MB frame buffer.
Takto detekují SLI konfiguraci dvou GeForce GTX 260 přímo ovladače Nvidia. Vidíte také celkové množství grafické paměti (souhrn) i s přídělem od systému.
Pro pořádek připomenu torzo testovací konfigurace:
- procesor: Intel Core i7 920 (20× 166 MHz = 3,33 GHz, Turbo Boost: 3,5 GHz)
- základní deska: Gigabyte GA-EX58-UD5 (Intel X58)
- paměti: 6 GB Kingston DDR3-1866 (1000 MHz, 7-7-7-20, 1,5 V)
- pevný disk: Western Digital VelociRaptor VR150 (WD3000GLFS)
- zdroj: Gigabyte Odin GT 800W (GE-S800A-D1)
- Microsoft Windows Vista Ultimate SP1 (64-bitová verze)
- ATI Catalyst 9.4 (změněný INF) pro Radeon HD 4770
- ATI Catalyst 9.5 pro Radeon HD 4850/4870/4890 a 4870 X2
- Nvidia GeForce 185.65 pro GeForce GTX 260/285
- Nvidia GeForce 185.85 WHQL pro GeForce 8800 GT a GTX 260 SLI
Assassin's Creed (DX10.1)
Assassin's Creed
Pro měření použijte FRAPS, do volby automatického vypnutí po nějakém čase zadejte 72 sekund. Ve hře nastavte všechny detaily na maximální hodnoty, vypněte vertikální synchronizaci. Anti-aliasing se nastavuje také ve hře (vzorkování) a hodnota 3/3 by měla odpovídat 4× MSAA. Ten si lze ale dopřát jen do rozlišení 1680 × 1050 px včetně.
Po nastavení musíte mít hru uloženu na začátku prvního města (Masyaf), dole u studny (můžete využít i můj profil právě s takovou uloženou pozicí). Poté od studny vyběhněte ulicí nahoru (snažte se vyhýbat srážkám s kolemjdoucími, malé škobrtnutí ale nevadí. Používejte běh (pravé tlačítko myši), ale ne sprint (mezerník)) až k sekvenci ukazující pevnost. Po jejím skončení se otočte a vraťte se k domu, na který vylezete po žebříku. Dojděte až na jeho roh tak, abyste viděli z města pod vámi co nejvíce. Takto setrvejte několik vteřin a logování FRAPS se samo vypne. I při seběvětší snaze o co nejpodobnější opakování je v měření jistá malá dávka nepřesnosti (při naučení se průchodu se lze vejít do chyby 2 %).
U Assassin's Creeda mám nainstalovány dvě různé verze, jednu bez patche (1.01, retail) a druhou s patchem 1.02. Karty ATi Radeon s podporou DirectX 10.1 podávají v neošetřené verzi podstatně vyšší výkon, nějakých vad v obraze jsem si ani při pečlivějším studování screenshotů (alespoň v testované části) nevšiml. Zubaté stíny na Altairových šatech anebo lehce poblikávající spáry domů se objevují v obou verzích hry.
Call of Duty 5: World at War (DX9)
Call of Duty 5: World at War
Benchmark probíhá pomocí FRAPSu. Ten nastavte na 35 sekund. V možnostech hry aktivujte konzoli a do ní vepište devmap pel1b. Tím se dostanete na začátek mise Houževnatý (Relentless). Jakmile se tak stane, spusťte FRAPS. Po výskoku z vybuchlého tanku držte stále klávesu pro pohyb vpřed, FRAPS po chvíličce sám přestane logovat. Měření jsou opakovatelná s velmi malou odchylkou.
Crysis Warhead (DX10)
Crysis Warhead
K otestování výkon v Crysis: Warhead používám utilitu Framebuffer Crysis Warhead Benchmarking Tool 0.31. Abych měl měření kompatibilní s ověřovaným (ranked) benchmarkem, nechávám volbu na mapě ambush a implicitním čase (v tomto případě noc). Používám rozhraní DirectX 10 a nastavení Gamer (hráč, odpovídá detailům high v původním Crysis). Beru výsledek druhého měření, kdy už je hra načtena v paměti. V tomtom druhém průběhu rovněž zaznamenám podrobný FRAPSLOG. Měření jsou opakovatelná s minimální odchylkou.
Pozor, Crysis Warhead je jednou ze dvou her v metodice, kde je k měření použito režimu timedemo (= zobraz zcela všechny snímky, jak rychle to jde). Křivky karet v průběhovém grafu jsou proto od sebe vzájemně časově posunuty.
Enemy Territory: Quake Wars (OpenGL)
Enemy Territory: Quake Wars
Nové Enemy Territory představuje jedinou současnou moderní OpenGL hru pod Windows a zároveň jediný OpenGL test v testovací sadě. Quake Wars používají značně upravený Doom 3 engine, obohacený především o technologii MegaTexture (více o technologii v článku na Beyond3D). Pro testy používám maximální detaily, přes konzoli vypínám limit 30 i 60 fps, AA i AF zapínám ve hře.
Pro účely testování jsem si nahrál vlastní timedemo (recordtimenetdemo), které měří výkon v rozsáhlé lokaci se stromy (Valley). Timedemo (pro verzi 2.0) ke stažení: zde.
Enemy Territory: Quake Wars je tou druhou hrou, kde je k měření
použito režimu timedemo (= zobraz zcela všechny snímky, jak rychle to
jde). Křivky karet v průběhovém grafu jsou proto od sebe vzájemně časově posunuty.
Far Cry 2 (DX10.1)
Far Cry 2
Pro testy jsem používal zabudovaný benchmark, test Ranch Medium. Výsledky v grafech jsou z plynulejšího ze dvou opakování. Používám režim DirectX 10 a maximální detaily. Anti-aliasing zapínám přes nabídku hry.
Více v článku Far Cry 2: výkon grafických karet a vliv nastavení.
Mirror's Edge (DX9, PhysX)
Mirror's Edge
Přesné testování v Mirror's Edge je usnadněno naskriptovaným průchodem FlybyFlight (spustíte např. takto: "D:\Hry\Mirror's Edge\Binaries\MirrorsEdge.exe" -FlybyFlight), který prolétne pokaždé stejně části děje v epizodě Flight. Před spuštěním testu nastavte FRAPS na 62 vteřin, pak je důležité, abyste začali logovat hned po načtení lokace. V TdEngine.ini je třeba vypnout položku bSmoothFrameRate (nastavte na False), rozšířenou PhysX i maximální detaily zapínám přes menu hry.
Lokace v benchmarku je mimochodem také první místo hry, kde při skutečném hraní a zapnutou rozšířenou fyzikou bez akcelerace PhysX dojde k hrubým propadům výkonu. Více v článku Mirror's Edge, PhysX, GeForce, Radeony a procesory.
Race Driver GRID (DX9)
Race Driver GRID
FRAPS nastavte na vypnutí po 31 vteřinách. Po spuštění hry s nainstalovanou záplatou 1.2 zvolte v nabídce Race Day. Všechno mimo lokace (Location) a okruhu (Route) ponechte, tyto změňte na Milan a Castello Circuit B. V následující obrazovce vyberte start až za všemi dalšími auty (Grid Position: Back). Ihned po načtení trati spusťte FRAPS a startujte schválně pomalu: tak, abyste se drželi stále kousek za ostatními. To vydržte až do první prudší zatáčky, v níž akorát vyprší lhůta 31 vteřin a logování FRAPSu bude u konce.
Veškeré detaily jsou nastaveny na maximální hodnoty (Overall Detail: Ultra), anti-aliasing je zapínán rovněž přes menu hry. Změna rozlišení bohužel vyžaduje restart.
S.T.A.L.K.E.R.: Clear Sky (DX10.1)
S.T.A.L.K.E.R.: Clear Sky
U pokračování hry ze zóny kolem Černobylu jsem si opět vystačil hned s prvním táborem. Tentokrát jsem měření zjednodušil a udělal jej jednak přesnějším a rovněž srovnatelným se serverem PC Games Hardware. Jinými slovy využívám uloženou pozici PCGH (Users\Public\Documents\stalker-stcs\savedgames), která nejenže obsahuje výkondrásající paprsky vycházejícího slunce (god rays), ale stačí u ní po načtená spustit FRAPS, držet klávesu W pro pohyb vpřed a FRAPS vypnout před naražením do plotu. Měření je tak poměrně dost přesné.
Používám takřka plné detaily, náročný režim Enhanced full dynamic lighting (DX10), všechny legrace jako SSAO zapnuty. Jen anti-aliasing průhlednosti už nezapínám. Zapnutí či vypnutí anti-aliasingu vyžaduje restart hry, rozlišení nikoli.
Enhanced full dynamic lighting je režim, který umožní zapnout několik funkcí jako třeba Volumetric Smoke či Wet Surfaces (více v tomto srovnání). U karet ATI Radeon zapínám podporu DX10.1 (zlepšuje výkon, obraz nechávám při stejném nastavení), anti-aliasing průhlednosti budou snad stíhat grafické karty nějaké další generace. Jen pro zajímavost: DX10.1 režim tohoto A-tested objects vyhlazování je asi hezčí, ale náročnější.
The Elder Scrolls IV: Oblivion (DX9)
The Elder Scrolls IV: Oblivion
Čtvrtý díl série Elder Scrolls patří i přes svůj věk stále mezi nejnáročnější hry vůbec. Zvlášť, když stejně jako já v testu, vyberete lokace s množstvím vlnící se trávy, pohupujících se stromů a přesto rozhledem do vzdálené krajiny (The West Weald). Testuji s maximálními detaily a HDR. Soubor s nastavením (vše na maximum) a uložená testovací pozice ke stažení: zde.
Anti-aliasing i anizotropní filtrování vynuťte v ovladačích, v souboru Oblivion.ini se přesvědčte, že máte vypnutou vertikální synchronizaci (iPresentInterval=0). Po spuštění hry si nahrajte mou uloženou pozici číslo 260 a po načtení ihned začnětě logování FRAPSem a pohyb vpřed. Držte stále klávesu pro pohyb vpřed, dokud se neobjeví nápis upozorňující na to, že dále už nemůžete. Když nastavíte automatické vypnutí FRAPSu po 34 vteřinách, nic taky nezkazíte.
Tom Clancy's H.A.W.X. (DX10.1)
Tom Clancy's H.A.W.X. (DX10.1)
V arkádovém simulátoru bojových letadel lze využít nejen DirectX 10 pro efekty jako SSAO či volumetrické paprsky, ale také DirectX 10.1. Tuto revizi lze použít jak pro zrychlení hry na kartách, které ji podporují (což činím), nebo pro zlepšení obrazu nastavením SSAO na very high (což kvůli porovnatelnosti výsledků s kartami bez podpory DirectX 10.1 nečiním).
V nabídce s grafikými nastaveními je i tlačítko spouštějící zabudovaný benchmark, což v praxi znamená oblet města. Průběh loguji samozřejmě i FRAPSem, výstupem benchmarku jsou totiž jen dvě celočíselné hodnoty (průměrné a trošku nepochopitelně rovněž maximální fps).
Trackmania Nations Forever (DX9)
Trackmania Nations Forever
Trackmaniu hraje nejen ve světě, ale i v ČR obrovský počet hráčů, hra má navíc zabudovanou možnost benchmarku. Ten používám pro realistické a současně přesné měření i já. Detaily mám nastaveny na maximální hodnoty, anti-aliasing i anizotropní filtrování zapínám přímo přes možnosti hry a nastavením stínů na komplexní překračuji nejnáročnější předdefinovaný profil.
World in Conflict (DX10)
World in Conflict
Testuji s upraveným profilem very high details (zapnul jsem i water reflects clouds (voda odráží oblaka), anizotropní filtrování navýšil na 16×). Používám vestavěný benchmark.
Zaklínač (The Witcher) (DX9)
Zaklínač (The Witcher)
Opakovatelné testování v Záklínačovi není úplně jednoduché. Pro měření je samozřejmě používán nástroj FRAPS, detaily i anti-aliasing a anizotropní filtrování nastavuji v nabídce hry. Verze hry 1.3 a grafické karty s více jak 512 MB paměti by měly nabídnout i 4× AA přímo ve hře. U karet Nvidia GeForce funguje spolehlivě i vynucení anti-aliasingu v ovladačích, u karet ATI Radeon bohužel ne. Jakmile v ovladačích zvolíte 4× AA (MSAA, Box), vypne se anti-aliasing ve hře. A to bez ohledu na to, zda jej máte v menu hry zapnutý či vypnutý. Toto alespoň platí pro ovladače Catalyst 9.3.
Každopádně po načtení uložené pozice z Lesa na Blatech se otočte přímo na vstupní bránu do háje druidů, stiskněte klávesu pro pohyb vpřed a současně odstartujte logování FRAPSu (typicky F11). Projděte co nejpříměji, vyhněte se co nejmenším úkrokem ze směru. Logování vypněte v bažině, kde už opravdu dále směrem kupředu jít nejde. Měření jsou opakovatelná s překvapivě malou odchylkou, problémem je jen počasí. Jakmile načtete uloženou pozici a na Blatech prší, rovnou ji nahrajte znovu a doufejte ve vyčasený den (častější případ). Výkon karet je při deštivém počasí nižší. Při benchmarkování používám pohled přes rameno (F3).
Více v článku Zaklínač (The Witcher) vs. hardware: tweakguide.