Úvod, testovací sestava
Podpora obou nejrozšířenějších Multi-GPU technologií současnosti: Nvidia SLI a ATI/AMD CrossFireX v lepších základních deskách s Intel X58 byla hlavním důvodem přechodu z platformy LGA 775 na LGA 1366. Tedy alespoň co se testovací sestavy pro grafické karty týče. Pomalu bylo na čase tuto přednost zužitkovat a po prvních testech CrossFire (viz článek o CrossFire zapojení dvou Radeonů HD 4770 a o nárůstu výkonu s Radeonem HD 4870 X2 oproti Radeonu HD 4870) přihází na řadu SLI.
Cílem této série článků není ultimátní odpověď na to, kolik přesně získáte s takovou a takovou Multi-GPU konfigurací výkonu navíc, ale spíše prověřit, jak se SLI/CrossFire popasuje s aktuální testovací metodikou, vytvořit jeden z mála článků zabývající se plynulostí s Multi-GPU (grafy průběhu fps) a celkově si něco říct o praxi s SLI/CrossFire.
Po dvou článcích o CrossFire začínáme tedy minisérie prověřující SLI společnosti Nvidia. Alternativu levného CrossFire dvou HD 4770 tvoří dvě GeForce 9800 GT v SLI. V testu jsou použity dvě karty GeForce 8800 GT, což na výkonu nic nemění (8800 GT = 9800 GT). Pouze v případě, kdy byste narazily na 55nm GeForce 9800 GT, můžete čekat lepší provozní vlastnosti. Ty se ale koneckonců liší i mezi výrobci různě modifikovanými variantami 65nm 8800/9800 GT (chlazení, 2D takty, ...). Obě použité karty s G92 jsou v referenčním provedení Nvidia.
Dvě GeForce GTX 260 v SLI tvoří takový protipól Radeonu HD 4870 (1 GB) a Radeonu HD 4870 X2. Jedná se o verzi s 216 stream procesory a 65nm jádrem (a tedy pamětmi z obou stran PCB). Společnost Gigabyte, která karty do testu poskytla, je značí jako GeForce GTX 260 OC.
V další části (nebo částech) testu se dočkáte těch zajímavějších věcí: testů spotřeby sestavy a zahřívání GPU, shrnujících grafů výkonu a poměrů cena/výkon, grafů průběhu fps, vlivu zapínání anti-aliasingu na výkon a srovnání škálování SLI se škálováním CrossFire.
Testovací konfigurace
Hardware
- monitor: HP LP3065 (30", 2560 × 1600 px, S-IPS)
- procesor: Intel Core i7 920 (20× 166 MHz = 3,33 GHz, Turbo Boost: 3,5 GHz)
- základní deska: Gigabyte GA-EX58-UD5 (Intel X58)
- paměti: 6 GB Kingston DDR3-1866 (1000 MHz, 7-7-7-20, 1,5 V)
- pevný disk: Western Digital VelociRaptor VR150 (WD3000GLFS)
- optická mechanika: Lite-On DH-4O1S (Blu-ray, DVD-ROM)
- zdroj: Gigabyte Odin GT 800W (GE-S800A-D1)
- skříň: Cooler Master Centurion 534
- chladič CPU: Scythe Mugen 2 + Noctua NT-H1
- systémové větráky: Arctic Fan12 PWM + Cooler Master 12 cm @ 800 rpm
Operační systém a ovladače
- Microsoft Windows Vista Ultimate SP1 (64-bitová verze)
- ATI Catalyst 9.4 (změněný INF) pro Radeon HD 4770
- ATI Catalyst 9.5 pro Radeon HD 4850/4870/4890 a 4870 X2
- Nvidia GeForce 185.65 pro GeForce GTX 260/285
- Nvidia GeForce 185.85 WHQL pro GeForce 8800 GT
Testovací software
- 3DMark Vantage (1.1)
- Bioshock (demo)
- eVGA Precision (1.5.1)
- Framebuffer Crysis Warhead Benchmarking Tool (0.31)
- Furmark (1.6.0)
- GPU-Z (0.3.3)
- NiBiTor (4.9)
- RivaTuner (2.24)
- TechPowerUp Radeon BIOS Editor (1.2)
- Window Clippings (2.3)
Herní testy
-
Assassin's Creed (1.01/1.02, DirectX 10.1, 2008/04)
- Metacritics: 79 % (users: 82 %), Gamerankings: 80 %
-
Call of Duty: World at War (1.3, DirecX 9.0c, 2008/11)
- Metacritics: 83 % (users: 69 %), Gamerankings: 84 %
-
Crysis Warhead (1.1.1.687, DirectX 10, 2008/08)
- Metacritics: 84 % (users: 82 %), Gamerankings: 85 %
-
Enemy Territory: Quake Wars (demo, 2.0, OpenGL, 2007/09)
- Metacritics: 84 % (users: 83 %), Gamerankings: 84 %
-
Far Cry 2 (1.02, DirectX 10.1, 2008/10)
- Metacritics: 85 % (users: 55 %), Gamerankings: 85 %
-
Mirror's Edge (1.01, DirectX 9.0c, 2009/01)
- Metacritics: 80 % (users: 81 %), Gamerankings: 80 %
-
Race Driver GRID (1.2, DirectX 9.0c, 2008/05)
- Metacritics: 87 % (users: 76 %), Gamerankings: 88 %
-
S.T.A.L.K.E.R.: Clear Sky (1.5.07, DirectX 10.1, 2008/09)
- Metacritics: 75 % (users: 77 %), Gamerankings: 73 %
-
The Elder Scrolls IV: Oblivion (1.2.046, DirectX 9.0c, 2006/03)
- Metacritics: 94 % (users: 75 %), Gamerankings: 93 %
-
Tom Clancy's H.A.W.X. (demo, DirectX 10.1, 2009/03)
- Metacritics: 73 % (users: 85 %), Gamerankings: 77 %
-
Trackmania Nations Forever (2.11.11, DirectX 9.0c, 2008/04)
- Metacritics: 84 % (users: 87 %), Gamerankings: 87 %
-
World in Conflict (1.008, DirectX 10, 2007/09)
- Metacritics: 89 % (users: 76 %), Gamerankings: 89 %
-
Zaklínač (The Witcher, 1.3, DirectX 9.0c, 2007/10)
- Metacritics: 81 % (users: 93 %), Gamerankings: 81 %
Grafické karty testujeme na 30" LCD panelu HP LP3065
Za poskytnutí procesoru Intel Core i7 920 děkujeme společnosti Czech Computer
Za poskytnutí testovacích pamětí DDR3 děkuji společnosti Kingston
Za poskytnutí základní desky GA-EX58-UD5 a zdroje Odin GT děkujeme společnosti Gigabyte
Za zaslání Blu-ray mechaniky děkuji společnosti Lite-On IT
Za poskytnutí teplovodivé pasty Noctua NT-H1 děkujeme společnosti RASCOM Computerdistribution
Za poskytnutí chladiče Scythe Mugen 2 děkujeme společnosti Scythe
Assassin's Creed (DX10.1)
Assassin's Creed
Pro měření použijte FRAPS, do volby automatického vypnutí po nějakém čase zadejte 72 sekund. Ve hře nastavte všechny detaily na maximální hodnoty, vypněte vertikální synchronizaci. Anti-aliasing se nastavuje také ve hře (vzorkování) a hodnota 3/3 by měla odpovídat 4× MSAA. Ten si lze ale dopřát jen do rozlišení 1680 × 1050 px včetně.
Po nastavení musíte mít hru uloženu na začátku prvního města (Masyaf), dole u studny (můžete využít i můj profil právě s takovou uloženou pozicí). Poté od studny vyběhněte ulicí nahoru (snažte se vyhýbat srážkám s kolemjdoucími, malé škobrtnutí ale nevadí. Používejte běh (pravé tlačítko myši), ale ne sprint (mezerník)) až k sekvenci ukazující pevnost. Po jejím skončení se otočte a vraťte se k domu, na který vylezete po žebříku. Dojděte až na jeho roh tak, abyste viděli z města pod vámi co nejvíce. Takto setrvejte několik vteřin a logování FRAPS se samo vypne. I při seběvětší snaze o co nejpodobnější opakování je v měření jistá malá dávka nepřesnosti (při naučení se průchodu se lze vejít do chyby 2 %).
U Assassin's Creeda mám nainstalovány dvě různé verze, jednu bez patche (1.01, retail) a druhou s patchem 1.02. Karty ATi Radeon s podporou DirectX 10.1 podávají v neošetřené verzi podstatně vyšší výkon, nějakých vad v obraze jsem si ani při pečlivějším studování screenshotů (alespoň v testované části) nevšiml. Zubaté stíny na Altairových šatech anebo lehce poblikávající spáry domů se objevují v obou verzích hry.
Call of Duty 5: World at War (DX9)
Call of Duty 5: World at War
Benchmark probíhá pomocí FRAPSu. Ten nastavte na 35 sekund. V možnostech hry aktivujte konzoli a do ní vepište devmap pel1b. Tím se dostanete na začátek mise Houževnatý (Relentless). Jakmile se tak stane, spusťte FRAPS. Po výskoku z vybuchlého tanku držte stále klávesu pro pohyb vpřed, FRAPS po chvíličce sám přestane logovat. Měření jsou opakovatelná s velmi malou odchylkou.
Crysis Warhead (DX10)
Crysis Warhead
K otestování výkon v Crysis: Warhead používám utilitu Framebuffer Crysis Warhead Benchmarking Tool 0.31. Abych měl měření kompatibilní s ověřovaným (ranked) benchmarkem, nechávám volbu na mapě ambush a implicitním čase (v tomto případě noc). Používám rozhraní DirectX 10 a nastavení Gamer (hráč, odpovídá detailům high v původním Crysis). Beru výsledek druhého měření, kdy už je hra načtena v paměti. V tomtom druhém průběhu rovněž zaznamenám podrobný FRAPSLOG. Měření jsou opakovatelná s minimální odchylkou.
Pozor, Crysis Warhead je jednou ze dvou her v metodice, kde je k měření použito režimu timedemo (= zobraz zcela všechny snímky, jak rychle to jde). Křivky karet v průběhovém grafu jsou proto od sebe vzájemně časově posunuty.
Enemy Territory: Quake Wars (OpenGL)
Enemy Territory: Quake Wars
Nové Enemy Territory představuje jedinou současnou moderní OpenGL hru pod Windows a zároveň jediný OpenGL test v testovací sadě. Quake Wars používají značně upravený Doom 3 engine, obohacený především o technologii MegaTexture (více o technologii v článku na Beyond3D). Pro testy používám maximální detaily, přes konzoli vypínám limit 30 i 60 fps, AA i AF zapínám ve hře.
Pro účely testování jsem si nahrál vlastní timedemo (recordtimenetdemo), které měří výkon v rozsáhlé lokaci se stromy (Valley). Timedemo (pro verzi 2.0) ke stažení: zde.
Enemy Territory: Quake Wars je tou druhou hrou, kde je k měření použito režimu timedemo (= zobraz zcela všechny snímky, jak rychle to jde). Křivky karet v průběhovém grafu jsou proto od sebe vzájemně časově posunuty.
Far Cry 2 (DX10.1)
Far Cry 2
Pro testy jsem používal zabudovaný benchmark, test Ranch Medium. Výsledky v grafech jsou z plynulejšího ze dvou opakování. Používám režim DirectX 10 a maximální detaily. Anti-aliasing zapínám přes nabídku hry.
Více v článku Far Cry 2: výkon grafických karet a vliv nastavení.
Mirror's Edge (DX9, PhysX)
Mirror's Edge
Přesné testování v Mirror's Edge je usnadněno naskriptovaným průchodem FlybyFlight (spustíte např. takto: "D:\Hry\Mirror's Edge\Binaries\MirrorsEdge.exe" -FlybyFlight), který prolétne pokaždé stejně části děje v epizodě Flight. Před spuštěním testu nastavte FRAPS na 62 vteřin, pak je důležité, abyste začali logovat hned po načtení lokace. V TdEngine.ini je třeba vypnout položku bSmoothFrameRate (nastavte na False), rozšířenou PhysX i maximální detaily zapínám přes menu hry.
Lokace v benchmarku je mimochodem také první místo hry, kde při skutečném hraní a zapnutou rozšířenou fyzikou bez akcelerace PhysX dojde k hrubým propadům výkonu. Více v článku Mirror's Edge, PhysX, GeForce, Radeony a procesory.
Race Driver GRID (DX9)
Race Driver GRID
FRAPS nastavte na vypnutí po 31 vteřinách. Po spuštění hry s nainstalovanou záplatou 1.2 zvolte v nabídce Race Day. Všechno mimo lokace (Location) a okruhu (Route) ponechte, tyto změňte na Milan a Castello Circuit B. V následující obrazovce vyberte start až za všemi dalšími auty (Grid Position: Back). Ihned po načtení trati spusťte FRAPS a startujte schválně pomalu: tak, abyste se drželi stále kousek za ostatními. To vydržte až do první prudší zatáčky, v níž akorát vyprší lhůta 31 vteřin a logování FRAPSu bude u konce.
Veškeré detaily jsou nastaveny na maximální hodnoty (Overall Detail: Ultra), anti-aliasing je zapínán rovněž přes menu hry. Změna rozlišení bohužel vyžaduje restart.
S.T.A.L.K.E.R.: Clear Sky (DX10.1)
S.T.A.L.K.E.R.: Clear Sky
U pokračování hry ze zóny kolem Černobylu jsem si opět vystačil hned s prvním táborem. Tentokrát jsem měření zjednodušil a udělal jej jednak přesnějším a rovněž srovnatelným se serverem PC Games Hardware. Jinými slovy využívám uloženou pozici PCGH (Users\Public\Documents\stalker-stcs\savedgames), která nejenže obsahuje výkondrásající paprsky vycházejícího slunce (god rays), ale stačí u ní po načtená spustit FRAPS, držet klávesu W pro pohyb vpřed a FRAPS vypnout před naražením do plotu. Měření je tak poměrně dost přesné.
Používám takřka plné detaily, náročný režim Enhanced full dynamic lighting (DX10), všechny legrace jako SSAO zapnuty. Jen anti-aliasing průhlednosti už nezapínám. Zapnutí či vypnutí anti-aliasingu vyžaduje restart hry, rozlišení nikoli.
Enhanced full dynamic lighting je režim, který umožní zapnout několik funkcí jako třeba Volumetric Smoke či Wet Surfaces (více v tomto srovnání). U karet ATI Radeon zapínám podporu DX10.1 (zlepšuje výkon, obraz nechávám při stejném nastavení), anti-aliasing průhlednosti budou snad stíhat grafické karty nějaké další generace. Jen pro zajímavost: DX10.1 režim tohoto A-tested objects vyhlazování je asi hezčí, ale náročnější.
The Elder Scrolls IV: Oblivion (DX9)
The Elder Scrolls IV: Oblivion
Čtvrtý díl série Elder Scrolls patří i přes svůj věk stále mezi nejnáročnější hry vůbec. Zvlášť, když stejně jako já v testu, vyberete lokace s množstvím vlnící se trávy, pohupujících se stromů a přesto rozhledem do vzdálené krajiny (The West Weald). Testuji s maximálními detaily a HDR. Soubor s nastavením (vše na maximum) a uložená testovací pozice ke stažení: zde.
Anti-aliasing i anizotropní filtrování vynuťte v ovladačích, v souboru Oblivion.ini se přesvědčte, že máte vypnutou vertikální synchronizaci (iPresentInterval=0). Po spuštění hry si nahrajte mou uloženou pozici číslo 260 a po načtení ihned začnětě logování FRAPSem a pohyb vpřed. Držte stále klávesu pro pohyb vpřed, dokud se neobjeví nápis upozorňující na to, že dále už nemůžete. Když nastavíte automatické vypnutí FRAPSu po 34 vteřinách, nic taky nezkazíte.
Tom Clancy's H.A.W.X. (DX10.1)
Tom Clancy's H.A.W.X. (DX10.1)
V arkádovém simulátoru bojových letadel lze využít nejen DirectX 10 pro efekty jako SSAO či volumetrické paprsky, ale také DirectX 10.1. Tuto revizi lze použít jak pro zrychlení hry na kartách, které ji podporují (což činím), nebo pro zlepšení obrazu nastavením SSAO na very high (což kvůli porovnatelnosti výsledků s kartami bez podpory DirectX 10.1 nečiním).
V nabídce s grafikými nastaveními je i tlačítko spouštějící zabudovaný benchmark, což v praxi znamená oblet města. Průběh loguji samozřejmě i FRAPSem, výstupem benchmarku jsou totiž jen dvě celočíselné hodnoty (průměrné a trošku nepochopitelně rovněž maximální fps).
Trackmania Nations Forever (DX9)
Trackmania Nations Forever
Trackmaniu hraje nejen ve světě, ale i v ČR obrovský počet hráčů, hra má navíc zabudovanou možnost benchmarku. Ten používám pro realistické a současně přesné měření i já. Detaily mám nastaveny na maximální hodnoty, anti-aliasing i anizotropní filtrování zapínám přímo přes možnosti hry a nastavením stínů na komplexní překračuji nejnáročnější předdefinovaný profil.
World in Conflict (DX10)
World in Conflict
Testuji s upraveným profilem very high details (zapnul jsem i water reflects clouds (voda odráží oblaka), anizotropní filtrování navýšil na 16×). Používám vestavěný benchmark.
Zaklínač (The Witcher) (DX9)
Zaklínač (The Witcher)
Opakovatelné testování v Záklínačovi není úplně jednoduché. Pro měření je samozřejmě používán nástroj FRAPS, detaily i anti-aliasing a anizotropní filtrování nastavuji v nabídce hry. Verze hry 1.3 a grafické karty s více jak 512 MB paměti by měly nabídnout i 4× AA přímo ve hře. U karet Nvidia GeForce funguje spolehlivě i vynucení anti-aliasingu v ovladačích, u karet ATI Radeon bohužel ne. Jakmile v ovladačích zvolíte 4× AA (MSAA, Box), vypne se anti-aliasing ve hře. A to bez ohledu na to, zda jej máte v menu hry zapnutý či vypnutý. Toto alespoň platí pro ovladače Catalyst 9.3.
Každopádně po načtení uložené pozice z Lesa na Blatech se otočte přímo na vstupní bránu do háje druidů, stiskněte klávesu pro pohyb vpřed a současně odstartujte logování FRAPSu (typicky F11). Projděte co nejpříměji, vyhněte se co nejmenším úkrokem ze směru. Logování vypněte v bažině, kde už opravdu dále směrem kupředu jít nejde. Měření jsou opakovatelná s překvapivě malou odchylkou, problémem je jen počasí. Jakmile načtete uloženou pozici a na Blatech prší, rovnou ji nahrajte znovu a doufejte ve vyčasený den (častější případ). Výkon karet je při deštivém počasí nižší. Při benchmarkování používám pohled přes rameno (F3).
Více v článku Zaklínač (The Witcher) vs. hardware: tweakguide.
3DMark Vantage
3DMark Vantage
Zájemci o v 3DMarku Vantage použité technologie jejich popis najdou v tomto whitepaperu (PDF). V grafech najdete pouze výsledky z GPU testu.
SLI GeForce GTX 260, 896 MB, Performance (GPU PhysX On):
GeForce GTX 260 (SP216), 896 MB, Performance:
SLI GeForce 8800 GT, 512 MB, Performance (GPU PhysX On):
GeForce 8800 GT, 512 MB, Performance (CPU PhysX):
GeForce 8800 GT, 512 MB, Performance (GPU PhysX):
Radeon HD 4890 1G, 1024 MB, Performance:
Radeon HD 4870 X2, 2× 1024 MB, Performance:
Gainward Radeon HD 4850 Golden Sample Goes Like Hell (GDDR5), 512 MB, Performance:
GeForce GTS 250, 512 MB, Performance (s GeForce PhysX On = vliv na CPU Score):
CrossFire Radeon HD 4770, 512 MB, Performance:
Radeon HD 4770, 512 MB, Performance:
Radeon HD 4670, 512 MB, Performance:
Radeon HD 4830, 512 MB, Performance:
GeForce GTX 275, 896 MB, Performance:
Radeon HD 4890, 1 GB, Performance:
Radeon HD 4870, 1 GB, Performance:
GeForce GTX 285, 1 GB, Performance:
GeForce GTS 250, 1 GB, Performance (s PhysX – ovlivňuje CPU score i celkové skóre):
Radeon HD 4850, 1 GB, Performance:
GeForce 9800 GTX+, 512 MB, Performance:
Radeon HD 4850, 512 MB, Performance:
Implicitním nastavením a také jediným, které si můžete v neplacené verzi 3DMarku Vantage zkusit, je Performance. To zvolí rozlišení 1280 × 1024 px, nastavení shaderů „performance“ a post-processsing 1:2. Po registraci získáte přístup také k profilům Entry, High a Extreme.