Eyefinity a Radeony HD 7970
Nové Radeony HD 7970 s prvními čipy AMD z 28nm generace už jsme si představili v rozsáhlé recenzi. A otestovali jsme i CrossFire poskládané ze dvou HD 7970.
Jednou z technologií, jejíž propagaci se AMD usilovně věnuje, protože konkurence něco podobného nenabízí, je Eyefinity – možnost připojení více než dvou (a v současnosti až šesti) monitorů k jediné grafické kartě. Že i ona má přes své výhody i nějaké (a dost nečekané) mouchy, už je vám asi po odhalení potíží s vertikální synchronizací u všech monitorů jasné. I přes další nevýhody, jakými jsou šílený poměr stran 48:9 nebo horší podpora především ve starších hrách, je ale s ohledem na přívětivé ceny monitorů s plným HD rozlišením pro řadu lidí Eyefinity zajímavé.
„Děkovat“ za to můžeme především výrobcům monitorů, kteří nějak zaspali dobu a až na pár modelů nepříliš levných 27" a 30" displejů s rozlišením 2560×1600 a 2560×1440 bodů nenabízejí náročnějším uživatelům nic, co by oproti běžným (a dnes už i hodně dost levným) full HD LCD nabízelo větší uživatelský komfort a zážitek.
Z tohoto důvodu vás nechceme ochudit ani o výsledky nových karet v extrémním rozlišení 3× 1920 × 1080 bodů. A protože jsem při testu CrossFire dvou HD 7970 podezíral procesor z toho, že je i výkonný šestijádrový Core i7-980X přetaktovaný na 3,8 GHz pro výkonné novinky AMD i v rozlišení 2560 × 1600 bodů (4 mpix) brzdou, která brání dvěma kartám v rozletu, přidáme k měření jedné karty rovnou i výsledky dvou karet v rozlišení 5760 × 1080 bodů (6,1 mpix), kde by měl být vliv nedostatečného méně patrný.
K testování posloužil produkční Radeon HD 7970 od společnosti Sapphire, které tímto děkujeme za zapůjčení karty do testu. V CrossFire jej potom doplnil referenční Radeon HD 7970 přímo od AMD.
Zase ten microstuttering?
Při měření Crysis 2 se dvěma HD 7970 v CrossFire plynulost vykreslování zdaleka neodpovídala průměrné snímkové frekvenci. I když se průměr podle hodnoty udávané FRAPSem pohyboval kolem 35 fps, subjektivní dojem z plynulosti hry tomu ani zdaleka neodpovídal. Asi tušíte, že tím mířím ke strašákovi multiGPU označovanému jako microstuttering, tedy k drobnému zadrhávání obrazu.
Pokud jste žili v domnění, že jste se něčím podobným mohli trápit v době dnes už historických Radeonů HD 3870 a 4870 X2 a v současnosti už jde o dávno vyřešenou záležitost, rychle vás vyvedu z omylu.
K microstutteringu dochází, pokud obraz renderuje více grafických čipů v současnosti nejpoužívanější metodou AFR (alternate frame rendering). Při ní grafická se grafická jádra střídají při renderování po sobě jdoucích snímků a každý čip vykresluje vždy celý snímek. Zjednodušeně řečeno – pokud na renderingu pracují „současně“ dva čipy, jeden vykresluje sudé a druhý liché snímky.
Problém nastává, když se rozjede vzájemná synchronizace čipů. Traduje se, že k tomu dochází proto, že každý snímek je jinak náročný a jeho rendering trvá různě dlouho. Z toho, co uvidíte v grafech dále, je ale zřejmé, že to jen stěží může být hlavní příčinou vzniku microstutteringu. Problém bude spíše se synchronizací renderingu a sdílení prostředků nebo při střídání jejich vykreslování; je prakticky nemožné, aby v sérii po sobě jdoucích snímků lišících se jen nepatrnou změnou scény trvalo vykreslování každého druhého snímku pětkrát déle než u předchozího.
Proč to v testech nebývá?
Nejhorší na tom všem je, že je microstuttering daleko pod rozlišovací schopností běžně používaných metodik pro testování grafických karet (a na to evidentně výrobci multiGPU řešení sází). Kvůli náročnosti měření a vyhodnocování výsledků prakticky neexistují testy grafických karet, ve kterých by se porovnávalo něco jiného než hrubý výkon získaný z průměrné snímkové frekvence naměřené během delšího časového úseku.
Řada lidí si ještě uvědomuje, že jediná hodnota v podobě průměrné snímkové frekvence nevypovídá o výkonu grafických karet v kritických situacích a zajímá se i o průběhy snímkových frekvencí. Jenže ani grafy s průběhy snímkové frekvence nemanbízí dostatečné rozlišení na to, aby se v nich microstuttering nějak odrazil. K tomu, abyste microstuttering změřili, musíte jít na úroveň samotných snímků. Stačí na to i FRAPS, který dokáže do logu zaznamenat časy, ve kterém se vykreslují jednotlivé snímky.
Výsledkem jediného měření o délce několika desítek sekund může být soubor s řádově tisíci až desetitisíci údajů – pro každý vykreslený snímek jeden údaj o čase. A když k údajům z takového souboru přidáte pár vzorečků, ze kterých spočítáte čas potřebný pro vykreslení jednotlivých snímků, převedete je na aktuální snímkovou frekvenci, slepíte jen pár (doslova) takových měření do jediného souboru a přidáte pár grafů, dostanete „sešit“, který dokáže spolehlivě sestřelit 32bitový Excel a i 64bitovému bude dělat přepočítávání a vykreslování grafů nemalé problémy.
Pro začátek si půjčím krátký pětisekundový úsek měření dvou HD 7970 v CrossFire (5.–10. sekunda) z Metra 2033. Upozorňuji, že se od grafů, které se v souvislosti s microstutteringem objevují, liší v jedné podstatné věci. Protože FRAPS při měření jednotlivých snímků ukládá do logu čas vykreslení snímků v milisekundách (soubor, který má v názvu frametimes), v grafech se obvykle uvádí právě časy potřebné pro vykreslení snímků v milisekundách. Jen málokdo si ale dokáže rychle představit, co znamená, když vykreslení sudého snímku trvá 13 a lichého 32 ms. Proto jsem zaznamenané hodnoty přepočítal do pro většinu lidí přirozenějších snímků za sekundu – fps.
Na vodorovné ose grafu je čas v milisekundách, na svislé je hodnota snímkové frekvence. Modrá čára je průběh snímkové frekvence s rozlišením na úrovni jednotlivých snímků. Červená čára pak odpovídá hodnotám, které můžete vídat v běžných grafech s průběhem snímkové frekvence. U ní už jde o průměrnou snímkovou frekvenci za celou sekundu.
Před sedmou sekundou (7000 ms) je velmi dobře vidět, kde je ten obrovský průšvih – v rychlém sledu za sebou se střídá snímková frekvence kolem 20 a 100–150 fps. V praxi to znamená, že každý druhý snímek zůstává na obrazovce stejně dlouho jako při renderování frekvencí 20 fps. Další snímek se naopak mihne jen na zlomek času toho předchozího. Ale pokud obě hodnoty zprůměrujeme, dostaneme docela pěkný výsledek.
Když to shrneme, v čase 7 000 ms nám z měření vypadne průměrná snímková frekvence 34 fps, kterou budou už jen ti náročnější hráči považovat za nedostatečnou nebo neplynulou. Ve skutečnosti se ale ve stejné době jen v rychlém sledu střídá 20 fps se 100–150 fps. Výsledný dojem pak má velmi blízko právě k té nižší hodnotě, i přes průměrných 34 fps vám to v daném okamžiku bude připadat jako nějakých 20–22 fps, protože se na každý druhý snímek budete dívat stejně dlouho jako při renderování konstantní rychlostí 20 fps.
Stejné měření tu mám ještě ve větší a kondenzované podobě. V následujícím grafu je delší padesátisekundový úsek. Červená čára je opět průběh snímkové frekvence dvou HD 7970 v CrossFire s rozlišením na úrovni sekund. Modrá linka odpovídá snímkové frekvenci při vykreslování konkrétního snímku. A zelená čára vám pohromadě s tou modrou možná vyrazí dech – jde o průměrnou snímkovou frekvenci dosaženou s jednou kartou.
Přestože jsou průměrné hodnoty u červené čáry prakticky dvakrát vyšší (z čehož „vychází“, že škálování výkonu je u dvou karet téměř dokonalé a výsledný výkon je dvojnásobkem jedné karty), každý druhý snímek se vykresluje jen o několik fps rychleji než u jedné karty. Ve výsledku jsou minimální hodnoty místy jen kousíček nad úrovní jedné karty. Jen ve šťastných (a velmi krátkých chvilkách) se obě karty nějak domluví a při vykreslování se střídají rychlostí blízkou kýženému průměru.
Nesmysl, mám dvě grafiky a žádný problém…
Že máte HD 6990 nebo dvě HD 6950, které jsou pomalejší než HD 7970, a přesto něco podobného nevidíte? Vraťte se ke grafu a koukněte se pořádně na rozlišení.
U většiny současných her něco podobného asi nezpozorujete hlavně kvůli tomu, že díky nenáročnosti na běžném monitoru s plným HD rozlišením létají na multiGPU řešeních na takových snímkových frekvencích, že to displej stejně nestíhá zobrazit. Problém s microstutteringem, který nejvíc pálil v dobách 3870 a 4870 X2, už by díky tomu byl pomalu zapomenutý. Renesance se ale dočkal s novými tituly a enginy pro DX11 a velkým tahákem AMD – Eyefinity. Pokud se podíváte po diskuzích, kdo si na něj v současnosti stěžuje nejčastěji, jsou to právě majitelé tří a více monitorů, tedy ti, kteří mají k nákupu multiGPU nejpádnější důvod.
To neznáte fintu s vsyncem?
Vertikální synchronizaci, neboli vsync, jsem se v souvislosti s Eyefinity věnoval před chviličkou v samostatném článku Odhalení: Eyefinity má problémy s Vsync (test).
Jak to souvisí s microstutteringem? Někdo si kdysi uvědomil, že pokud se zapne vsync (vertikální synchronizace), karty či jádra jednoduše s vykreslením dalšího snímku počkají, než dostanou svolení od monitoru (a tuto funkci zdědily i LCD, u kterých už se dávno paprskem elektronů nevykresluje).
Pokud dojde k podobnému extrému a v krátkém sledu se střídá frekvence 120 a 20 fps, před vykreslením „pomalejšího“ snímku, který by jinak zůstal na displeji po většinu času se karta se pomocí vsync domluví s monitorem na tom, že vykreslování dalšího snímku odloží až na plánované překreslení obrazovky. V případě LCD bývá běžná obnovovací frekvence 60 Hz. Snímek nebo jeho část, co by se jinak na obrazovce při 120 fps objevila jen na 8,3 ms (pokud vůbec), na ní při zapnutém vsync zůstane až do začátku vykreslování celého dalšího snímku, tedy po dobu 16,6 ms. Následující „pomalejší“ snímek pak na displeji setrvá o to kratší dobu a sudé a liché snímky se budou střídat rovnoměrněji. Výsledkem je plynulejší zobrazování a omezení (a při dostatečném výkonu karty i úplná eliminace) microstutteringu.
Vše zmíněné vykrystalizovalo do podoby jednoduché (a nesprávné) poučky, že se se zapnutím vertikální synchronizace microstuttering zmizí a nedochází k němu. Je to nesmysl, tak to funguje pouze, pokud karta dokáže monitor zásobovat novými snímky dostatečně rychle. Jestliže karta nezvládne dokončit výpočet nového snímku předtím, než monitor spustí další překreslování obrazu, obraz se opět „zadrhne“ minimálně o několik milisekund déle a překreslí se až při dalších průchodech.
Microstuttering je nejpalčivější u hodnot kolem 30 fps. Při pravidelném rozložení vykreslování snímků už hodnoty kolem 30 fps považuje spousta lidí za plynulé. V případě multiGPU řešení využívajících AFR je ale subjektivní dojem z plynulosti při 30 fps podstatně horší (většině lidí to připomíná hodnoty 20–25 fps dosahované na jedné kartě) a z grafu výše je jasné, proč tomu tak může být.
Vsync a měření výkonu
Při zapnuté vertikální synchronizaci se karta s monitorem domlouvá nejen na tom, kdy se bude vykreslovat, ale i na tom, aby grafika nerenderovala zbytečně snímky, které by monitor stejně nemohl vykreslit. Výsledkem je nižší zatížení karty a nížší spotřeba. Protože by ale s takovou byl výkon ve hrách omezený jen tím, co monitor dokáže vykreslovat (v případě běžných LCD je to 60 Hz), při srovnávání výkonu grafických karet by to bylo maximálně 60 fps. Aby tento limit nezkresloval výsledky a nebránil grafikám v rozletu, měří se výkon bez vertikální synchronizace.
Kvůli tomu mohou mít multiGPU řešení odlišné podmínky než v praxi. Právě kvůli omezení microstutteringu a rovnoměrnější kadenci snímků mohou majitelé multiGPU při dostatečném výkonu zapínat vertikální synchronizaci a dopracovat se k dolišným výsledkům.
Testovací sestava
Testovací konfigurace
Podrobný popis testovací sestavy najdete v článku Ze zákulisí: nové sestavy pro měření grafik a hlučnosti. GeForce GTX 580 jsem testoval na teď již předposlední betaverzi ovladačů 290.36.
Radeony jsou testované na posledním balíku ovladačů dostupné z FTP společnosti AMD datované na 5. ledna 2012 (grafický ovladač 8.921.2.0) a Catalyst Application Profiles 11.12 CAP 2 se stejným datem vydání.
Základní deska Gigabyte EX58-UD5 je osazená „extrémním“ šestijádrovým Core i7-980X. Procesor je přetaktovaný na 3,8 GHz při napětí zvýšeném na 1,344 V (podle CPU-Z).
V BIOSu jsou vypnuté úsporné technologie. Důvod je opět jednoduchý – co nejvíce omezit vliv procesoru při měření spotřeby grafické karty. Kvůli snížení chyby při měření, ke kterým by jinak docházelo kvůli automatickým a nevyzpytatelným změnám taktovací frekvence, je vypnutý Turbo Boost.
Paměti DDR3-1600 běží na 1360 MHz při časování 8-8-8-22-1T a 1,64 V.
Procesor chladí výkonný Coolink Corator DS, který můžete znát z testu zveřejněného na ExtraHardware.
„Levný“ Centurion od Cooler Master se k podobné sestavě na pohled ani trochu nehodí, ale jde o skříň s typickou (a stále ještě nejčastěji používanou) koncepcí a konfigurací chlazení. V bočnici jsem zalepil otvor v místě chladiče procesoru – při použitém chladiči procesoru a daném uspořádání systémového chlazení nadělal víc škody než užitku.
Vepředu je 1000otáčkový Cooler Master dodávaný se skříní. Zadní systémový ventilátor Nanoxia FX12 (možná si jej ještě pamatujete z naší recenze) může v případě potřeby běžet až na 2000 ot./min, pomocí panelu je zregulovaný na 1500 ot./min, při kterých je aerodynamický hluk ještě únosný.
O napájení se stará 920W Enermax Revolution 85+. Má vysokou účinnost, nabízí vysoký výkon a umožňuje i bezproblémový provoz řešení postavených na 3-way SLI či CrossFireX ze tří karet. Při časté manipulaci se náramně hodí odpojitelná kabeláž, která ve skříni zbytečně nepřekáží. K samotnému průvanu ve skříni zase tolik nepřispívá, ventilátor obvykle běží v rozmezí 800-900 ot./min.
Pevný disk VelociRaptor VR150 (WD3000GLFS) s kapacitou 300 GB používáme především kvůli rychlejšímu načítání her.
Procesor |
||
Intel Core i7-980X |
||
základní parametry |
||
počet jader / vláken | 6 / 12 | |
taktovací frekvence | 3,33 GHz | |
násobič | 25× | |
TurboBoost | až 3,6 GHz, násobič 1/1/1/1/2/2 | |
cache | 12 MB | |
použité nastavení |
||
taktovací frekvence | 3,8 GHz (28 × 136 MHz), 1,344 V, vypnutý HyperThreading, TurboBoost a C1E/EIST | |
recenze |
||
Šestijádrový Intel Core i7-980X (Gulftown) v testu | ||
Za zapůjčení procesoru děkujeme společnosti Intel |
Základní deska |
||
Gigabyte GA-EX58-UD5 |
||
základní parametry |
||
patice | LGA 1366 | |
čipová sada | Intel X58, ICH 10R | |
paměťové sloty | 6× DDR3, max. 24 GB | |
PCIe sloty, PCI sloty | 3× PCIe ×16 (16+16+1/16+8+8), 1× PCIe x4, 1× PCIe ×1, 2× PCI | |
podrobné specifikace | viz specsheet | |
recenze |
||
Gigabyte EX58-UD5: výkon s Ultra Durable 3 | ||
Za zapůjčení základní desky děkujeme společnosti Gigabyte | ||
Paměti |
||
Kingston KHX1600C7D3K3/6GX (3× 2 GB) |
||
základní parametry |
||
typ | DDR3 | |
taktovací frekvence | 1600 MHz | |
časování | 7-8-7-20 | |
napájecí napětí | 1,65 V | |
udávaná spotřeba | 1,8 W na modul | |
podrobné specifikace | viz specsheet | |
použité nastavení |
||
takt/časování | 1360 MHz, 8-8-8-22-1T, 1,64 V | |
Za zapůjčení pamětí děkujeme společnosti Kingston |
Pevný disk |
||
Western Digital VelociRaptor VR150 (WD3000GLFS) |
||
základní parametry |
||
kapacita | 300 GB | |
otáčky | 10 000 ot./min | |
rozhraní | SATA 3 Gb/s | |
vyrovnávací paměť | 16 MB | |
průměrná přístupová doba (čtení/zápis) | 4,2 ms / 4,7 ms | |
podrobné specifikace | viz specsheet | |
Za zapůjčení pevného disku děkujeme společnosti Western Digital |
Optická mechanika |
||
Lite-On DH4O1S |
||
základní parametry |
||
typ | BD-ROM | |
podporované formáty | [BD] BD-R, BD-RE , BD- ROM , BD-R DL , BD-RE DL , BD- ROM-DL [DVD] DVD Video, DVD-5, DVD-9, DVD-10, DVD-18, DVD+RW 4.7GB, DVD+R 4.7GB, DVD-RW 4.7GB (closed session), DVD-R 4.7GB, DVD+R9 [CD] CD-DA, RAW, CD-ROM XA (m1,m2,m2f1/m2f2), CD-R, CD-RW, CD-PLUS, CD-I |
|
rychlost čtení | BD-R/RE/ROM/SL/DL : 4× CAV DVD +R/-R SL : 12× DVD +R/-R DL : 8× DVD +RW/-RW SL : 8× DVD-9 : 8× CDR/CDRW : 32× |
|
podrobné specifikace | viz specsheet | |
Za zapůjčení optické mechaniky děkujeme společnosti LiteOn |
Zdroj |
||
Enermax Revolution 85+ ERV920EWT-00, 920 W |
||
základní parametry |
||
celkový výkon | 920 W | |
špičkový výkon | 1010 W | |
podrobné specifikace | viz specsheet | |
Za zapůjčení zdroje děkujeme společnosti Enermax |
Skříň |
||
Cooler Master Centurion 534 |
||
základní parametry |
||
formát | miditower | |
standard | ATX |
Chladič |
||
Coolink Corator DS |
||
základní parametry |
||
podporované patice | Intel LGA 775/1156/1366, AMD AM2/AM2+/AM3 | |
rozměry | 155 × 140 × 121 mm | |
hmotnost pasivu | 1040 g | |
materiál | měděná základna, hliníková žebra | |
ventilátor | 120 × 120 × 25 mm, 800–1700 ot./min, PWM | |
podrobné specifikace | viz specsheet | |
recenze |
||
Test chladičů (finále): Noctua, Thermalright, Zalman… | ||
Za zapůjčení chladiče děkujeme společnosti Rascom |
Operační systém, nastavení a ovladače
- Microsoft Windows 7 Ultimate (64bitová verze)
- vypnuta automatické defragmentace, aktualizace i swap file na
všech jednotkách - DirectX redist August 2010
- Intel INF
9.1.1.1
Grafické karty testujeme na 30" LCD panelu HP LP3065
Za
poskytnutí hry Battlefield Bad Company 2 děkujeme
společnosti Electronic Arts Czech Republic.
Za
poskytnutí hry Aliens vs. Predator děkujeme společnosti CD Projekt.
Za
poskytnutí hry Anno 1404 děkujeme společnosti Playman.
Aliens vs. Predator (DX11), Anno 1404 (DX10)
Aliens vs. Predator
Aliens vs. Preadator testujeme samostatným benchmarkem, který je na Internetu k dispozici ke stažení zdarma. Běží pouze v režimu DirectX 11 a je o poznání náročnější než původní test ze hry, který byl v metodice dříve.
Pro snadnější testování existuje utilita AvP benchmark tool, tu stačí nastavit takto a spustit test:
Anno 1404
U této překrásně vypadající strategie (schválně zkuste kliknout na náhledový obrázek nad tímto odstavcem anebo tento přímo z testovací sekvence) jsem se nechal podobně jako u Call of Duty World at War inspirovat metodikou PC Games Hardware a tu tedy máme plně srovnatelnou. Postup je takovýto: Stáhněte si uloženou pozici PCGH, uložte ji do C:\Users\xyz\Documents\Anno 1404\Savegames. Nastavte všechny grafické detaily ve hře na maximum, vypněte vertikální synchronizaci a MSAA i anizotropní filtrování aktivujte také skrze hru.
Po načtení uložené pozice pomocí kurzorových kláves několikrát přelétněte přes ostrov a pak pozici znovu nahrajte. Zafunguje to jako cache proti vlivu pevného disku. FRAPS nastavte na 20 sekund a měřte vždy od doby, kdy začne v pravém horním rohu mluvit Zahir.
Za poskytnutí hry Anno 1404 děkujeme společnosti Playman.
Za
poskytnutí hry Anno 1404 děkujeme společnosti Playman.
Battlefield Bad Company 2 (DX11), Call of Duty: Black Ops
Battlefield Bad Company 2
Hned v úvodní misi se po probití zákopy dostanete po louku. Zde se po střetu s Japonci hra uloží. Nastavím FRAPS na 45 sekund a z tohoto checkpointu jdu kolem hořícího zera a dále pralesem až k můstku u vodopádu. Karty jsou otestovány v režimu DirectX 10 i novějším DirectX 11. Ten u DX11 GPU vynutíte v souboru C:\Users\xyz\Documents\BFBC2\settings.ini. Nastavení společně s uloženou pozicí si můžete stáhnout zde.
Za poskytnutí hry Battlefield Bad Company 2 děkujeme společnosti Electronic Arts Czech Republic.
Call of Duty: Black Ops
U Call of Duty: Black Ops jsem si ke správnému poměru stran musel pomoci utilitkou Widescreen Fixer. Pak už byl výsledek velmi dobrý.
Zatím poslední díl populární série je méně náročný než jeho starší předchůdce Call of Duty: World at War. Testuji pomocí Fraps prvních devadesát sekund z úvodní animace k misím U.S.D.D., která začíná cestou do Pentagonu a v S.O.G. odehrávající se ve Vietnamu.
Nastavená úroveň vyhlazování: i na průměrné moderní grafice, jakou je GeForce GTX 460, při vysoké úrovni vyhlazování se snímková frekvence jen výjimečně dostala pod šedesát snímků za sekundu.
Colin McRae: DiRT 2 (DX11, DX9), Crysis Warhead (DX10)
Colin McRae: DiRT 2
Pro testování DiRT 2 používám při testech karet velký dávkový soubor, který umožňuje otestovat bez nějakého zasahování čtyři různé tratě ve čtyřech nastaveních. Pro srovnatelnost výsledků s DirectX 10 a 10.1 kartami mám sadu konfiguračních XML s vynuceným DirectX 9, další sada XML zapíná DirectX 11 (na GPU, jež ho umí), teselaci i nejvyšší úroveň detailů postprocessingu.
V případě testů v rozlišení 5760 × 1080 už z časových důvodů testuji pouze jnáročnější nastavení v režimu DX11.
Měří se na čtyřech tratích: Maroko (méně náročná, ale výsledky srovnatelné s volně stažitelným demem), L.A. (noční, stadión dělá některým kartám problémy), Malajsie (na některých GPU nejnáročnější) a Londýn (ten je v plné hře jako základní benchmark). Veškeré použité XML a dávky pro testování najdete v tomto ZIPu.
Crysis Warhead
K otestování výkonu v Crysis: Warhead používám utilitu Framebuffer
Crysis Warhead Benchmarking Tool 0.31. Aby bylo měření kompatibilní s
ověřovaným (ranked) benchmarkem, nechávám volbu na mapě ambush a
implicitním čase (v tomto případě noc). Používám rozhraní DirectX 10 a
zkouším jak nastavení Gamer (hráč, odpovídá detailům high v původním
Crysis), tak Enthusiast (very high). Beru výsledek druhého měření, kdy
už je hra načtena v paměti. Měření jsou opakovatelná s minimální odchylkou.
Crysis 2 (DX11), Far Cry 2 (DX10.1), Just Cause 2 (DX10)
Crysis 2
Crysis 2 jsem testoval na úvodu k misi Alien Vessel a City Hall. Šlo o maximální nastavení v režimu DX11, testy probíhaly stejně jako ve srovnání výkonu grafických karet v Crysis 2 a DX 11.
Far Cry 2
Pro testy jsem používal zabudovaný benchmark, test Ranch Medium. Na rozdíl od hry s patchem ještě neumožňuje nastavit úhel pohledu, takže obraz je třikrát větší než ve fullHD a nahoře a dole výrazně ořezaný. Screenshoty by byly zavádějící, ve hře s patchem už to vypadá jinak.
Pro testy jsem používal zabudovaný benchmark, test Ranch Medium. Výsledky v grafech jsou z plynulejšího ze dvou opakování. Používám režim DirectX 10 a maximální detaily. Anti-aliasing zapínám přes nabídku hry.
Více v článku Far Cry 2: výkon grafických karet a vliv nastavení.
Just Cause 2
Just Cause 2 bylo jedním z příjemných překvapení první čtvrtiny roku 2010 (alespoň po grafické stránce) a autoři mysleli i na integrovaný benchmark. Ty jsou ve hře hned tři, všechny vypadají velmi dobře, konec Desert Sunrise a hlavně nejnáročnější Concrete Jungle pak přímo parádně. Výsledky měření jsou z náročnějšího Dark Tower a Concrete Jungle, méně náročný Desert Sunrise už vynechávám.
Je trochu škoda, že Bokeh filtr a GPU simulace vody (která pak vypadá opravdu fantasticky) je realizována pouze přes Nvidia CUDA a nikoli třeba DirectCompute. V tomto max. nastavení by se tedy mohly srovnávat jen GeForce.
Mafia II (DX9), Metro 2033 (DX11), Napoleon: Total War (DX9)
Mafia II
Do metodiky jsme zařadili i zejména u nás populární Mafii II. Testy se zapnutým vyhlazováním jsou oproti většině ostatních her trochu exotické. Ve hrách se totiž nejčastěji používá vyhlazování MSAA (obvykle 4×, náročnější uživatelé nastavují i 8×), zatímco vývojáři Mafie sáhli k méně efektivnímu 2× SSAA (supersampling).
Metro 2033
Z testovaných her největší zabiják grafických karet, který na trůnu
vystřídal Crysis a Stalkery: CS a CoP. V Game Options je položka Advanced PhysX vypnuta, na kartě Video je vybrána kvalita Very High, DX10 pro všechny karty a znovu navíc potom DX11 pro nejnovější GPU s jeho podporou, dále 4× MSAA a 16× AF. Používám uloženou hru takřka ze začátku hry (Chase), vozíkem jedete tunelem a než se vám ve snové vizi objeví příšera, logování FRAPSem ukončím (180 s). Benchmarkovací sekvence není nejtěžší možná, i tak ale současným kartám stačí a asi pár let ještě bude, výhodou je dobrá opakovatelnost.
Uloženou pozici před jízdou tunelem si můžete opět stáhnout, pro otestování používám uvedené nastavení. Kombinace MSAA, vysokého rozlišení a profilu very high u mnoha karet znemožňuje prakticky už pohyb v menu a přitom slevení z maximálních detailů hru vizuálně zřejmě až tolik nepokazí. Testuji pouze nižší rozlišení 1920 × 1200, vyšší rozlišení 2560×1600 už je na většině karet při stejném nastavení nehratelné.
Napoleon: Total War
V Napoleon:
Total War (demo, 1.0.0) používám pro testování bitvu u
Ligny. Fraps nastavuji na
62 sekund, jakmile získám kontrolu nad myší a klávesnicí, nastavím
pohled hned na zcela
nejnižší možný u země (náročná detailní animace vlnící se trávy či
obilí).
S.T.A.L.K.E.R.: Call of Pripyat (DX11), Unigine Heaven 2.5 (DX11)
S.T.A.L.K.E.R.: Call of Pripyat
Pro testování této moderními technologiemi nabité hry používám samostatný benchmark. V něm pak celkové nastavení Ultra, Enhan. full dynamic lighting (DX10 nebo DX11 podle toho, co GPU podporuje). Je-li DirectX10.1 podporován, je zatržen i v Advanced Options. DirectX 10 karty testuji pouze s 4× MSAA, DirectX 11 akcelerátory potom ještě navíc s MSAA for A-teste objects (anti-aliasing transparentních textur), SSAO Mode nastaveným na HDAO, kvalitou na Ultra (verze Compute Shader), zaplou teselací i CHS (Contact hardening shadows).
Průměr ze všech dílčích testů:
Unigine Heaven 2.5
V Unigine Heaven nastavuji DirectX 11, shaders na High, anti-aliasing na 4× a anizotropní filtrování 16×. Zkoušeno je nastavení teselace na normal a extreme.
Souhrnné hodnocení
Kdybyste si jenom proklepali výsledky průměrných snímkových frekvencí a řídili se jen podle nich, nabudete dojmu, že pro tři displeje s plným HD rozlišením dvě HD 7970 postačí bohatě na vše včetně nejnáročnějších her pro DX11. Bohužel tomu tak není – proč, to jsme si dost obšírně vysvětlili v úvodu.
U novějších her s náročnými efekty při post processingu se při nižších snímkových frekvencích navíc přidává výrazný inputlag (reakce hry na podnět ze strany hráče – pohyb myší nebo stisk klávesy). Pohromadě s inputlagem daným renderingem metodou AFR jsou reakce hry o poznání línější. Hry jako Metro 2033 nebo Crysis 2 se tak nehrají příjemně ani přesto, že by tomu podle zdánlivě vysokých průměrných 30–31 fps nikdy neřekli.
V tomto kontextu můžeme mít jen stěží radost z toho, že škálování při vysokém rozlišení je u nových Radeonů výraznější a často se blíží ideálnímu dvojnásobku. Potvrzuje se tak domněnka, že největší vinu na tom, že škálování výkonu v některých hrách nedosahuje vždy dvojnásobku, nese omezení ze strany výkonu procesoru.
Nemění to ale nic na tom, že v některých titulech (pozor, není jich moc) mají Radeony do škálování odpovídajícímu dvojnásobku výkonu jedné karty daleko i přesto, že limit není na straně procesoru (jinak slabší GeForce GTX 580 v nich škálují lépe a dokonce dosahují vyššího celkového výkonu).
Samozřejmě to může být vinou raných ovladačů, každopádně nelze paušálně říct, že by byl hrubý výkon (tedy bez zohlednění microstutteringu) dvou Radeonů dvojnásobný, přestože by to tak z některých recenzí, kde se testovalo pár titulů, mohlo vyznít.
Nedá mi to ještě nezmínit problematické Anno 1404, se kterým si v případě multiGPU konfigurací zkrátka nevím rady – CrossFire ze dvou HD 7970 při rozlišení 5760 × 1080 je prvním řešením, kde se mi podařilo naměřit výrazně kladné škálování výkonu. V ostatních případech a u slabších karet aktivní multiGPU hru naopak brzdí.
Jak to shrnout? V převážné většině titulů se dá říci, že si i se třemi HD 7970 vystačíte i s jedinou kartou a v těch náročnějších postačí povrtat se trochu v jejich nastavení. Zklamáním bylo naopak CrossFire ze dvou karet – v náročných hrách, kde by byl vyšší výkon kvůli nízkým snímkovým frekvencím zapotřebí nejvíc, zabíjí výsledný dojem microstuttering. Vyšší výkon CrossFire si tak budete moct užít jen tam, kde už není příliš zapotřebí – při vysokých snímkových frekvencích pohybujících se na úrovni toho, co dokážou monitory fyzicky zobrazit. Na druhou stranu jsou právě hodnoty přesahující 60 fps, se kterými dostanete z běžných 60Hz monitorů maximum, tím, co některé lidi zajímá.