Splinter Cell Blacklist: srovnání výkonu karet a plynulost hry (FCAT)

9. 9. 2013

Sdílet

 Autor: Redakce

Splinter Cell Blacklist: vyleštěný Unreal Engine

Splinter Cell Blacklist je posledním z titulů, které můžete získat zdarma pohromadě s novou kartou Nvidie. Proto asi nepřekvapí, že se Nvidia aktivně podílela i na jeho vývoji. Hra běží na silně modifikovaném Unreal Engine, který dostal označení LEAD Engine, ve kterém neschází podpora DirectX 11 a řady moderních efektů, které mají velký vliv na výkon.

Splinter Cell Blacklist

Především je to nastavení Ambient Occlusion (jde o efekt, při kterém se generují stíny v místech, kam se dostává méně světla a výrazně se tím zvyšuje plasticita a prostorovost snímku).

U něj můžete přepínat z velkého množství režimů. Kromě vypnutí je k dispozici ještě základní režim field AO, SSAO (screen space ambient occlusion) a HBAO (horizon based ambient occlusion) a dále rozšířené SSAO+ a HBAO+ (na obrázku).

 

Protože jsou výpočty AO náročné na výkon, počítají se obvykle s nižším rozlišením, kvůli čemuž se v některých situacích mohou objevit artefakty (blikání stínů). Částečně je lze eliminovat použitím dalších filtrů (rozostření nebo interpolace stínů z několika po sobě jdoucích snímků), ale ani ty nepodávají dokonalé výsledky.

Ve Splinter Cell jsou k dispozici dva další režimy, SSAO+ a HBAO+. SSAO+ by na rozdíl od SSAO mělo být počítané už v plném rozlišení (a na výkonu se to podepisuje opravdu výrazně). HBAO+ využivá odlišný systém vzorkování. Výsledkem má být vyšší kvalita obrazu a eliminace zmiňovaných artefaktů.

Na tomto místě nemohu příliš zabíhat do podrobností (jednak to není předmětem článku, jednak tomu sám zase tolik nerozumím a nemohu tomu věnovat tolik času, kolik by bylo zapotřebí). Pokud chcete konkrétnější informace, projděte si příslušný článek na GeForce.com, který je také rozcestníkem na další materiály a přednášky týkající se HBAO+ i dalších metod výpočtů AO. Najdete v něm i srovnání jednotlivých technik a interaktivní srovnání HBAO a HBAO+.

Splinter Cell Blacklist

Kromě nového HBAO+ je ve hře implementovaná i Phongova teselace (s ní jsme se už v některých hrách setkali). Cílem této techniky je vyhlazení ostrých vrcholů z polygonů, které jsou nejvíce vidět na obrysech objektů. Phongovo stínování vyhlazuje přechody mezi různě nasvícenými polygony tak, aby zamaskovalo ostré hrany mezi jednotlivými ploškami. Bohužel to nefunguje při okrajích objektů, na kterých jsou stále vidět vrcholy polygonů.

A právě špičky a zlomy na obrysech, se kterými si neporadí Phongovo stínování, by měla napravit teselace. Základy jsou vysvětlené v tomto čtyřstránkovém PDF).

Třetí technikou, na kterou Nvidia upozorňuje, je režim vyhlazování TXAA, který je k dispozici majitelům karet s architekturou Kepler a novějších. Jde o kvalitnější režim vyhlazování, který se od klasických metod vyhlazování liší tím, že využívá data z několika po sobě jdoucích snímků. Kvůli tomu se obraz při pohybu sice mírně rozostří (do jisté míry je tu podobnost s „filmovým“ motion blur). Mírná pohybová neostrost tolik nevadí, naopak se tím tím výrazně redukuje nepříjemné blikání a přeskakování pixelů na hranách při pohybu (často se pro tento jev používají terminy pixel crawling, temporal-aliasing, shimmering apod.), kterým nejvíc trpí jednodušší metody vyhlazování.

Za poskytnutí SSD HyperX 3K a pamětí děkujeme společnosti Kingston

 

Testovací sestava, metodika

Testovací sestava

Testoval jsem na sestavě, kterou používáme pro měření výkonu grafických karet. Jako testovací platforma posloužila základní deska Gigabyte X79-UD5 s BIOSem F10. Procesor je šestijádrový Core i7-3960X s TDP 130 W, který je přetaktovaný na 4,2 GHz při 1,36 V. Asistuje mu 16GB kit operačních paměti DDR3 od Kingstonu.

  • základní deska: Gigabyte X79-UD5
  • procesor: Core i7-3960X (deaktivovaný HTT, C1E, EIST), 4,2 GHz na 1,36 V
  • chladič CPU: Noctua NH-D14
  • paměti: 4× 4 GB Kingston DDR3 KHX2133C11D3K4/16GX
  • zdroj: Enermax Revolution 85 ERV920EWT-00, 920 W
  • pevný disk: Intel SSD 510 (250 GB)
  • skříň: Gelid DarkForce
  • operační systém: Windows 7 x64

Testovací sestava na grafické karty

Testovací sestava na grafické karty

Testovací sestava na grafické karty Testovací sestava na grafické karty Testovací sestava na grafické karty Testovací sestava na grafické karty Testovací sestava na grafické karty

Testovací metodika

Hra v duchu současných trendů ukládá postup automaticky v místě checkpointů (přičemž si pamatuje jen jediný a při většině příležitostí jej přepisuje). Kvůli tomu jsem pro testování musel vybrat lokaci hned z úvodu některé z misí. Jako nejnáročnější se ukázal úvod k misi Vězeňské zařízení, zátoka Guantanamo, Kuba. K testování jsem tedy využil úvodních 82 sekund. Průměry jsem měřil pomocí FRAPS, ve výsledcích najdete ale i průběhy snímkových frekvencí jednotlivých snímků měřené pomocí FCAT.

 

Použité grafické karty a ovladače.

Ve výsledcích najdete referenční GeForce GTX 760, GTX 770 a GTX 780, dále OC modely Gigabyte GeForce GTX 650 Ti 1 GB a GeForce GTX 560 Windforce 2X.

U Radeonů jsem měřil jeden z nejvýše taktovaných 2GB modelů HD 7850 OC od Gigabyte s chladičem Windforce 2X, dále referenční HD 7950 na referenčních taktech, referenční HD 7950 přetaktovanou na 1000/5000 MHz a konečně referenční HD 7970.

Testoval jsem na posledních dostupných ovladačích – 326.80 u GeForce a Catalyst 13.10beta u Radeonů.

Za poskytnutí SSD HyperX 3K a pamětí děkujeme společnosti Kingston

 

Co je FCAT

Platforma FCAT

Pro testování plynulosti snímkové frekvence využíváme testovací platformu FCAT, která umožňuje zachytávat stejný obraz, jaký jde do monitoru a jeho analýzou spočítat reálné časy jednotlivých snímků tak, jak jsou zobrazené na monitoru. Na základě toho lze v záznamu rozpoznat zadrhávání obrazu nebo microstuttering.

Celá metodika měření je podrobně vysvětlená v článku Microstuttering: FCAT vs FRAPS na jednočipové grafice a multi-GPU.

Pro záznam se používá profesionální zachytávací karta DataPath VisionDVI-DL, která je vybavená vstupním konektorem dual-link DVI a rozhraním PCI Express 4× a zvládá snímat rozlišení 2560×1440 při 60 Hz (dokonce by měla umět i 3840× 2160 při 30 fps). Na rozdíl od levné alternativy v podobě TV tunerů a zachytávacích karet se vstupem HDMI umí pořizovat záznam i v barevném formátu RGB při 24bitové barevné hloubce.

Karta je schopná generovat datový tok až 650 MB/s, jen při nahrávání z plného HD rozlišení je to kolem 240 MB/s. Kvůli následnému zpracování nesmí při záznamu docházet k výpadku snímků, taková nahrávka by se dala jen stěží korektně analyzovat. Znamená to, že je pro záznam zapotřebí nejen rychlé, ale i docela velké úložiště.

 

Na tomto místě musíme poděkovat společnosti Kingston, která nám pro tyto účely zapůjčila čtyři 240GB SSD HyperX 3K.

Nvidia FCAT intro

Čtyři SSD v RAID 0 jsou momentálně přiškrcené na integrovaném 3,0 Gb/s řadiči z platformy Z77 (pro SATA 6,0 Gb/s má čipset Intelu stejně jen dva kanály), jak se ale zdá, na to, aby sestava zvládala záznam bez výpadků, by i toto řešení mohlo stačit. Zásluhu na tom má i Core i5-3470 s architekturou Ivy Bridge, který už má jižní můstek připojený novou rychlejší generací sběrnice DMI2.

Nvidia FCAT intro

Jako základní deska posloužila Gigabyte GA-Z77X-UP4 TH, která je vybavená i rozhraním Thunderbolt. To, co je zastrčené ve slotu PCI Express ×16 a na pohled připomíná prehistorické grafické karty s minimalistickým pasivem, je ve skutečnosti zmiňovaná zachytávací karta. Grafika neschází, využívám tu integrovanou v procesoru Intel Core i5. 

Nvidia FCAT intro

 

Za poskytnutí SSD HyperX 3K a pamětí děkujeme společnosti Kingston

 

Vliv nastavení detailů na výkon

Jednotlivá nastavení jsem testoval v úvodní misi. Pro měření jsem téměř ve všech grafech použil maximální úroveň detailů s vyhlazováním MSAA 2× a detaily jsem snižoval jen u měřené položky, výjimkou je jen první graf, kde bylo místo MSAA použité vyhlazování FXAA.

Rozlišení textur má na výkon (alespoň u karty s 1 GB) pramalý vliv, výrazně ale snižuje kvalitu textur u blízkých objektů. Pokud možno nechte maximální nastavení.

Kvalita stínů je jedním z nastavení, u kterého má smysl detaily snižovat. Který z režimů vám bude vyhovovat, si ale vyzkoušejte sami. Se snižováním kvality se totiž mění nejen rozlišení, ale i úroveň rozostření hran stínu (a ne postupně, ale na přeskáčku), záleží spíš na tom, jak moc rozostřené okraje preferujete.

Volba paralaxní (zřejmě parallax occlusion mapping) přidává na povrchy objěktů stíny a napodobuje tak hru světla a stínu na nerovnostech (výrazně zvyšuje plasticitu objektů). I když zřejmě narazíte na scény, kde může mít na výkon významný vliv, při průchodu testovacím úsekem byly rozdíly minimální.

Teselace je jednou z položek, které výkon ovlvňují dramaticky. Pokud vám stále příliš nevadí nešvary modelů s nízkým počtem polygonů (zejména hroty na obrysu objektů na hranicích polygonů), můžete ji vypnout.

Nastavení Ambient Occlusion má na výkon ohromný vliv. Položky nejsou seřazené od nejméně náročné k nejnáročnější. Rozhodně bych doporučil před režimem SSAO+ upřednostnit HBAO+ (je podstatně méně náročný a snad i kvalitnější) a pokud možno nechat aktivní minimálně field AO (zcela bez AO obraz výrazně ztrácí na plasticitě).

Za poskytnutí SSD HyperX 3K a pamětí děkujeme společnosti Kingston

 

Vliv nastavení detailů na výkon II.

Tato položka mění úroveň anizotropního filtrování textur. Moderní karty by s tím neměly mít velké problémy, je to jedna z posledních položek, které má smysl snižovat (vliv na výkon má maly, ale dramaticky se mění kvalita textur zobrazených pod úhlem)

Metoda vyhlazování hran má vliv na výkon asi největší. Je zajímavé, že téměř shodné výsledky (co do výkonu) podávají režimy TXAA 4× a MSAA 4× a TXAA 2× a MSAA 2×. Režim TXAA bohužel funguje pouze na GeForce modelových řad 600 a vyšších.

O náročnosti kvalitního supersamplingu netřeba pochybovat, ale ani efektivnější metody MSAA 4×či TXAA 4× nejsou něčím, co by v náročných situacích zvládaly v plném HD rozlišení uspokojivě jiné než highendové karty.

V režimu DX9 nejsou dostupné některé efekty (např. HBAO či teselace). Výsledky porovnání režimu DX9 a DX11 vás možná překvapí, s nižší verzí hra běhá podstatně pomaleji (zatímco dříve jsme byli zvyklí na nárůst výkonu).

K tomuto výsledkus se dopracujete pochopitelně jen v případě, že u obou režimů použijete stejné nastavení detailů (tedy když i v režimu DX11 nastavíte úroveň detailů stejně jako v DX9).

Jinak řečeno v případě slabších karet s podporou DirectX 11 pravděpodobně nebude mít smysl přepínat na režim DX9, se stejným nastavením byste měli pod DX11 dosáhnout vyššího výkonu.

Za poskytnutí SSD HyperX 3K a pamětí děkujeme společnosti Kingston

 

1920 × 1080 bodů, FXAA + průběhy (FCAT)

První jsou výsledky naměřené s maximálními detaily, snížená byla jen kvalita vyhlazování na nenáročné FXAA.

Za poskytnutí SSD HyperX 3K a pamětí děkujeme společnosti Kingston

 

1920 × 1080 bodů, MSAA 4× + průběhy (FCAT)

Další měření probíhalo se stejným nastavením a podstatně náročnějším vyhlazováním MSAA. Zejména z grafů s průběhy je patrné, že toto nastavení už je vhodné jen pro výkonné karty.

Za poskytnutí SSD HyperX 3K a pamětí děkujeme společnosti Kingston

 

2560 × 1600 bodů, FXAA, 2560 × 1600 bodů, MSAA 4×

 

Rozlišení 2560 × 1600, resp. 2560 × 1440 bodů už bude zabijákem mainstreamových karet a karet s menší kapacitou paměti.

Za poskytnutí SSD HyperX 3K a pamětí děkujeme společnosti Kingston

 

Závěrečné shrnutí

Přestože je starý Unreal Engine, ze kterého engine hry vychází, v současnosti už synonymem nenáročnosti, přidané efekty dávají kartám pořádně zabrat. U většiny sestav s rozumným procesorem tak bude výkon hry brzdit především grafická karta (i přetaktovaná GTX 780 ve fullHD a s MSAA 2× během několikahodinového hraní prakticky neslevila ze 100% zatížení).

Počítejte s tím, že snímkové frekvence kolem 23–28 fps jsou sice ještě celkem plynulé, ale je při nich znát inputlag (obzvláště nepříjemné jsou při nízkých frekvencích prodlevy v menu hry).

ICTS24

Úroveň detailů lze naštěstí snížit dost výrazně na to, aby byla hra bez problémů hratelná s kartami nižší střední třídy či staršími kartami a přitom bude vypadat stále dobře.

Kvalitou grafiky se nemůže rovnat třeba poslednímu Crysis 3, kouzlo Blacklistu je ale jinde – většina děje se odehrává za tmy prosvětlené spoustou reflektorů a světel, důležitým prvkem je hra světla a stínů, ve kterých se dá ukrývat a v tomto ohledu engine funguje skvěle.

Za poskytnutí SSD HyperX 3K a pamětí děkujeme společnosti Kingston