FCAT a testy (ne)plynulosti: když se nehraje jen na průměry

14. 5. 2013

Sdílet

 Autor: Redakce

Tomb Raider: pořádný facelift pro osvědčený engine

S testováním Tomb Raideru jsme si dali na čas hned z několika důvodů. Obdobně jako u většiny nových her v poslední době se bohužel nedá říct, že by hra už při uvedení byla zrovna dokonale odladěná. Po vydání následovala smršt záplat opravujících chyby i vylepšení výkonu (to se týkalo zejména výkonu GeForce při aktivní technologii TressFX pro simulaci reálnějšího chování vlasů).

Poslední patch s optimalizací výkonu při vyšších detailech vyšel ještě v půli dubna. A patche ze strany vydavatele nebyly jediným důvodem. V AMD i Nvidii se ještě týdny po uvedení hry intenzivně optimalizovalo a objevovaly se (a stále objevují) ovladače, ve kterých se výkon karet dále zvedal i o desítky procent. Výsledky raných srovnání výkonu tedy odpovídaly realitě sotva pár dní.

Tomb Raider screenshots

Protože jde o populární a kladně hodnocený titul (uživatelské hodnocení na Metacritic má 8,5 bodů, což je na současné poměry výrazný nadstandard), který nevyužívá žádný z populárních enginů ale vlastní Crystal Engine, má pěknou grafiku a je hodně náročný na výkon grafických karet, je to ideální hra pro rozšíření metodiky testování grafických karet.

A konečně, něco málo času si vyžádaly pokusy a ladění testovací platformy FCAT. Tomb Raider je tak jedním z prvních titulů, u kterého se podíváme nejen na průměry, ale i na plynulost zobrazování snímků změřenou pomocí FCAT tak, jak je můžete vidět i vy na svém monitoru.

 

Podobně jako starší tituly z této série hru pohání Crystal Engine. Oproti předchozímu dílu Tomb Raider: Underworld, ale doznal řady vylepšení. Přibyla řada nových technologií a efektů využívajících DirectX 11.

Tomb Raider je součástí programu AMD Gaming Evolved. V jeho rámci pomáhali vývojáři AMD s implementací technologie TressFX, která má zásluhu na propracovanější simulaci vlasů hlavní hrdinky. Pro simulaci fyziky se využívá technologie DirectCompute. Na chování vlasů má vliv pohyb hlavy Lary, gravitace i vítr. V reálném čase se počítají i kolize vlasů s okolím, ať už jde o to, aby se prameny vlasů neprolínaly vzájemně nebo o to, aby neprocházely skrz tělo či oblečení. V tomto ohledu má ale jejich chování ještě rezervy, nejčastěji se stává, že dost nepřirozeně levitují kus nad rameny či zády, občas ale projdou i ušima nebo se zakousnou do krku.

" width="700" height="394" frameborder="0">

Problémy jsou i u konfigurací s multi-GPU, kde se při renderingu metodou AFR (alternate frame rendering) vlasy na sudých a lichých snímcích liší. Kvůli tomu potom blikají a tento problém neřeší ani poslední patche a poslední verze ovladačů.

Tomb Raider screenshots

DirectCompute se využívá i pro simulaci bokehu u technologie Depth of Field (hloubka ostrosti). Další z technologií HDAO (high definition ambient occlusion) se stará o realističtější stínování objektů, upravuje jas ploch na objektech podle toho, kolik by se na ně mělo dostávat světla (např. v místech, kde jsou objekty blízko u sebe, přidává stíny). Z dalších moderních efektů můžeme jmenovat tzv contact–hardening shadows. Jde o stíny s neostrými hranami, u nichž je intenzita rozostření závislá na vzdálenosti stínu od objektu (čím je dále, tím jsou hrany neostřejší). Hra využívá i teselaci např. pro přidání detailnějších nerovností v terénu.

Ještě se musíme zastavit u vyhlazování hran. U něj totiž bohužel není moc na výběr, k dispozici je režim bez vyhlazování, jednoduché FXAA (nenáročné, ale kromě vyhlazení hran bohužel vyhlazuje, tedy rozostřuje i textury) a režim SSAA 2× a 4×, který je sice velmi kvalitní, ale bohužel má i krvavé nároky (využívá se hrubé síly, obraz se de facto renderuje ve vyšším rozlišení a následně se zmenšuje). Už méně náročný režim SSAA 2× zvládají s maximálními detaily na uspokojivých snímkových frekvencích jen highendové grafické karty.

Systémové požadavky

Minimální:

  • OS: Windows XP Service Pack 3, Windows Vista,7,8 (32b/64b)
  • procesor: Dual core: AMD Athlon64 X2 2,1 GHz (4050+), Intel Core2 Duo 1,86 GHz (E6300)
  • paměť: 1 GB RAM (2 GB pro Vista)
  • grafická karta: s podporou DirectX 9, 512 MB Video RAM: AMD Radeon HD 2600 XT, Nvidia 8600
  • DirectX: 9.0c
  • pevný disk: 12 GB volného místa
  • ostatní požadavky: širokopásmové připojení

Doporučené:

  • OS: Windows Vista, Windows 7 or Windows 8
  • procesor: Quad core: AMD Phenom II X4 955, Intel Core i5-750
  • paměť: 4 GB RAM
  • grafická karta: s podporou DirectX 11, 1 GB Video RAM: AMD Radeon HD 5870, Nvidia GTX 480
  • DirectX: 11
  • pevný disk: 12 GB volného místa
  • ostatní požadavky: širokopásmové připojení

 

Za poskytnutí SSD HyperX 3K a pamětí děkujeme společnosti Kingston

Testovací sestava, metodika

Testovací sestava

Jako testovací platforma posloužila základní deska Gigabyte X79-UD5 s BIOSem F10. Procesor je šestijádrový Core i7-3960X s TDP 130 W, který je přetaktovaný na 4,2 GHz při 1,36 V. Asistuje mu 16GB kit operačních paměti DDR3 od Kingstonu.

  • základní deska: Gigabyte X79-UD5
  • procesor: Core i7-3960X (deaktivovaný HTT, C1E, EIST), 4,2 GHz na 1,36 V
  • chladič CPU: Noctua NH-D14
  • paměti: 4× 4 GB Kingston DDR3 KHX2133C11D3K4/16GX
  • zdroj: Enermax Revolution 85 ERV920EWT-00, 920 W
  • pevný disk: Intel SSD 510 (250 GB)
  • skříň: Gelid DarkForce
  • operační systém: Windows 7 x64

Testovací sestava na grafické karty

Testovací sestava na grafické karty

Testovací sestava na grafické karty Testovací sestava na grafické karty Testovací sestava na grafické karty Testovací sestava na grafické karty Testovací sestava na grafické karty

Platforma FCAT

Pro záznam se používá profesionální zachytávací karta DataPath VisionDVI-DL, která je vybavená vstupním konektorem dual-link DVI a rozhraním PCI Express 4× a zvládá snímat rozlišení 2560×1440 při 60 Hz (dokonce by měla umět i 3840× 2160 při 30 fps). Na rozdíl od levné alternativy v podobě TV tunerů a zachytávacích karet se vstupem HDMI umí pořizovat záznam i v barevném formátu RGB při 24bitové barevné hloubce.

Karta je schopná generovat datový tok až 650 MB/s, jen při nahrávání z plného HD rozlišení je to kolem 240 MB/s. Kvůli následnému zpracování nesmí při záznamu docházet k výpadku snímků, taková nahrávka by se dala jen stěží korektně analyzovat. Znamená to, že je pro záznam zapotřebí nejen rychlé, ale i docela velké úložiště.

 

Na tomto místě musíme poděkovat společnosti Kingston, která nám pro tyto účely zapůjčila čtyři 240GB SSD HyperX 3K.

Nvidia FCAT intro

Čtyři SSD v RAID 0 jsou momentálně přiškrcené na integrovaném 3,0 Gb/s řadiči z platformy Z77 (pro SATA 6,0 Gb/s má čipset Intelu stejně jen dva kanály), jak se ale zdá, na to, aby sestava zvládala záznam bez výpadků, by i toto řešení mohlo stačit. Zásluhu na tom má i Core i5-3470 s architekturou Ivy Bridge, který už má jižní můstek připojený novou rychlejší generací sběrnice DMI2.

Nvidia FCAT intro

Jako základní deska posloužila Gigabyte GA-Z77X-UP4 TH, která je vybavená i rozhraním Thunderbolt. To, co je zastrčené ve slotu PCI Express ×16 a na pohled připomíná prehistorické grafické karty s minimalistickým pasivem, je ve skutečnosti zmiňovaná zachytávací karta. Grafika neschází, využívám tu integrovanou v procesoru Intel Core i5. 

Nvidia FCAT intro

Tomb Raider má nainstalovaný poslední patch ve verzi 1.1.743.0. Grafické karty s GPU Nvidie jsou testované na betaverzi ovladačů 320.00, Radeony na Catalyst 13.5 beta 2.

Testované grafické karty

Ve srovnání najdete následující grafické karty, se kterými jste se už povětšinou mohli setkat v recenzích na Extrahardware.cz:

  • MSI GeForce GTX 550 Ti OC (přetaktovaný model)
  • Nvidia GeForce GTX 560 Ti (referenční karta)
  • Gigabyte GeForce GTX 650 Ti OC, 1024 MB (přetaktovaný model, jehož recenzi připravujeme)
  • Gigabyte GeForce GTX 660 Ti, 2048 MB (přetaktovaný model)
  • EVGA GeForce GTX 690 (referenční provedení)
  • Nvidia GeForce GTX 680, 20480 MB (referenční karta)
  • AMD Radeon HD 6990 (referenční karta)
  • Sapphire Radeon HD 7850, 1024 MB (1GB verze HD 7850 na referenčních taktech)
  • AMD Radeon HD 7970 (referenční karta)
Za poskytnutí SSD HyperX 3K a pamětí děkujeme společnosti Kingston

Vestavěný benchmark, bez simulace vlasů TressFX

V prvním měření se podíváme na výsledky karet s maximálními detaily (ještě o něco vyšší než ultímátní, oproti němu jsou nastavené kvalitnější stíny), ale s vypnutou simulací vlasů TressFX, měřenou na standardním benchmarku.

" width="700" height="394" frameborder="0">

 

 

A konečně ještě průběh snímkových frekvencí naměřený pomocí FCAT s dobou trvání zobrazení jednotlivých snímků v milisekundách (převrácená hodnota k fps). Vidíte, že až dvouprocesorový Radeon HD 6990, u kterého je znát výrazný microstuttering, k žádným výraznějším zádrhelům nedochází.

 

Za poskytnutí SSD HyperX 3K a pamětí děkujeme společnosti Kingston

Vestavěný benchmark, se simulací vlasů TressFX

Následující měření probíhalo se stejným nastavením jako na předchozí stránce, jen s tím rozdílem, že je zapnutá i simulace vlasů TressFX.

" width="700" height="394" frameborder="0">

 

Že šel výkon karet po zapnutí TressFX prudce dolů vás asi nepřekvapí, navíc se ale u některých karet objevily problémy s plynulostí. TressFX se ale v tomto ohledu chová bohužel dost nevypočitatelně. Evidentní problémy dělal TressFX 1GB GeForce GTX 550 Ti, u které v pravidelných asi třísekundových intervalech docházelo k viditelnému zadrhnutí obrazu (v ostrých špičkách na grafu zůstává vždy jeden snímek zobrazený ~160ms, což snímkové frekvenci asi 6 fps).

Výsledek GeForce GTX 560 Ti se v průběhovém grafu liší od pruhového. Jde totiž o jedno z mála měření, u kterých test s TressFX prošel korektně (aniž by došlo ke zlomu a výraznému propadu fps), zatímco při následném měření frapsem pro graf s průměry se přes veškerou snahu (včetně restartů PC) hra vzpouzela a výsledkem byla jen slideshow s obrovským input lagem..

 

Za poskytnutí SSD HyperX 3K a pamětí děkujeme společnosti Kingston

Scéna přímo ze hry, se simulací vlasů TressFX

Protože se benchmark soustředí spíše na hlavu Lary (tedy především vlasy), ale jinak není zdaleka tak náročný jako některé scény ve hře, změřil jsem i jednu z lokací, která karty potrápí o poznání více. Tu budeme zřejmě používat i nadále pro testování grafických karet.

" width="700" height="394" frameborder="0">

 

 

Za poskytnutí SSD HyperX 3K a pamětí děkujeme společnosti Kingston

Závěrečné shrnutí

Hned v prvním odstavci musím upozornit na to, že vestavěný benchmark není ani zdaleka nejnáročnější scénou, se kterou se ve hře setkáte. Náročností odpovídá možná mírnému nadprůměru. Pokud některá karta v benchmarku zvládá pěkných 30 fps, ještě to neznamená, že s ní půjde hra při stejném nastavení dobře hrát.

Na rozdíl od některých novějších her, u kterých se už dnes stává, že grafickou kartu brzdí výkon procesoru, dává Tomb Raider zabrat i výkonným kartám. Při zruba čtyřhodinovém hraní na GeForce GTX 680 v rozlišení 1920 × 1080 na maximálních detailech s TressFX a FXAA jsem nezaregistroval, že by někde došlo k výraznějšímu poklesu zatížení grafické karty, prakticky stále běžela na 100 % zátěže.

TressFX si zřejmě moc nerozumí s grafickými kartami s menší kapacitou paměti. Dost bledě na tom byly v tomto ohledu 1GB GeForce 600. Při několikerém opakování stejného testu se stejným nastavením jsem asi jen u dvou průběhů na ~20 fps, jinak frekvence padala na 2–7 snímků za sekundu.

I když se 1GB Radeon HD 7850 s TressFX vypořádal lépe než 1GB GeForce a v testovaných lokacích dokázala hra většinou běžet normálně, i s ním se mi stalo, že při jednom z měření s aktivním TressFX došlo k viditelnému trhání obrazu. Podobně jako u GTX 550 Ti se objevilo několik kratičkých zadrhnutí v pravidelných intervalech, až se obraz zarazil a doba, po kterou zůstal zaseknutý, se dala počítat už na desetiny sekundy (to je ta obrovská žlutá špička, při které byl jediný snímek zobrazený 0,3 s).

Když se hra vzpamatovala, průběh snímkové frekvence už zůstal hladký. Vedle obvyklých problémů multi-GPU s microstutteringem je to další doklad toho, že zdánlivě dobré fps nemusí ještě znamenat i dobré hraní a ani u jednoprocesorových karet nemusí výkony poměřované průměrnými fps vždy dostatečnou vypovídací hodnotu.

 

U pomalejších karet (a především u karet s menším množstvím paměti) bych určitě doporučil oželet stále ještě problematickou technologii TressFX (obdobně u multiGPU konfigurací, kde jsou zase problémy s blikáním vlasů). Bez ní a bez vyhlazování hran přes SSAA je hra v plném HD rozlišení dobře hratelná i na grafických kartách střední třídy.

Za poskytnutí grafické karty GeForce GTX 690 do srovnání děkujeme společnosti EVGA

EVGA GeForce GTX 690

Za poskytnutí hry do testu děkujeme společnosti Cenega

bitcoin_skoleni

Cenega.cz

 

Za poskytnutí SSD HyperX 3K a pamětí děkujeme společnosti Kingston