Radeon HD 5970 v recenzi: dva Cypressy v CrossFire

1. 12. 2009

Sdílet

 Autor: Redakce

Hemlock = 2× Cypress = 4,6 TFLOPS

Kódové označení Radeonu HD 5970 se na jednu stranu nevymyká z řady u HD 5000 zavedené (Cypress = cypřiš, tisovec; Juniper = jalovec), na stranu druhou by jeden nečekal jehličnan podprůměrného vzrůstu, ale přinejmenším sekvoj nebo Kanadě alespoň bližší smrk sitka. Jestli kódové označení společně s poměrně nízkými takty a rezervou pro přetaktování dává prostor pro spekulace o nějakém Radeonu HD "5990", to už nechám na vás.

HD 5970 je tady teď a dávno předtím, než se z papíru dostal do všední reality se vědělo, že tohle bude přinejmenším několik měsíců nejvýkonnější grafická karta. Hemlock totiž na svém PCB nese dva čipy Cypress s plnými 1600 stream procesory (jako HD 5870), jen v pracovních frekvencích zůstává zpátky na úrovni Radeonu HD 5850. O jádře Cypress se můžete více dozvědět v recenzi Radeonu HD 5870.

Kde jsou měření obvyklou metodikou, kde je spotřeba, hlučnost...

V tomto článku nenajdete běžné pruhové grafy ze 13 her, na které jste zvyklí. Nenajdete zde ani Radeon HD 5970 srovnán po stránce hlučnosti, teploty GPU či spotřeby s dalšími mnoha grafickými kartami. To vše, navíc se snad komfortními interaktivními grafy obsahuje včerejší článek: Žebříček 28 grafických karet (v interaktivních grafech)

Hemlock pro někoho možná překvapivě nenese šest výstupů na monitory jako proklamovaný ale nikým stále neviděný Radeon HD 5870 Eyefinity-6. Koneckonců pro jeden čip Cypress je tu jen 1024 MB paměti a skloubit Eyefinity a CrossFire by možná bylo příliš velké sousto i pro lepšící se driver team ATI/AMD. Spokojit se tak budete muset se dvěma DVI-I (skrze redukci lze vytvořit HDMI se zvukem) a jedním miniDisplayPort.

Radeon Radeon Radeon Radeon Radeon
HD 5970 HD 5870 HD 5850 HD 5770 HD 5750
Jádro Cypress Cypress Cypress Juniper Juniper
Výrobní proces 40 nm 40 nm 40 nm 40 nm 40 nm
Velikost jádra 330 mm² 330 mm² 330 mm² 181 mm2 181 mm²
Tranzistorů 2,15 mld. 2,15 mld. 2,15 mld. 1,04 mld. 1,04 mld.
Stream
procesorů
2× 1600 320 (1600) 288 (1440) 160 (800) 144 (720)
Takt jádra 725 MHz 850 MHz 725 MHz 850 MHz 700 MHz
Takt SP 725 MHz 850 MHz 725 MHz 850 MHz 700 MHz
ROP/RBE 2× 32 32 32 16 16
Texturovacích
jedn.
2× 80 80 72 40 36
Paměť 2× 1GB GDDR5 1 GB GDDR5 1 GB GDDR5 1 GB GDDR5 1 GB GDDR5
Takt pamětí 4000 MHz 4800 MHz 4000 MHz 2400 MHz 2300 MHz
Šířka sběrnice 256-bit 256-bit 256-bit 128-bit 128-bit
Propustnost
pamětí
128 GB/s 153,6 GB/s 128 GB/s 76,8 GB/s 73,6 GB/s
Fillrate
(pixely)
2× 23,2 Gpx/s 27,2 Gpx/s 23,2 Gpx/s 13,6 Gpx/s 11,2 Gpx/s
Fillrate
(textury)
2× 58 Gtx/s 68 Gtx/s 52,2 Gtx/s 34,3 Gtx/s 25,2 Gtx/s
FLOPS 4,64 TFLOPS 2,4 TFLOPS 2,09 TFLOPS 1,36 TFLOPS 1 TFLOPS
Spotřeba v
idle
40 W 27 W 27 W 18 W 16 W
Max. spotřeba 294 W 188 W 170 W 108 W 86 W
Délka karty 31 cm 28 cm 24 cm 22 cm 19 cm
Shader model 5.0 5.0 5.0 5.0 5.0
Radeon Radeon Radeon GeForce GeForce
HD 4870 HD 4890 HD 4870 X2 GTX 285 GTX 295
Jádro RV770 RV790 2× RV770 G200 2× G200
Výrobní proces 55 nm 55 nm 55 nm 55 nm 55 nm
Velikost jádra 263 mm² 282 mm² 263 mm² 470 mm² 470 mm²
Tranzistorů 956 mil. 959 mil. 2,15 mld. 1,4 mld. 2,8 mld.
Stream
procesorů
160 (800) 160 (800) 2× 160 (800) 240 2× 240
Takt jádra 750 MHz 850 MHz 750 MHz 648 MHz 576 MHz
Takt SP 750 MHz 850 MHz 750 MHz 1476 MHz 1242 MHz
ROP/RBE 16 16 2× 16 32 2× 28
Texturovacích
jedn.
40 40 2× 40 80 2× 80
Paměť 512 MB GDDR5 1 GB GDDR5 2× 1 GB GDDR5 1 GB GDDR3 2× 896 MB GDDR3
Takt pamětí 3600 MHz 3900 MHz 3600 MHz 2484 MHz 999 MHz
Šířka sběrnice 256-bit 256-bit 256-bit 512-bit 448-bit
Propustnost
pamětí
115,2 GB/s 124,8 GB/s 115,2 GB/s 159,0 GB/s 111,9 GB/s
Fillrate
(pixely)
12 Gpx/s 13,6 Gpx/s 2× 12 Gpx/s 20,8 Gpx/s 2× 16,1 Gpx/s
Fillrate
(textury)
30 Gtx/s 34 Gtx/s 2× 30 Gtx/s 51,8 Gtx/s 2× 46,1 Gtx/s
FLOPS 1,2 TFLOPS 1,36 TFLOPS 2,4 TFLOPS 1063 GFLOPS 1789 GFLOPS
Max. spotřeba 160 W 190 W 286 W 183 W 289 W
Délka karty 24 cm 24 cm 27 cm 27 cm 27 cm
Shader model 4.1 4.1 4.1 4.0 4.0

Přetaktování doporučeno

Možná AMD zvolila kódové označení Hemlock právě kvůli rezervě pro přetaktování. Slovíčko unlock se v prezentacích Radeonu HD 5970 objevuje pořád dokola a AMD na obrázku, kteří fandové jistě už notoricky znají, nechává tvořit velká očekávání: 1 GHz pro jádro a 1500 MHz pro paměti (6 GHz efektivně) je umožněno už v ovladačích (Catalyst Control Center), k HD 5970 navíc AMD dodává svůj nástroj pro zvýšení napětí, abyste se na nějaké vyšší přetaktování mohli dostat i bez úprav BIOSu anebo odporů na PCB. Později se podíváme, jaká je praxe.

Teselace, DirectX 11 a Eyefinity

Radeony HD 5000 s jádry Cypress a Juniper mají hardwarovou teselační jednotku
("tesselator"), videoprocesor UVD druhé generace a i přímo v čipu
zahrnutý kompozitor pro Multi-GPU zapojení (CrossFireX). Dalším společným rysem všech dosavadních
Radeonů HD 5000 je podpora DirectX 11. Klíčové nové vlastnosti AMD
shrnula do následující tabulky:

Velmi dobrý a praktický test Eyefinity vydal nedávno web ComputerBase.de. Krom popisu nástrah a výhod najdete v odkazovaném článku
také výkon s Eyefinity na kombinaci deseti her, čtyř rozlišení (mimo
standardního 1920 × 1200 px právě Eyefinity rozlišení 2400 × 600, 3840
× 1024 a 5760 × 1200 px) a tří grafických karet (Radeon HD 5870, 5850, 5770 – 5970 ještě chybí, ale z výkonu ve 2560 × 1600 px oproti HD 5870 se dá také ledaccos usuzovat).

Mnoho
dalšího z architektury a technologií pak platí pro Radeony HD 5700
stejně jako pro Radeony HD 5800 a více jste se mohli dočíst v později
ještě výrazně aktualizované recenzi Radeonu HD 5870. Jmenovitě kupříkladu:

O výkonu dvoučipového Radeonu HD 5970 není třeba dlouze diskutovat. Pokud vám CrossFire v dané hře předvede alespoň průměrné škálování, jedná se o suverénního krále současných grafických karet. Parametry této karty a další zajímavé informace jste se mohli dozvědět už v aktualitě Ondry Bešťáka.

Sapphire HD 5970 obrazem, ilustrace rozměrů

Mimo délky karty si můžete prohlédnout třeba příslušenství čítající poctivou kabeláž, kupón na DIRT 2 a poté podle všeho beztak zdarma šiřitelnou Battleforge. Znovuobjevený Sapphire Redline je podle všeho pouze převlečenou utilitou ATI Overvoltage.

Necelých 31 cm je nakonec trochu lepší, než to podle prvních uniklých fotek vypadalo (mimochodem, karta z leaku na AlienBabelTech vypadala dost jinak, bůhví, co to bylo). Kdyby si ATI/AMD odpustila parádičky v podobě dvou červených plastů kolem průduchů a ještě tvar karty do špičky, mohlo to být 30 cm. A při této délce už může každý centimetr znamenat vleze/nevleze. Majitelé big towerů jsou v pohodě, kdo má middle tower asi už hledá metr. Na fotkách vidíte i srovnání se 27cm Radeonem HD 4870 X2 a stejně dlouhou (nebo v tomto kontextu spíš krátkou) GeForce GTX 260.

Díky pozici PCI Express ×16 slotu na desce Gigabyte EX58-UD5 a odnímatelnému koši pro pevné disky, jsem kartu do middle tower Cooler Master 534 (na této platformě jsou založeny snad desítky skříní dalších značek jako Apevia, Gigabyte, NZXT, ...) napresoval. Sice je trochu tlačena plechem dvou pevných 3,5" pozic, ale funguje. VelociRaptor zatím bude odpočívat na dně skříně, co bychom pro nejvýkonnější grafiku světa neudělali, že?

Testovací konfigurace

Hardware

  • monitor: HP LP3065 (30", 2560 × 1600 px, S-IPS)
  • procesor: Intel Core i7 920 (20× 166 MHz = 3,33 GHz, Turbo Boost: 3,5 GHz)
  • základní deska: Gigabyte GA-EX58-UD5 (Intel X58)
  • paměti: 6 GB Kingston DDR3-1866 (1000 MHz, 7-7-7-20, 1,5 V)
  • pevný disk: Western Digital VelociRaptor VR150 (WD3000GLFS)
  • optická mechanika: Lite-On DH-4O1S (Blu-ray, DVD-ROM)
  • zdroj: Gigabyte Odin GT 800W (GE-S800A-D1)
  • skříň: Cooler Master Centurion 534
  • chladič CPU: Scythe Mugen 2 + Noctua NT-H1
  • systémové větráky: Arctic Fan12 PWM + Cooler Master 12 cm @ 800 rpm

Pouze pro testy hlučnosti je použit jiný počítač (a noční klid):

  • hlučnost okolí: 36,5 až 37,5 dBA (měřeno cca 20 cm od grafické karty, odejmutá bočnice skříně)
  • pevné disky: WD7500AAKS a WD20EADS v boxech Acutake Dark Disc 2
  • zdroj: Enermax Modu82+, 625 W
  • skříň: Cooler Master Centurion 5
  • chladič CPU: Noctua NH-U12P
  • systémový větrák: Noctua NF-S12

Operační systém a ovladače

  • Microsoft Windows Vista Ultimate (64bitová verze)
  • ATI Catalyst 9.4 (změněný INF) pro Radeon HD 4670
  • ATI Catalyst 9.5 pro Radeon HD 4730/4770/4850/4870/4890 a 4870 X2
  • ATI Catalyst 9.10 beta pro Radeon HD 5870/5850 a 5750/5770 (8.66.6) i 5970 (beta 4)
  • Nvidia GeForce 185.65 pro GeForce GTX 260/275/285
  • Nvidia GeForce 185.85 WHQL pro GeForce 9500 GT/9600 GT/9800 GT/GTS 250
  • Nvidia GeForce 190.62 WHQL pro GeForce GTX 295

Assassin's Creed (DX10.1), Call of Duty 5: World at War (DX9)

Assassin's Creed

Pro měření použijte FRAPS, do volby automatického vypnutí po nějakém čase zadejte 72 sekund. Ve hře nastavte všechny detaily na maximální hodnoty, vypněte vertikální synchronizaci. Anti-aliasing se nastavuje také ve hře (vzorkování) a hodnota 3/3 by měla odpovídat 4× MSAA. Ten si lze ale dopřát jen do rozlišení 1680 × 1050 px včetně.

Po nastavení musíte mít hru uloženu na začátku prvního města (Masyaf), dole u studny (můžete využít i můj profil právě s takovou uloženou pozicí). Poté od studny vyběhněte ulicí nahoru (snažte se vyhýbat srážkám s kolemjdoucími, malé škobrtnutí ale nevadí. Používejte běh (pravé tlačítko myši), ale ne sprint (mezerník)) až k sekvenci ukazující pevnost. Po jejím skončení se otočte a vraťte se k domu, na který vylezete po žebříku. Dojděte až na jeho roh tak, abyste viděli z města pod vámi co nejvíce. Takto setrvejte několik vteřin a logování FRAPS se samo vypne. I při seběvětší snaze o co nejpodobnější opakování je v měření jistá malá dávka nepřesnosti (při naučení se průchodu se lze vejít do chyby 2 %).

 

Call of Duty 5: World at War

Benchmark probíhá pomocí FRAPSu. Ten nastavte na 35 sekund. V možnostech hry aktivujte konzoli a do ní vepište devmap pel1b. Tím se dostanete na začátek mise Houževnatý (Relentless). Jakmile se tak stane, spusťte FRAPS. Po výskoku z vybuchlého tanku držte stále klávesu pro pohyb vpřed, FRAPS po chvíličce sám přestane logovat. Měření jsou opakovatelná s velmi malou odchylkou.

Crysis Warhead (DX10), Enemy Territory: Quake Wars (OpenGL)

Crysis Warhead

K otestování výkon v Crysis: Warhead používám utilitu Framebuffer Crysis Warhead Benchmarking Tool 0.31. Abych měl měření kompatibilní s ověřovaným (ranked) benchmarkem, nechávám volbu na mapě ambush a implicitním čase (v tomto případě noc). Používám rozhraní DirectX 10 a nastavení Gamer (hráč, odpovídá detailům high v původním Crysis). Beru výsledek druhého měření, kdy už je hra načtena v paměti. V tomtom druhém průběhu rovněž zaznamenám podrobný FRAPSLOG. Měření jsou opakovatelná s minimální odchylkou.

Enemy Territory: Quake Wars

Nové Enemy Territory představuje jedinou současnou moderní OpenGL hru pod Windows a zároveň jediný OpenGL test v testovací sadě. Quake Wars používají značně upravený Doom 3 engine, obohacený především o technologii MegaTexture (více o technologii v článku na Beyond3D). Pro testy používám maximální detaily, přes konzoli vypínám limit 30 i 60 fps, AA i AF zapínám ve hře.

 

Pro účely testování jsem si nahrál vlastní timedemo (recordtimenetdemo), které měří výkon v rozsáhlé lokaci se stromy (Valley). Timedemo (pro verzi 2.0) ke stažení: zde.

Far Cry 2 (DX10.1), Mirror's Edge (DX9, PhysX)

Far Cry 2

Pro testy jsem používal zabudovaný benchmark, test Ranch Medium. Výsledky v grafech jsou z plynulejšího ze dvou opakování. Používám režim DirectX 10 a maximální detaily. Anti-aliasing zapínám přes nabídku hry.

Více v článku Far Cry 2: výkon grafických karet a vliv nastavení.

 

Mirror's Edge

Přesné testování v Mirror's Edge je usnadněno naskriptovaným průchodem FlybyFlight (spustíte např. takto: "D:\Hry\Mirror's Edge\Binaries\MirrorsEdge.exe" -FlybyFlight), který prolétne pokaždé stejně části děje v epizodě Flight. Před spuštěním testu nastavte FRAPS na 62 vteřin, pak je důležité, abyste začali logovat hned po načtení lokace. V TdEngine.ini je třeba vypnout položku bSmoothFrameRate (nastavte na False), rozšířenou PhysX i maximální detaily zapínám přes menu hry.

Lokace v benchmarku je mimochodem také první místo hry, kde při skutečném hraní a zapnutou rozšířenou fyzikou bez akcelerace PhysX dojde k hrubým propadům výkonu. Více v článku Mirror's Edge, PhysX, GeForce, Radeony a procesory.

Race Driver GRID (DX9), S.T.A.L.K.E.R.: Clear Sky (DX10.1)

Race Driver GRID

FRAPS nastavte na vypnutí po 31 vteřinách. Po spuštění hry s nainstalovanou záplatou 1.2 zvolte v nabídce Race Day. Všechno mimo lokace (Location) a okruhu (Route) ponechte, tyto změňte na Milan a Castello Circuit B. V následující obrazovce vyberte start až za všemi dalšími auty (Grid Position: Back). Ihned po načtení trati spusťte FRAPS a startujte schválně pomalu: tak, abyste se drželi stále kousek za ostatními. To vydržte až do první prudší zatáčky, v níž akorát vyprší lhůta 31 vteřin a logování FRAPSu bude u konce.

Veškeré detaily jsou nastaveny na maximální hodnoty (Overall Detail: Ultra), anti-aliasing je zapínán rovněž přes menu hry. Změna rozlišení bohužel vyžaduje restart.

 

S.T.A.L.K.E.R.: Clear Sky

U pokračování hry ze zóny kolem Černobylu jsem si opět vystačil hned s prvním táborem. Tentokrát jsem měření zjednodušil a udělal jej jednak přesnějším a rovněž srovnatelným se serverem PC Games Hardware. Jinými slovy využívám uloženou pozici PCGH (Users\Public\Documents\stalker-stcs\savedgames), která nejenže obsahuje výkondrásající paprsky vycházejícího slunce (god rays), ale stačí u ní po načtená spustit FRAPS, držet klávesu W pro pohyb vpřed a FRAPS vypnout před naražením do plotu. Měření je tak poměrně dost přesné.

Používám takřka plné detaily, náročný režim Enhanced full dynamic lighting (DX10), všechny legrace jako SSAO zapnuty. Jen anti-aliasing průhlednosti už nezapínám. Zapnutí či vypnutí anti-aliasingu vyžaduje restart hry, rozlišení nikoli.

Enhanced full dynamic lighting je režim, který umožní zapnout několik funkcí jako třeba Volumetric Smoke či Wet Surfaces (více v tomto srovnání). U karet ATI Radeon zapínám podporu DX10.1 (zlepšuje výkon, obraz nechávám při stejném nastavení), anti-aliasing průhlednosti budou snad stíhat grafické karty nějaké další generace. Jen pro zajímavost: DX10.1 režim tohoto A-tested objects vyhlazování je asi hezčí, ale náročnější.

The Elder Scrolls IV: Oblivion (DX9), Tom Clancy's H.A.W.X. (DX10.1)

The Elder Scrolls IV: Oblivion

Čtvrtý díl série Elder Scrolls patří i přes svůj věk stále mezi nejnáročnější hry vůbec. Zvlášť, když stejně jako já v testu, vyberete lokace s množstvím vlnící se trávy, pohupujících se stromů a přesto rozhledem do vzdálené krajiny (The West Weald). Testuji s maximálními detaily a HDR. Soubor s nastavením (vše na maximum) a uložená testovací pozice ke stažení: zde.

Anti-aliasing i anizotropní filtrování vynuťte v ovladačích, v souboru Oblivion.ini se přesvědčte, že máte vypnutou vertikální synchronizaci (iPresentInterval=0). Po spuštění hry si nahrajte mou uloženou pozici číslo 260 a po načtení ihned začnětě logování FRAPSem a pohyb vpřed. Držte stále klávesu pro pohyb vpřed, dokud se neobjeví nápis upozorňující na to, že dále už nemůžete. Když nastavíte automatické vypnutí FRAPSu po 34 vteřinách, nic taky nezkazíte.

 

Tom Clancy's H.A.W.X. (DX10.1)

V arkádovém simulátoru bojových letadel lze využít nejen DirectX 10 pro efekty jako SSAO či volumetrické paprsky, ale také DirectX 10.1. Tuto revizi lze použít jak pro zrychlení hry na kartách, které ji podporují (což činím), nebo pro zlepšení obrazu nastavením SSAO na very high (což kvůli porovnatelnosti výsledků s kartami bez podpory DirectX 10.1 nečiním).

V nabídce s grafikými nastaveními je i tlačítko spouštějící zabudovaný benchmark, což v praxi znamená oblet města. Průběh loguji samozřejmě i FRAPSem, výstupem benchmarku jsou totiž jen dvě celočíselné hodnoty (průměrné a trošku nepochopitelně rovněž maximální fps).

Trackmania Nations Forever (DX9), World in Conflict (DX10), Zaklínač (The Witcher) (DX9)

Trackmania Nations Forever

Trackmaniu hraje nejen ve světě, ale i v ČR obrovský počet hráčů, hra má navíc zabudovanou možnost benchmarku. Ten používám pro realistické a současně přesné měření i já. Detaily mám nastaveny na maximální hodnoty, anti-aliasing i anizotropní filtrování zapínám přímo přes možnosti hry a nastavením stínů na komplexní překračuji nejnáročnější předdefinovaný profil.

 

World in Conflict

Testuji s upraveným profilem very high details (zapnul jsem i water reflects clouds (voda odráží oblaka), anizotropní filtrování navýšil na 16×). Používám vestavěný benchmark.

 

Zaklínač (The Witcher)

Opakovatelné testování v Záklínačovi není úplně jednoduché. Pro měření je samozřejmě používán nástroj FRAPS, detaily i anti-aliasing a anizotropní filtrování nastavuji v nabídce hry. Verze hry 1.3 a grafické karty s více jak 512 MB paměti by měly nabídnout i 4× AA přímo ve hře. U karet Nvidia GeForce funguje spolehlivě i vynucení anti-aliasingu v ovladačích, u karet ATI Radeon bohužel ne. Jakmile v ovladačích zvolíte 4× AA (MSAA, Box), vypne se anti-aliasing ve hře. A to bez ohledu na to, zda jej máte v menu hry zapnutý či vypnutý.

Každopádně po načtení uložené pozice z Lesa na Blatech se otočte přímo na vstupní bránu do háje druidů, stiskněte klávesu pro pohyb vpřed a současně odstartujte logování FRAPSu (typicky F11). Projděte co nejpříměji, vyhněte se co nejmenším úkrokem ze směru. Logování vypněte v bažině, kde už opravdu dále směrem kupředu jít nejde. Měření jsou opakovatelná s překvapivě malou odchylkou, problémem je jen počasí. Jakmile načtete uloženou pozici a na Blatech prší, rovnou ji nahrajte znovu a doufejte ve vyčasený den (častější případ). Výkon karet je při deštivém počasí nižší. Při benchmarkování používám pohled přes rameno (F3).

Více v článku Zaklínač (The Witcher) vs. hardware: tweakguide.

3DMark Vantage

3DMark Vantage

Vantage

Zájemci o v 3DMarku Vantage použité technologie jejich popis najdou v tomto whitepaperu (PDF). V grafech najdete pouze výsledky z GPU testu.

Radeon HD 5970, 2× 1024 MB, Performance:

Radeon HD 5970, 2× 1024 MB, Extreme:

2× Radeon HD 5970 (CrossFireX), 2× 1024 MB, Performance:

 

2× Radeon HD 5970 (CrossFireX), 2× 1024 MB, Extreme:

Radeon HD 5770, 1024 MB, Performance:

Radeon HD 5750, 1024 MB, Performance:

Radeon HD 5850, 1024 MB, Performance:

GeForce GTX 295, 2× 896 MB, performance, GeForce PhysX On:

Radeon HD 5870, 1024  MB, performance:

Radeon HD 4870, 1 GB, Performance:

HD4870

GeForce GTX 285, 1 GB, Performance:

GTX285

GeForce GTX 275, 896 MB, Performance:

HD4890

Radeon HD 4890, 1 GB, Performance:

HD4890

GeForce 9600 GT, 512 MB, performance:

Radeon HD 4730, 512 MB, performance:

Radeon HD 4830, 512 MB, Performance:

4830

Radeon HD 4770, 512 MB, Performance:

CrossFire Radeon HD 4770, 512 MB, Performance:

Radeon HD 4670, 512 MB, Performance:

4830

SLI GeForce GTX 260, 896 MB, Performance (GPU PhysX On):

GeForce GTX 260 (SP216), 896 MB, Performance:

GTX260

SLI GeForce 8800 GT, 512 MB, Performance (GPU PhysX On):

GeForce 8800 GT, 512 MB, Performance (CPU PhysX):

HD4890

GeForce 8800 GT, 512 MB, Performance (GPU PhysX):

HD4890

GeForce GTS 250, 1 GB, Performance (s PhysX – ovlivňuje CPU score i celkové skóre):

Radeon HD 4850, 1 GB, Performance:

GeForce 9800 GTX+, 512 MB, Performance:

Radeon HD 4850, 512 MB, Performance:

Nastavení shrnuje tato tabulka přímo od Futuremarku:

Stalker: Call of Pripyat a Radeony HD 5970 v CrossFire

Pokud jste četli sobotní článek, můžete tuto kapitolu směle přeskočit.

Stalker: Call of Pripyat a Radeony HD 5970 v CrossFire

Stejně jako Clear Sky, i další díl série S.T.A.L.K.E.R., Call of
Pripyat, se dočkal po vydání hry i samostatného benchmarku. Tento
zdarma šířený 421MB soubor můžete stáhnout buď GSC (výrobce) od anebo lépe z techPowerUp!. Své výsledky posílejte do připraveného vlákna v diskuzním fóru.

Většina výsledků (až na poslední) v grafu je z přednastavení Ultra a jako renderer je použit Enhanced full dynamic lighting (DX11). Rozdíl výkonu při nastavení týchž detailů, ale DX10, je v grafu rovněž vidět.

Téměř v nejnáročnějším nastavení (jen HDAO má ještě jednu vyšší úroveň) ...

...jsem srovnal jeden Radeon HD 5970:

s CrossFireX zapojením těchto dvou obrů:

Kromě posledního testu je škálování se třetím a čtvrtým GPU nevysoké, ale v náročných slunečních paprscích je více jak 100 %. Jak to? Tentokrát je to chybou, která nejspíše může umožnit i podvádění v tomto benchmarku. Během dlouhého testu v Pripyat se horní Radeon HD 5970 zahřál natolik, že Catalyst zavolaly VPU Recover. Benchmark ale dojel, nicméně s nekorektním výsledkem v poslední části. Při dalších opakováních byly výsledky pro změnu nižší než 33 fps s jedním HD 5970; jednoduše bych musel nějak řešit chlazení.

Spojení dvou Radeonů HD 5970 do CrossFire – 6400 stream procesorů

Jak už jste viděli kousek výše, oba Radeony jsem po vyjmutí koše pro disku do middle tower skříně Cooler Master Centurion 534 nacpal. Bohužel základní deska Gigabyte EX58-UD5 má celkem tři sloty PEG, proto vzdálenost mezi nimi je o jeden slot kratší, než by dvouslotové Radeony pro nějaké to rozumné dýchání potřebovaly.

GPU-Z potvrzuje CrossFireX dvou Radeonů HD 5970 a celkem 4 GPU účastnící se vykreslování 3D scény. Zobrazeny jsou taky karty, z níž vede DVI kabel do monitoru: Sapphire má takt čipu i pamětí o 10 MHz vyšší než referenční karta ATI.

Zatímco jádra v horní kartě s malým prostorem pro nasávání (a ještě k tomu teplého vzduchu od spodní karty) mají kolem 80 stupňů Celsia i v idle...

... grafickým procesorům ve spodním Hemlocku nijak velké horko není:

Screenshot típnutý těsně po zátěži ve FurMarku dokazuje, že více jak 100 stupňů Celsia není výjimkou, konkrétně v tomto případě bylo maximem 107 stupňů Celsia (VPU Recover ale ještě zavolán nebyl).

Vyzkoušel jsem škálování CrossFire v několika náročných hrách a nastaveních, ve Far Cry 2 už byl limitem procesor, v Crysis Warhead spíše už nedocházelo ke škálování (a ve 2560 × 1600 nepracoval už multi-sampling) s více jak dvěma GPU Cypress, ArmA II si s CrossFire zřejmě vůbec netyká, zato nezklamal OpenGL Enemy Territory: Quake Wars s vysokými stupni anti-aliasingu (4× MSAA skrze hru + super-sampling v ovladačích Catalyst dávají opravdu i obrazově pěkné výsledky, později snad přinesu nějaké screenshoty) či oba Stalkery anebo DX11 benchmark Unigine Heaven.

K testům mám ještě pár poznámek: spotřeba v zátěži se při testech Stalker: Clear Sky a Call of Pripyat pohybovala běžně kolem 485 W (a procesor zde také není tolik vytížen), reltivně nízká spotřeba ve FurMarku je dána tím, že čtyři GPU zde nejsou dobře vytížena.

Hlavním zjištěním ale bylo, že i když se snímkové frekvence ve Stalkerech i Unigine Heaven pohybovaly celkem stále kolem 45 fps, výsledný dojem plynulosti odpovídal asi tak 10 fps. Radikálně se to zlepšilo po zapnutí vertikální synchronizace (VSYNC ON), která je zřejmě pro synchronizaci multi-GPU velmi důležitá.

Dobrým důkazem aktivních čtyř GPU v CrossFireX je i 3DMark Vantage, nejdříve podrobné výsledky jediného HD 5970 (dvě GPU):

a následně dvou HD 5970 (čtyř GPU):

Unigine Heaven: DirectX 11 pastva pro oči

Stalker: Call of Pripyat s maximálními detaily nevypadá vůbec špatně, ale i díky až trošku přehnané „hrbolatosti“ dosažené díky teselaci mě uchvátil spíše Unigine Heaven. Velmi pěkně je podle mě ztvárněna také tráva (chce to vidět v pohybu), ta ale zůstává ve stínu teselovaných povrchů. Je pravda, že jak si jednou projedete benchmark s teselací, už na vás bez ní působí dost ploše a nezajímavě.

Budete-li mít zájem prozkoumat screenshoty ve 2560 × 1600 px (DX11, 4× MSAA, teselace), stáhněte si je na počítač v tomto ZIPu (11 MB). Škoda jen, že legrace pro plynulý provoz takovéhoto nastavení, tedy dva Radeony HD 5970, stojí od 26 000 Kč nahoru a i kdybyste na to ty peníze nakrásně měli připravené, stejně je nemáte šanci koupit. To ale určitě fandy grafických karet neodradí od těšení se na podrobnou recenzi HD 5970: vždyť o některých autech si také jen čteme.

Přetaktování: od teorie k praxi

Teorie

V AMD se zřejmě osvědčila strategie oslovení hardwarových nadšenců započatá s Phenomy II X4 Black Edition a Radeon HD 5970 jde podobnou cestou. Napěťové regulátory Volterra jsou sice schopné, ne zrovna levné, ale na druhou stranu nejsou novinkou HD 5970. To 5GHz GDDR5 na předchozí generaci nebyly a AMD vyzdvihuje i použití kvalitních kondenzátorů na referenčním návrhu. Výběr lepších jader pro HD 5970 se dá čekat (možnosti chladiče nejsou neomezené a jádra jsou přeci jen dvě), pasiv byl obohacen o technologie vapor chamber.

Klepněte na náhled pro zvětšení

Další slajd od AMD je střízlivější než ten, který jste viděli v první kapitole a hlavně je velice praktický. Ukazuje totiž, o kolik si pomůžete v určitých hrách a nastaveních přetaktováním GPU (ze 725 na zhruba 865 MHz) a poté dotaktováním pamětí ze 4 na 4,8 GHz.

Praxe

Do přetaktování se můžete pustit buď s Catalyst Control Center (záložka Overdrive vás, jak jsem předeslal, nechá jít až na 1000/6000 MHz pro jádro/paměti efektivně), nebo třeba s MSI Afterburner 1.4.1. Pro zvýšení napětí jádra můžete použít opatrnou OverVolt Tool od ATI, nebo drsnější Afterburner. Zvyšovat napětí u pamětí lze pouze v nástroji od ATI.

Kartu jsem při přetaktování chladil ještě 12cm ventilátor s 2200 rpm. Když jsem jej takto podobně postavil ke dvěma Radeonům HD 5970 v CrossFire, klesla i spotřeba v idle ze 192 na 183 W.

Průběh taktování vypadal nějak takto:

  • 800 MHz jádro, paměti 1 GHz, základní napětí – 3DMark06 Canyon Flight s MSAA i Crysis (DX10, enthusiast) proběhly bez chyby
  • 900 MHz jádro, paměti 1 GHz – max. napětí přes utilitu od ATI (1,16 V) stačilo pro 3DMark, nikoli pro Crysis
  • 900 MHz pro jádro, paměti stále na základu, 1,2 V přes Afterburner – stabilní i Crysis
  • 1000 MHz pro jádro, mem def., 1,25 V – 3DMark ok, Crysis padá
  • 1000 MHz pro jádro, 1,287 V – projede i Crysis, když ale začnu taktovat i paměti, musím jet na doraz: 1,299 V
  • jádro základ, paměti 1315 MHz (5,26 GHz efektivně!) – 3DMark06 bez problémů i s MSAA, Crysis padá
  • 1315 MHz pro paměti, 1,15 V pro paměti v ATI OverVolt – projede i Crysis

Vliv anti-aliasingu na výkon

Radeon HD 5970

O tom, že i v náročné hře jako Far Cry 2 je 8× MSAA v 1920 × 1200 px zcela plynulou záležitostí, vás přesvědčí graf průběhu z testu:

(červená je bez MSAA, zelená = 2× MSAA, modrá = 4× MSAA, žlutooranžová = 8× MSAA)

 

Crysis Warhead (DX10) Far Cry 2 (DX10.1) ET: QW (OpenGL)
1920 × 1200 65,9 120,4 129,1
1920 × 1200, 2× AA 61,0 107,7 126,0
1920 × 1200, 4× AA 58,6 97,3 124,1
1920 × 1200, 8× AA 47,9 71,5 105,8

 

GeForce GTX 295

Optimum 4× MSAA je zjevné, 8× MSAA pak opravdu bolí:

Crysis Warhead (DX10) Far Cry 2 (DX10.1) ET: QW (OpenGL)
1920 × 1200 58,9 82,6 141,6
1920 × 1200, 2× AA 51,1 79,4 130,4
1920 × 1200, 4× AA 46,9 74,7 124,9
1920 × 1200, 8× AA 22,2 44,7 90,7

 

Radeon HD 5870

Hodnota u nastavení s 2× MSAA v ET:QW si evidentně žádá přeměření (provedu při prvním návratu HD 5870 do redakce).

Crysis Warhead (DX10) Far Cry 2 (DX10.1) ET: QW (OpenGL)
1920 × 1200 50,3 82,5 128,6
1920 × 1200, 2× AA 44,2 72,9 109,1
1920 × 1200, 4× AA 42,0 64,1 107,2
1920 × 1200, 8× AA 33,8 48,6 84,4
1920 × 1200, 4× SSAA N/A N/A 55,2

Radeon HD 5850

 

Crysis Warhead (DX10) Far Cry 2 (DX10.1) ET: QW (OpenGL)
1920 × 1200 42,4 69,3 120,3
1920 × 1200, 2× AA 37,8 62,5 101,6
1920 × 1200, 4× AA 35,9 55,4 91,3
1920 × 1200, 8× AA 29,4 43,6 77,9

 

 

GeForce GTX 285

 

Crysis Warhead (DX10) Far Cry 2 (DX10.1) ET: QW (OpenGL)
1920 × 1200 40,4 56,1 121,0
1920 × 1200, 2× AA 34,9 53,0 100,6
1920 × 1200, 4× AA 33,1 49,5 91,1
1920 × 1200, 8× AA 23,4 41,3 62,9

 

Radeon HD 5770

 

Crysis Warhead (DX10) Far Cry 2 (DX10.1) ET: QW (OpenGL)
1920 × 1200 24,8 45,3 75,4
1920 × 1200, 2× AA 21,8 39,1 57,5
1920 × 1200, 4× AA 20,8 33,6 53,6
1920 × 1200, 8× AA 18,0 28,3 43,5

 

Radeon HD 5750

 

Crysis Warhead (DX10) Far Cry 2 (DX10.1) ET: QW (OpenGL)
1920 × 1200 29,1 53,3 88,0
1920 × 1200, 2× AA 25,4 45,4 70,0
1920 × 1200, 4× AA 24,2 38,6 62,1
1920 × 1200, 8× AA 20,6 28,9 50,6

 

Enemy
Territory: Quake Wars je jednou z her, která umožňuje mnoho režimů
anti-aliasingu zapnout přímo v menu. To je mimochodem v dnešní době
také lepší, protože to jednak správně funguje a také globální vynucení
v ovladačích není pohodlné pro ty, kdo střídají hraní více her. Jedině
CFAA režimy Radeonu musíte bez ohledu na hru vždy vynucovat v
ovladačích.

 

Současné
GeForce nabízí kromě standardních režimů anti-aliasingu (tedy 2×, 4×,
8× rotated grid multi-sampling) ještě tzv. CSAA (Coverage Sampling
Anti-Aliasing). Jeho režimy se liší počtem ukládaných vzorků (barva, Z,
textura), stručně by se dalo říct, že třeba 16× CSAA by mohlo být
kvalitativně lepší než 4× MSAA, ale povětšinou horší než 8× MSAA.
Výkonnostně je z podstaty své funkce ale blíže 4× MSAA. U GeForce GTX
nechybí ani režimy transparency multi-sampling a super-sampling pro
anti-alias průhledných textur (tráva, listí, stromy). Zatímco první
není kolikrát ani poznat, druhý je sice vizuálně bezva, ale dopad na
výkon bývá drastický.

Radeony
je na tom se základní výbavou podobně. Stejné režimy multi-samplingu
(zajímavý 6× sparse odešel společně s Radeony X1950, tedy generací
R520/R580), obdobné režimy anti-aliasu průhledných textur (jen se
jmenují adaptivní vyhlazování kvalita/výkon). Radeony HD 4800 nemají
žádné CSAA, ale CFAA. Custom Filters Anti-Aliasing sice není až tak
custom, jak byste možná doufali, zato mezi mnoha ostatní skrývá dva
poklady. Zatímco wide tent a narrow tent se většině lidí nelíbí kvůli
možnému rozmazávání (některé weby vzpomínaly na ošklivý Nvidia
Quincunx), režimy edge-detect (12× a 24×, tedy čtyři vzorky plus
detekce hran, resp. osm vzorků s detekcí hran) jsou jiná káva. 24× CFAA
(edge-detect) je dost možná vůbec nejkvalitnější dostupný režim
anti-aliasingu na herních grafikách.

Měření ve vysokých rozlišeních, DX11, verdikt

To úplně nejdůležitější jsem si nechal na poslední kapitolu a není to tentokráte verdikt, ale jsou to měření mimo obvyklou metodiku: ve vysokých rozlišeních či v nově příchozích DirectX 11 benchmarcích a demech. Něco jste mohli už vidět v kapitole se Stalkerem: Call of Pripyat a dvěma Radeony HD 5970 v CrossFire.

Kde jsou měření obvyklou metodikou, kde je spotřeba, hlučnost...

V tomto článku nenajdete běžné pruhové grafy ze 13 her, na které jste zvyklí. Nenajdete zde ani Radeon HD 5970 srovnán po stránce hlučnosti, teploty GPU či spotřeby s dalšími mnoha grafickými kartami. To vše, navíc se snad komfortními interaktivními grafy obsahuje včerejší článek: Žebříček 28 grafických karet (v interaktivních grafech)

Teď si ukážeme srovnání s nejvýkonnější jednočipovou kartou ATI (HD
5870) a Nvidia (GTX 285). GeForce GTX 295 jsem bohužel neměl k
dispozici a redakční Radeon HD 4870 X2 nepřežil montáž Accelera Xtreme od u mě nyní neoblíbené společnosti Arctic Cooling (na stěžovací dopis jsem dosud nedostal odpověď).

Upozornění: neberte nárůsty výkonu s Radeonem HD 5970 oproti HD 5870 jak škálování CrossFire. Nárůsty lze srovnávat spíše s Radeonem HD 5850, neboť třeba test na Hardware.fr prokázal, že dva Radeony HD 5850 v CrossFireX jsou výkonnější než jeden HD 5970 (ač specifikacemi silnější, přece jen má k dispozici méně PCIe linek).

Při studiu výsledků v Žebříčku 28 grafických karet vás možná zarazilo pár výsledků, zde je k nim vysvětlení:

  • Assassin's Creed – bohužel, Radeony HD 5000 nepředvádějí zřejmě vinou ovladačů stejně dobrý výkon jako řada HD 4000, a to ani ve verzi 1.01 (DX10.1), ani ve 1.02 (DX10)
  • Call of Duty: World at War – CrossFire by pomohl, nebýt výbůchů: ty jakmile začnou, jdou výkony CrossFire řešení pod úroveň single karet (je to vidět i na grafu průběhu fps)
  • Crysis Warhead, ET:QW a Far Cry 2 – především ve vyšších rozlišeních dobré škálování
  • Mirror's Edge – bez PhysX na výkonných kartách více jak 100 fps, s PhysX benchmark GeForce anebo procesoru
  • Race Driver GRID – nejvýkonnější Radeony jsou již limitovány procesorem
  • The Elder Scrolls IV: Oblivion – nutno přejmenovat na Crysis.exe pro nějaké škálování CrossFire, výkon za očekáváním (vzhledem k tomu, kam už se dostala řada HD 4000)
  • Tom Clancy's HAWX – CF funguje, výkon řady HD 5000 je oproti HD 4000 stále za očekáváním
  • Trackmania Nations Forever – nutno přejmenovat na FEAR.exe, poté je tu jistý nárůst výkon s CrossFire
  • World in Conflict – bezproblémové škálování, dobrý výkon
  • Zaklínač (The Witcher) – i s Catalyst 9.11 WHQL stále zmíněné chyby v obraze, slabší výkon proti řadě HD 4000

Verdikt

Ač obecně nemám Multi-GPU karty příliš rád, nutno přiznat, že testování Radeonu HD 5970 mě bavilo. Bylo opravdu zábavné i na 30" LCD panelu hledat nějaké praktické scénáře (2560 × 1600 px s 8× MSAA za příliš praktický scénář nepovažuji; možná jen jako simulaci výkonu vyššího stupně anti-aliasingu s počtem pixelů podobným některým z Eyefinity rozlišení), které dostanou HD 5970 na kolena. Her, které to dokážou, není opravdu mnoho a dají se spočítat na jednomu člověku patřících prstech.

Radeon HD 5970 nebude pro běžné uživatele: bude tu stát jako možnost pro ty, kdo mají k dispozici zobrazovací zařízení s velmi vysokým rozlišením anebo hrají spíše pomalejší „kochací“ hry s maximalním nastavením. Je hezké, že kromě velkého prostoru ve skříni už nepotřebujete supersilný zdroj a za zbytečně neprohříváte skříň grafikou, co by odebírala 120 W v idle. Naopak, měření prokázala, že oněch AMD uváděných cca 40 W v idle je údaj pravdivý a to je pro výkonnou Multi-GPU kartu veliký úspěch. Nakonec nebudete muset hrát ani se sluchátky, jelikož otáčky ventilátoru jsou řízeny s ohledem na vaše uši. Jen u testované karty to trochu pokazila vrčící motůrek ventilátoru, vada, na níž jsem narazil už u dvou testovaných HD 4800 se stejným větrákem.

Na Radeonu HD 5970 mě ve skutečnosti mrzí jen dvě věci: žádné Multi-GPU řešení neškáluje vždy ve všech hrách a situacích a ATI/AMD stále odmítá zavést uživatelsky definovatelné profily pro jednotlivé hry jako má Nvidia u SLI. Musíte tak čekat buď na opravu v ovladačích anebo zkoušet všelijaké přejmenování spouštěcího souboru. Tou druhou věcí je fakt, že vydání HD 5970 v listopadu 2009 je vzhledem k zoufalé nedostupnosti Radeonů HD 5800 opravdu jen na dělání ramen. Na druhou stranu, krok je to pochopitelný, na první místa v grafech a testech lidé slyší a díky takovým kartám jako HD 5970 se pak prodají i ty méně výkonné, ale již dostupné Radeony.

ICTS24

Sapphire Radeon HD 5970, 2× 1024 MB

+ nejvýkonnější grafická karta současnosti
+ vzhledem k výkonu nízká spotřeba
+ rezerva pro přetaktování
+ DirectX 11, Eyefinity
+ libuje se ve vysokých rozlišeních
+ super-sampling je nezřídka plynulý i ve vysokých rozlišeních
+ aktuálně nejmenší zlo mezi Multi-GPU (i jeden Cypress přinejhorším stačí)

- Multi-GPU/CrossFireX
- jen 1024 MB paměti pro jádro
- velmi dlouhá karta
- u testované karty vrčel motorek větráku (může platit pro více karet)
- špatná dostupnost