Hemlock = 2× Cypress = 4,6 TFLOPS
Kódové označení Radeonu HD 5970 se na jednu stranu nevymyká z řady u HD 5000 zavedené (Cypress = cypřiš, tisovec; Juniper = jalovec), na stranu druhou by jeden nečekal jehličnan podprůměrného vzrůstu, ale přinejmenším sekvoj nebo Kanadě alespoň bližší smrk sitka. Jestli kódové označení společně s poměrně nízkými takty a rezervou pro přetaktování dává prostor pro spekulace o nějakém Radeonu HD "5990", to už nechám na vás.
HD 5970 je tady teď a dávno předtím, než se z papíru dostal do všední reality se vědělo, že tohle bude přinejmenším několik měsíců nejvýkonnější grafická karta. Hemlock totiž na svém PCB nese dva čipy Cypress s plnými 1600 stream procesory (jako HD 5870), jen v pracovních frekvencích zůstává zpátky na úrovni Radeonu HD 5850. O jádře Cypress se můžete více dozvědět v recenzi Radeonu HD 5870.
Kde jsou měření obvyklou metodikou, kde je spotřeba, hlučnost...
V tomto článku nenajdete běžné pruhové grafy ze 13 her, na které jste zvyklí. Nenajdete zde ani Radeon HD 5970 srovnán po stránce hlučnosti, teploty GPU či spotřeby s dalšími mnoha grafickými kartami. To vše, navíc se snad komfortními interaktivními grafy obsahuje včerejší článek: Žebříček 28 grafických karet (v interaktivních grafech)
Hemlock pro někoho možná překvapivě nenese šest výstupů na monitory jako proklamovaný ale nikým stále neviděný Radeon HD 5870 Eyefinity-6. Koneckonců pro jeden čip Cypress je tu jen 1024 MB paměti a skloubit Eyefinity a CrossFire by možná bylo příliš velké sousto i pro lepšící se driver team ATI/AMD. Spokojit se tak budete muset se dvěma DVI-I (skrze redukci lze vytvořit HDMI se zvukem) a jedním miniDisplayPort.
Radeon | Radeon | Radeon | Radeon | Radeon | |
HD 5970 | HD 5870 | HD 5850 | HD 5770 | HD 5750 | |
Jádro | Cypress | Cypress | Cypress | Juniper | Juniper |
Výrobní proces | 40 nm | 40 nm | 40 nm | 40 nm | 40 nm |
Velikost jádra | 330 mm² | 330 mm² | 330 mm² | 181 mm2 | 181 mm² |
Tranzistorů | 2,15 mld. | 2,15 mld. | 2,15 mld. | 1,04 mld. | 1,04 mld. |
Stream procesorů |
2× 1600 | 320 (1600) | 288 (1440) | 160 (800) | 144 (720) |
Takt jádra | 725 MHz | 850 MHz | 725 MHz | 850 MHz | 700 MHz |
Takt SP | 725 MHz | 850 MHz | 725 MHz | 850 MHz | 700 MHz |
ROP/RBE | 2× 32 | 32 | 32 | 16 | 16 |
Texturovacích jedn. |
2× 80 | 80 | 72 | 40 | 36 |
Paměť | 2× 1GB GDDR5 | 1 GB GDDR5 | 1 GB GDDR5 | 1 GB GDDR5 | 1 GB GDDR5 |
Takt pamětí | 4000 MHz | 4800 MHz | 4000 MHz | 2400 MHz | 2300 MHz |
Šířka sběrnice | 256-bit | 256-bit | 256-bit | 128-bit | 128-bit |
Propustnost pamětí |
128 GB/s | 153,6 GB/s | 128 GB/s | 76,8 GB/s | 73,6 GB/s |
Fillrate (pixely) |
2× 23,2 Gpx/s | 27,2 Gpx/s | 23,2 Gpx/s | 13,6 Gpx/s | 11,2 Gpx/s |
Fillrate (textury) |
2× 58 Gtx/s | 68 Gtx/s | 52,2 Gtx/s | 34,3 Gtx/s | 25,2 Gtx/s |
FLOPS | 4,64 TFLOPS | 2,4 TFLOPS | 2,09 TFLOPS | 1,36 TFLOPS | 1 TFLOPS |
Spotřeba v idle |
40 W | 27 W | 27 W | 18 W | 16 W |
Max. spotřeba | 294 W | 188 W | 170 W | 108 W | 86 W |
Délka karty | 31 cm | 28 cm | 24 cm | 22 cm | 19 cm |
Shader model | 5.0 | 5.0 | 5.0 | 5.0 | 5.0 |
Radeon | Radeon | Radeon | GeForce | GeForce | |
HD 4870 | HD 4890 | HD 4870 X2 | GTX 285 | GTX 295 | |
Jádro | RV770 | RV790 | 2× RV770 | G200 | 2× G200 |
Výrobní proces | 55 nm | 55 nm | 55 nm | 55 nm | 55 nm |
Velikost jádra | 263 mm² | 282 mm² | 263 mm² | 470 mm² | 470 mm² |
Tranzistorů | 956 mil. | 959 mil. | 2,15 mld. | 1,4 mld. | 2,8 mld. |
Stream procesorů |
160 (800) | 160 (800) | 2× 160 (800) | 240 | 2× 240 |
Takt jádra | 750 MHz | 850 MHz | 750 MHz | 648 MHz | 576 MHz |
Takt SP | 750 MHz | 850 MHz | 750 MHz | 1476 MHz | 1242 MHz |
ROP/RBE | 16 | 16 | 2× 16 | 32 | 2× 28 |
Texturovacích jedn. |
40 | 40 | 2× 40 | 80 | 2× 80 |
Paměť | 512 MB GDDR5 | 1 GB GDDR5 | 2× 1 GB GDDR5 | 1 GB GDDR3 | 2× 896 MB GDDR3 |
Takt pamětí | 3600 MHz | 3900 MHz | 3600 MHz | 2484 MHz | 999 MHz |
Šířka sběrnice | 256-bit | 256-bit | 256-bit | 512-bit | 448-bit |
Propustnost pamětí |
115,2 GB/s | 124,8 GB/s | 115,2 GB/s | 159,0 GB/s | 111,9 GB/s |
Fillrate (pixely) |
12 Gpx/s | 13,6 Gpx/s | 2× 12 Gpx/s | 20,8 Gpx/s | 2× 16,1 Gpx/s |
Fillrate (textury) |
30 Gtx/s | 34 Gtx/s | 2× 30 Gtx/s | 51,8 Gtx/s | 2× 46,1 Gtx/s |
FLOPS | 1,2 TFLOPS | 1,36 TFLOPS | 2,4 TFLOPS | 1063 GFLOPS | 1789 GFLOPS |
Max. spotřeba | 160 W | 190 W | 286 W | 183 W | 289 W |
Délka karty | 24 cm | 24 cm | 27 cm | 27 cm | 27 cm |
Shader model | 4.1 | 4.1 | 4.1 | 4.0 | 4.0 |
Přetaktování doporučeno
Možná AMD zvolila kódové označení Hemlock právě kvůli rezervě pro přetaktování. Slovíčko unlock se v prezentacích Radeonu HD 5970 objevuje pořád dokola a AMD na obrázku, kteří fandové jistě už notoricky znají, nechává tvořit velká očekávání: 1 GHz pro jádro a 1500 MHz pro paměti (6 GHz efektivně) je umožněno už v ovladačích (Catalyst Control Center), k HD 5970 navíc AMD dodává svůj nástroj pro zvýšení napětí, abyste se na nějaké vyšší přetaktování mohli dostat i bez úprav BIOSu anebo odporů na PCB. Později se podíváme, jaká je praxe.
Teselace, DirectX 11 a Eyefinity
Radeony HD 5000 s jádry Cypress a Juniper mají hardwarovou teselační jednotku
("tesselator"), videoprocesor UVD druhé generace a i přímo v čipu
zahrnutý kompozitor pro Multi-GPU zapojení (CrossFireX). Dalším společným rysem všech dosavadních
Radeonů HD 5000 je podpora DirectX 11. Klíčové nové vlastnosti AMD
shrnula do následující tabulky:
Velmi dobrý a praktický test Eyefinity vydal nedávno web ComputerBase.de. Krom popisu nástrah a výhod najdete v odkazovaném článku
také výkon s Eyefinity na kombinaci deseti her, čtyř rozlišení (mimo
standardního 1920 × 1200 px právě Eyefinity rozlišení 2400 × 600, 3840
× 1024 a 5760 × 1200 px) a tří grafických karet (Radeon HD 5870, 5850, 5770 – 5970 ještě chybí, ale z výkonu ve 2560 × 1600 px oproti HD 5870 se dá také ledaccos usuzovat).
Mnoho
dalšího z architektury a technologií pak platí pro Radeony HD 5700
stejně jako pro Radeony HD 5800 a více jste se mohli dočíst v později
ještě výrazně aktualizované recenzi Radeonu HD 5870. Jmenovitě kupříkladu:
- dosud známé detaily o architektuře
- ilustrované možné přínosy DirectX 11 a teselace
- zapojení tří (až šesti) monitorů na jediný Radeon – Eyefinity
- zlepšené anizotropní filtrování a vliv "super-samplingu" na výkon
- herní výkon ve 13 hrách (vždy také s grafy průběhu fps ilustrujícími plynulost)
O výkonu dvoučipového Radeonu HD 5970 není třeba dlouze diskutovat. Pokud vám CrossFire v dané hře předvede alespoň průměrné škálování, jedná se o suverénního krále současných grafických karet. Parametry této karty a další zajímavé informace jste se mohli dozvědět už v aktualitě Ondry Bešťáka.
Sapphire HD 5970 obrazem, ilustrace rozměrů
Mimo délky karty si můžete prohlédnout třeba příslušenství čítající poctivou kabeláž, kupón na DIRT 2 a poté podle všeho beztak zdarma šiřitelnou Battleforge. Znovuobjevený Sapphire Redline je podle všeho pouze převlečenou utilitou ATI Overvoltage.
Necelých 31 cm je nakonec trochu lepší, než to podle prvních uniklých fotek vypadalo (mimochodem, karta z leaku na AlienBabelTech vypadala dost jinak, bůhví, co to bylo). Kdyby si ATI/AMD odpustila parádičky v podobě dvou červených plastů kolem průduchů a ještě tvar karty do špičky, mohlo to být 30 cm. A při této délce už může každý centimetr znamenat vleze/nevleze. Majitelé big towerů jsou v pohodě, kdo má middle tower asi už hledá metr. Na fotkách vidíte i srovnání se 27cm Radeonem HD 4870 X2 a stejně dlouhou (nebo v tomto kontextu spíš krátkou) GeForce GTX 260.
Díky pozici PCI Express ×16 slotu na desce Gigabyte EX58-UD5 a odnímatelnému koši pro pevné disky, jsem kartu do middle tower Cooler Master 534 (na této platformě jsou založeny snad desítky skříní dalších značek jako Apevia, Gigabyte, NZXT, ...) napresoval. Sice je trochu tlačena plechem dvou pevných 3,5" pozic, ale funguje. VelociRaptor zatím bude odpočívat na dně skříně, co bychom pro nejvýkonnější grafiku světa neudělali, že?
Testovací konfigurace
Hardware
- monitor: HP LP3065 (30", 2560 × 1600 px, S-IPS)
- procesor: Intel Core i7 920 (20× 166 MHz = 3,33 GHz, Turbo Boost: 3,5 GHz)
- základní deska: Gigabyte GA-EX58-UD5 (Intel X58)
- paměti: 6 GB Kingston DDR3-1866 (1000 MHz, 7-7-7-20, 1,5 V)
- pevný disk: Western Digital VelociRaptor VR150 (WD3000GLFS)
- optická mechanika: Lite-On DH-4O1S (Blu-ray, DVD-ROM)
- zdroj: Gigabyte Odin GT 800W (GE-S800A-D1)
- skříň: Cooler Master Centurion 534
- chladič CPU: Scythe Mugen 2 + Noctua NT-H1
- systémové větráky: Arctic Fan12 PWM + Cooler Master 12 cm @ 800 rpm
Pouze pro testy hlučnosti je použit jiný počítač (a noční klid):
- hlučnost okolí: 36,5 až 37,5 dBA (měřeno cca 20 cm od grafické karty, odejmutá bočnice skříně)
- pevné disky: WD7500AAKS a WD20EADS v boxech Acutake Dark Disc 2
- zdroj: Enermax Modu82+, 625 W
- skříň: Cooler Master Centurion 5
- chladič CPU: Noctua NH-U12P
- systémový větrák: Noctua NF-S12
Operační systém a ovladače
- Microsoft Windows Vista Ultimate (64bitová verze)
- ATI Catalyst 9.4 (změněný INF) pro Radeon HD 4670
- ATI Catalyst 9.5 pro Radeon HD 4730/4770/4850/4870/4890 a 4870 X2
- ATI Catalyst 9.10 beta pro Radeon HD 5870/5850 a 5750/5770 (8.66.6) i 5970 (beta 4)
- Nvidia GeForce 185.65 pro GeForce GTX 260/275/285
- Nvidia GeForce 185.85 WHQL pro GeForce 9500 GT/9600 GT/9800 GT/GTS 250
- Nvidia GeForce 190.62 WHQL pro GeForce GTX 295
Assassin's Creed (DX10.1), Call of Duty 5: World at War (DX9)
Assassin's Creed
Pro měření použijte FRAPS, do volby automatického vypnutí po nějakém čase zadejte 72 sekund. Ve hře nastavte všechny detaily na maximální hodnoty, vypněte vertikální synchronizaci. Anti-aliasing se nastavuje také ve hře (vzorkování) a hodnota 3/3 by měla odpovídat 4× MSAA. Ten si lze ale dopřát jen do rozlišení 1680 × 1050 px včetně.
Po nastavení musíte mít hru uloženu na začátku prvního města (Masyaf), dole u studny (můžete využít i můj profil právě s takovou uloženou pozicí). Poté od studny vyběhněte ulicí nahoru (snažte se vyhýbat srážkám s kolemjdoucími, malé škobrtnutí ale nevadí. Používejte běh (pravé tlačítko myši), ale ne sprint (mezerník)) až k sekvenci ukazující pevnost. Po jejím skončení se otočte a vraťte se k domu, na který vylezete po žebříku. Dojděte až na jeho roh tak, abyste viděli z města pod vámi co nejvíce. Takto setrvejte několik vteřin a logování FRAPS se samo vypne. I při seběvětší snaze o co nejpodobnější opakování je v měření jistá malá dávka nepřesnosti (při naučení se průchodu se lze vejít do chyby 2 %).
Call of Duty 5: World at War
Benchmark probíhá pomocí FRAPSu. Ten nastavte na 35 sekund. V možnostech hry aktivujte konzoli a do ní vepište devmap pel1b. Tím se dostanete na začátek mise Houževnatý (Relentless). Jakmile se tak stane, spusťte FRAPS. Po výskoku z vybuchlého tanku držte stále klávesu pro pohyb vpřed, FRAPS po chvíličce sám přestane logovat. Měření jsou opakovatelná s velmi malou odchylkou.
Crysis Warhead (DX10), Enemy Territory: Quake Wars (OpenGL)
Crysis Warhead
K otestování výkon v Crysis: Warhead používám utilitu Framebuffer Crysis Warhead Benchmarking Tool 0.31. Abych měl měření kompatibilní s ověřovaným (ranked) benchmarkem, nechávám volbu na mapě ambush a implicitním čase (v tomto případě noc). Používám rozhraní DirectX 10 a nastavení Gamer (hráč, odpovídá detailům high v původním Crysis). Beru výsledek druhého měření, kdy už je hra načtena v paměti. V tomtom druhém průběhu rovněž zaznamenám podrobný FRAPSLOG. Měření jsou opakovatelná s minimální odchylkou.
Enemy Territory: Quake Wars
Nové Enemy Territory představuje jedinou současnou moderní OpenGL hru pod Windows a zároveň jediný OpenGL test v testovací sadě. Quake Wars používají značně upravený Doom 3 engine, obohacený především o technologii MegaTexture (více o technologii v článku na Beyond3D). Pro testy používám maximální detaily, přes konzoli vypínám limit 30 i 60 fps, AA i AF zapínám ve hře.
Pro účely testování jsem si nahrál vlastní timedemo (recordtimenetdemo), které měří výkon v rozsáhlé lokaci se stromy (Valley). Timedemo (pro verzi 2.0) ke stažení: zde.
Far Cry 2 (DX10.1), Mirror's Edge (DX9, PhysX)
Far Cry 2
Pro testy jsem používal zabudovaný benchmark, test Ranch Medium. Výsledky v grafech jsou z plynulejšího ze dvou opakování. Používám režim DirectX 10 a maximální detaily. Anti-aliasing zapínám přes nabídku hry.
Více v článku Far Cry 2: výkon grafických karet a vliv nastavení.
Mirror's Edge
Přesné testování v Mirror's Edge je usnadněno naskriptovaným průchodem FlybyFlight (spustíte např. takto: "D:\Hry\Mirror's Edge\Binaries\MirrorsEdge.exe" -FlybyFlight), který prolétne pokaždé stejně části děje v epizodě Flight. Před spuštěním testu nastavte FRAPS na 62 vteřin, pak je důležité, abyste začali logovat hned po načtení lokace. V TdEngine.ini je třeba vypnout položku bSmoothFrameRate (nastavte na False), rozšířenou PhysX i maximální detaily zapínám přes menu hry.
Lokace v benchmarku je mimochodem také první místo hry, kde při skutečném hraní a zapnutou rozšířenou fyzikou bez akcelerace PhysX dojde k hrubým propadům výkonu. Více v článku Mirror's Edge, PhysX, GeForce, Radeony a procesory.
Race Driver GRID (DX9), S.T.A.L.K.E.R.: Clear Sky (DX10.1)
Race Driver GRID
FRAPS nastavte na vypnutí po 31 vteřinách. Po spuštění hry s nainstalovanou záplatou 1.2 zvolte v nabídce Race Day. Všechno mimo lokace (Location) a okruhu (Route) ponechte, tyto změňte na Milan a Castello Circuit B. V následující obrazovce vyberte start až za všemi dalšími auty (Grid Position: Back). Ihned po načtení trati spusťte FRAPS a startujte schválně pomalu: tak, abyste se drželi stále kousek za ostatními. To vydržte až do první prudší zatáčky, v níž akorát vyprší lhůta 31 vteřin a logování FRAPSu bude u konce.
Veškeré detaily jsou nastaveny na maximální hodnoty (Overall Detail: Ultra), anti-aliasing je zapínán rovněž přes menu hry. Změna rozlišení bohužel vyžaduje restart.
S.T.A.L.K.E.R.: Clear Sky
U pokračování hry ze zóny kolem Černobylu jsem si opět vystačil hned s prvním táborem. Tentokrát jsem měření zjednodušil a udělal jej jednak přesnějším a rovněž srovnatelným se serverem PC Games Hardware. Jinými slovy využívám uloženou pozici PCGH (Users\Public\Documents\stalker-stcs\savedgames), která nejenže obsahuje výkondrásající paprsky vycházejícího slunce (god rays), ale stačí u ní po načtená spustit FRAPS, držet klávesu W pro pohyb vpřed a FRAPS vypnout před naražením do plotu. Měření je tak poměrně dost přesné.
Používám takřka plné detaily, náročný režim Enhanced full dynamic lighting (DX10), všechny legrace jako SSAO zapnuty. Jen anti-aliasing průhlednosti už nezapínám. Zapnutí či vypnutí anti-aliasingu vyžaduje restart hry, rozlišení nikoli.
Enhanced full dynamic lighting je režim, který umožní zapnout několik funkcí jako třeba Volumetric Smoke či Wet Surfaces (více v tomto srovnání). U karet ATI Radeon zapínám podporu DX10.1 (zlepšuje výkon, obraz nechávám při stejném nastavení), anti-aliasing průhlednosti budou snad stíhat grafické karty nějaké další generace. Jen pro zajímavost: DX10.1 režim tohoto A-tested objects vyhlazování je asi hezčí, ale náročnější.
The Elder Scrolls IV: Oblivion (DX9), Tom Clancy's H.A.W.X. (DX10.1)
The Elder Scrolls IV: Oblivion
Čtvrtý díl série Elder Scrolls patří i přes svůj věk stále mezi nejnáročnější hry vůbec. Zvlášť, když stejně jako já v testu, vyberete lokace s množstvím vlnící se trávy, pohupujících se stromů a přesto rozhledem do vzdálené krajiny (The West Weald). Testuji s maximálními detaily a HDR. Soubor s nastavením (vše na maximum) a uložená testovací pozice ke stažení: zde.
Anti-aliasing i anizotropní filtrování vynuťte v ovladačích, v souboru Oblivion.ini se přesvědčte, že máte vypnutou vertikální synchronizaci (iPresentInterval=0). Po spuštění hry si nahrajte mou uloženou pozici číslo 260 a po načtení ihned začnětě logování FRAPSem a pohyb vpřed. Držte stále klávesu pro pohyb vpřed, dokud se neobjeví nápis upozorňující na to, že dále už nemůžete. Když nastavíte automatické vypnutí FRAPSu po 34 vteřinách, nic taky nezkazíte.
Tom Clancy's H.A.W.X. (DX10.1)
V arkádovém simulátoru bojových letadel lze využít nejen DirectX 10 pro efekty jako SSAO či volumetrické paprsky, ale také DirectX 10.1. Tuto revizi lze použít jak pro zrychlení hry na kartách, které ji podporují (což činím), nebo pro zlepšení obrazu nastavením SSAO na very high (což kvůli porovnatelnosti výsledků s kartami bez podpory DirectX 10.1 nečiním).
V nabídce s grafikými nastaveními je i tlačítko spouštějící zabudovaný benchmark, což v praxi znamená oblet města. Průběh loguji samozřejmě i FRAPSem, výstupem benchmarku jsou totiž jen dvě celočíselné hodnoty (průměrné a trošku nepochopitelně rovněž maximální fps).
Trackmania Nations Forever (DX9), World in Conflict (DX10), Zaklínač (The Witcher) (DX9)
Trackmania Nations Forever
Trackmaniu hraje nejen ve světě, ale i v ČR obrovský počet hráčů, hra má navíc zabudovanou možnost benchmarku. Ten používám pro realistické a současně přesné měření i já. Detaily mám nastaveny na maximální hodnoty, anti-aliasing i anizotropní filtrování zapínám přímo přes možnosti hry a nastavením stínů na komplexní překračuji nejnáročnější předdefinovaný profil.
World in Conflict
Testuji s upraveným profilem very high details (zapnul jsem i water reflects clouds (voda odráží oblaka), anizotropní filtrování navýšil na 16×). Používám vestavěný benchmark.
Zaklínač (The Witcher)
Opakovatelné testování v Záklínačovi není úplně jednoduché. Pro měření je samozřejmě používán nástroj FRAPS, detaily i anti-aliasing a anizotropní filtrování nastavuji v nabídce hry. Verze hry 1.3 a grafické karty s více jak 512 MB paměti by měly nabídnout i 4× AA přímo ve hře. U karet Nvidia GeForce funguje spolehlivě i vynucení anti-aliasingu v ovladačích, u karet ATI Radeon bohužel ne. Jakmile v ovladačích zvolíte 4× AA (MSAA, Box), vypne se anti-aliasing ve hře. A to bez ohledu na to, zda jej máte v menu hry zapnutý či vypnutý.
Každopádně po načtení uložené pozice z Lesa na Blatech se otočte přímo na vstupní bránu do háje druidů, stiskněte klávesu pro pohyb vpřed a současně odstartujte logování FRAPSu (typicky F11). Projděte co nejpříměji, vyhněte se co nejmenším úkrokem ze směru. Logování vypněte v bažině, kde už opravdu dále směrem kupředu jít nejde. Měření jsou opakovatelná s překvapivě malou odchylkou, problémem je jen počasí. Jakmile načtete uloženou pozici a na Blatech prší, rovnou ji nahrajte znovu a doufejte ve vyčasený den (častější případ). Výkon karet je při deštivém počasí nižší. Při benchmarkování používám pohled přes rameno (F3).
Více v článku Zaklínač (The Witcher) vs. hardware: tweakguide.
3DMark Vantage
3DMark Vantage
Zájemci o v 3DMarku Vantage použité technologie jejich popis najdou v tomto whitepaperu (PDF). V grafech najdete pouze výsledky z GPU testu.
Radeon HD 5970, 2× 1024 MB, Performance:
Radeon HD 5970, 2× 1024 MB, Extreme:
2× Radeon HD 5970 (CrossFireX), 2× 1024 MB, Performance:
2× Radeon HD 5970 (CrossFireX), 2× 1024 MB, Extreme:
Radeon HD 5770, 1024 MB, Performance:
Radeon HD 5750, 1024 MB, Performance:
Radeon HD 5850, 1024 MB, Performance:
GeForce GTX 295, 2× 896 MB, performance, GeForce PhysX On:
Radeon HD 5870, 1024 MB, performance:
Radeon HD 4870, 1 GB, Performance:
GeForce GTX 285, 1 GB, Performance:
GeForce GTX 275, 896 MB, Performance:
Radeon HD 4890, 1 GB, Performance:
GeForce 9600 GT, 512 MB, performance:
Radeon HD 4730, 512 MB, performance:
Radeon HD 4830, 512 MB, Performance:
Radeon HD 4770, 512 MB, Performance:
CrossFire Radeon HD 4770, 512 MB, Performance:
Radeon HD 4670, 512 MB, Performance:
SLI GeForce GTX 260, 896 MB, Performance (GPU PhysX On):
GeForce GTX 260 (SP216), 896 MB, Performance:
SLI GeForce 8800 GT, 512 MB, Performance (GPU PhysX On):
GeForce 8800 GT, 512 MB, Performance (CPU PhysX):
GeForce 8800 GT, 512 MB, Performance (GPU PhysX):
GeForce GTS 250, 1 GB, Performance (s PhysX – ovlivňuje CPU score i celkové skóre):
Radeon HD 4850, 1 GB, Performance:
GeForce 9800 GTX+, 512 MB, Performance:
Radeon HD 4850, 512 MB, Performance:
Stalker: Call of Pripyat a Radeony HD 5970 v CrossFire
Pokud jste četli sobotní článek, můžete tuto kapitolu směle přeskočit.
Stalker: Call of Pripyat a Radeony HD 5970 v CrossFire
Stejně jako Clear Sky, i další díl série S.T.A.L.K.E.R., Call of
Pripyat, se dočkal po vydání hry i samostatného benchmarku. Tento
zdarma šířený 421MB soubor můžete stáhnout buď GSC (výrobce) od anebo lépe z techPowerUp!. Své výsledky posílejte do připraveného vlákna v diskuzním fóru.
Většina výsledků (až na poslední) v grafu je z přednastavení Ultra a jako renderer je použit Enhanced full dynamic lighting (DX11). Rozdíl výkonu při nastavení týchž detailů, ale DX10, je v grafu rovněž vidět.
Téměř v nejnáročnějším nastavení (jen HDAO má ještě jednu vyšší úroveň) ...
...jsem srovnal jeden Radeon HD 5970:
s CrossFireX zapojením těchto dvou obrů:
Kromě posledního testu je škálování se třetím a čtvrtým GPU nevysoké, ale v náročných slunečních paprscích je více jak 100 %. Jak to? Tentokrát je to chybou, která nejspíše může umožnit i podvádění v tomto benchmarku. Během dlouhého testu v Pripyat se horní Radeon HD 5970 zahřál natolik, že Catalyst zavolaly VPU Recover. Benchmark ale dojel, nicméně s nekorektním výsledkem v poslední části. Při dalších opakováních byly výsledky pro změnu nižší než 33 fps s jedním HD 5970; jednoduše bych musel nějak řešit chlazení.
Spojení dvou Radeonů HD 5970 do CrossFire – 6400 stream procesorů
Jak už jste viděli kousek výše, oba Radeony jsem po vyjmutí koše pro disku do middle tower skříně Cooler Master Centurion 534 nacpal. Bohužel základní deska Gigabyte EX58-UD5 má celkem tři sloty PEG, proto vzdálenost mezi nimi je o jeden slot kratší, než by dvouslotové Radeony pro nějaké to rozumné dýchání potřebovaly.
GPU-Z potvrzuje CrossFireX dvou Radeonů HD 5970 a celkem 4 GPU účastnící se vykreslování 3D scény. Zobrazeny jsou taky karty, z níž vede DVI kabel do monitoru: Sapphire má takt čipu i pamětí o 10 MHz vyšší než referenční karta ATI.
Zatímco jádra v horní kartě s malým prostorem pro nasávání (a ještě k tomu teplého vzduchu od spodní karty) mají kolem 80 stupňů Celsia i v idle...
... grafickým procesorům ve spodním Hemlocku nijak velké horko není:
Screenshot típnutý těsně po zátěži ve FurMarku dokazuje, že více jak 100 stupňů Celsia není výjimkou, konkrétně v tomto případě bylo maximem 107 stupňů Celsia (VPU Recover ale ještě zavolán nebyl).
Vyzkoušel jsem škálování CrossFire v několika náročných hrách a nastaveních, ve Far Cry 2 už byl limitem procesor, v Crysis Warhead spíše už nedocházelo ke škálování (a ve 2560 × 1600 nepracoval už multi-sampling) s více jak dvěma GPU Cypress, ArmA II si s CrossFire zřejmě vůbec netyká, zato nezklamal OpenGL Enemy Territory: Quake Wars s vysokými stupni anti-aliasingu (4× MSAA skrze hru + super-sampling v ovladačích Catalyst dávají opravdu i obrazově pěkné výsledky, později snad přinesu nějaké screenshoty) či oba Stalkery anebo DX11 benchmark Unigine Heaven.
K testům mám ještě pár poznámek: spotřeba v zátěži se při testech Stalker: Clear Sky a Call of Pripyat pohybovala běžně kolem 485 W (a procesor zde také není tolik vytížen), reltivně nízká spotřeba ve FurMarku je dána tím, že čtyři GPU zde nejsou dobře vytížena.
Hlavním zjištěním ale bylo, že i když se snímkové frekvence ve Stalkerech i Unigine Heaven pohybovaly celkem stále kolem 45 fps, výsledný dojem plynulosti odpovídal asi tak 10 fps. Radikálně se to zlepšilo po zapnutí vertikální synchronizace (VSYNC ON), která je zřejmě pro synchronizaci multi-GPU velmi důležitá.
Dobrým důkazem aktivních čtyř GPU v CrossFireX je i 3DMark Vantage, nejdříve podrobné výsledky jediného HD 5970 (dvě GPU):
a následně dvou HD 5970 (čtyř GPU):
Unigine Heaven: DirectX 11 pastva pro oči
Stalker: Call of Pripyat s maximálními detaily nevypadá vůbec špatně, ale i díky až trošku přehnané „hrbolatosti“ dosažené díky teselaci mě uchvátil spíše Unigine Heaven. Velmi pěkně je podle mě ztvárněna také tráva (chce to vidět v pohybu), ta ale zůstává ve stínu teselovaných povrchů. Je pravda, že jak si jednou projedete benchmark s teselací, už na vás bez ní působí dost ploše a nezajímavě.
Budete-li mít zájem prozkoumat screenshoty ve 2560 × 1600 px (DX11, 4× MSAA, teselace), stáhněte si je na počítač v tomto ZIPu (11 MB). Škoda jen, že legrace pro plynulý provoz takovéhoto nastavení, tedy dva Radeony HD 5970, stojí od 26 000 Kč nahoru a i kdybyste na to ty peníze nakrásně měli připravené, stejně je nemáte šanci koupit. To ale určitě fandy grafických karet neodradí od těšení se na podrobnou recenzi HD 5970: vždyť o některých autech si také jen čteme.
Přetaktování: od teorie k praxi
Teorie
V AMD se zřejmě osvědčila strategie oslovení hardwarových nadšenců započatá s Phenomy II X4 Black Edition a Radeon HD 5970 jde podobnou cestou. Napěťové regulátory Volterra jsou sice schopné, ne zrovna levné, ale na druhou stranu nejsou novinkou HD 5970. To 5GHz GDDR5 na předchozí generaci nebyly a AMD vyzdvihuje i použití kvalitních kondenzátorů na referenčním návrhu. Výběr lepších jader pro HD 5970 se dá čekat (možnosti chladiče nejsou neomezené a jádra jsou přeci jen dvě), pasiv byl obohacen o technologie vapor chamber.
Klepněte na náhled pro zvětšení
Další slajd od AMD je střízlivější než ten, který jste viděli v první kapitole a hlavně je velice praktický. Ukazuje totiž, o kolik si pomůžete v určitých hrách a nastaveních přetaktováním GPU (ze 725 na zhruba 865 MHz) a poté dotaktováním pamětí ze 4 na 4,8 GHz.
Praxe
Do přetaktování se můžete pustit buď s Catalyst Control Center (záložka Overdrive vás, jak jsem předeslal, nechá jít až na 1000/6000 MHz pro jádro/paměti efektivně), nebo třeba s MSI Afterburner 1.4.1. Pro zvýšení napětí jádra můžete použít opatrnou OverVolt Tool od ATI, nebo drsnější Afterburner. Zvyšovat napětí u pamětí lze pouze v nástroji od ATI.
Kartu jsem při přetaktování chladil ještě 12cm ventilátor s 2200 rpm. Když jsem jej takto podobně postavil ke dvěma Radeonům HD 5970 v CrossFire, klesla i spotřeba v idle ze 192 na 183 W.
Průběh taktování vypadal nějak takto:
- 800 MHz jádro, paměti 1 GHz, základní napětí – 3DMark06 Canyon Flight s MSAA i Crysis (DX10, enthusiast) proběhly bez chyby
- 900 MHz jádro, paměti 1 GHz – max. napětí přes utilitu od ATI (1,16 V) stačilo pro 3DMark, nikoli pro Crysis
- 900 MHz pro jádro, paměti stále na základu, 1,2 V přes Afterburner – stabilní i Crysis
- 1000 MHz pro jádro, mem def., 1,25 V – 3DMark ok, Crysis padá
- 1000 MHz pro jádro, 1,287 V – projede i Crysis, když ale začnu taktovat i paměti, musím jet na doraz: 1,299 V
- jádro základ, paměti 1315 MHz (5,26 GHz efektivně!) – 3DMark06 bez problémů i s MSAA, Crysis padá
- 1315 MHz pro paměti, 1,15 V pro paměti v ATI OverVolt – projede i Crysis
Vliv anti-aliasingu na výkon
Radeon HD 5970
O tom, že i v náročné hře jako Far Cry 2 je 8× MSAA v 1920 × 1200 px zcela plynulou záležitostí, vás přesvědčí graf průběhu z testu:
(červená je bez MSAA, zelená = 2× MSAA, modrá = 4× MSAA, žlutooranžová = 8× MSAA)
Crysis Warhead (DX10) | Far Cry 2 (DX10.1) | ET: QW (OpenGL) | |
1920 × 1200 | 65,9 | 120,4 | 129,1 |
1920 × 1200, 2× AA | 61,0 | 107,7 | 126,0 |
1920 × 1200, 4× AA | 58,6 | 97,3 | 124,1 |
1920 × 1200, 8× AA | 47,9 | 71,5 | 105,8 |
GeForce GTX 295
Optimum 4× MSAA je zjevné, 8× MSAA pak opravdu bolí:
Crysis Warhead (DX10) | Far Cry 2 (DX10.1) | ET: QW (OpenGL) | |
1920 × 1200 | 58,9 | 82,6 | 141,6 |
1920 × 1200, 2× AA | 51,1 | 79,4 | 130,4 |
1920 × 1200, 4× AA | 46,9 | 74,7 | 124,9 |
1920 × 1200, 8× AA | 22,2 | 44,7 | 90,7 |
Radeon HD 5870
Hodnota u nastavení s 2× MSAA v ET:QW si evidentně žádá přeměření (provedu při prvním návratu HD 5870 do redakce).
Crysis Warhead (DX10) | Far Cry 2 (DX10.1) | ET: QW (OpenGL) | |
1920 × 1200 | 50,3 | 82,5 | 128,6 |
1920 × 1200, 2× AA | 44,2 | 72,9 | 109,1 |
1920 × 1200, 4× AA | 42,0 | 64,1 | 107,2 |
1920 × 1200, 8× AA | 33,8 | 48,6 | 84,4 |
1920 × 1200, 4× SSAA | N/A | N/A | 55,2 |
Radeon HD 5850
Crysis Warhead (DX10) | Far Cry 2 (DX10.1) | ET: QW (OpenGL) | |
1920 × 1200 | 42,4 | 69,3 | 120,3 |
1920 × 1200, 2× AA | 37,8 | 62,5 | 101,6 |
1920 × 1200, 4× AA | 35,9 | 55,4 | 91,3 |
1920 × 1200, 8× AA | 29,4 | 43,6 | 77,9 |
GeForce GTX 285
Crysis Warhead (DX10) | Far Cry 2 (DX10.1) | ET: QW (OpenGL) | |
1920 × 1200 | 40,4 | 56,1 | 121,0 |
1920 × 1200, 2× AA | 34,9 | 53,0 | 100,6 |
1920 × 1200, 4× AA | 33,1 | 49,5 | 91,1 |
1920 × 1200, 8× AA | 23,4 | 41,3 | 62,9 |
Radeon HD 5770
Crysis Warhead (DX10) | Far Cry 2 (DX10.1) | ET: QW (OpenGL) | |
1920 × 1200 | 24,8 | 45,3 | 75,4 |
1920 × 1200, 2× AA | 21,8 | 39,1 | 57,5 |
1920 × 1200, 4× AA | 20,8 | 33,6 | 53,6 |
1920 × 1200, 8× AA | 18,0 | 28,3 | 43,5 |
Radeon HD 5750
Crysis Warhead (DX10) | Far Cry 2 (DX10.1) | ET: QW (OpenGL) | |
1920 × 1200 | 29,1 | 53,3 | 88,0 |
1920 × 1200, 2× AA | 25,4 | 45,4 | 70,0 |
1920 × 1200, 4× AA | 24,2 | 38,6 | 62,1 |
1920 × 1200, 8× AA | 20,6 | 28,9 | 50,6 |
Enemy
Territory: Quake Wars je jednou z her, která umožňuje mnoho režimů
anti-aliasingu zapnout přímo v menu. To je mimochodem v dnešní době
také lepší, protože to jednak správně funguje a také globální vynucení
v ovladačích není pohodlné pro ty, kdo střídají hraní více her. Jedině
CFAA režimy Radeonu musíte bez ohledu na hru vždy vynucovat v
ovladačích.
Současné
GeForce nabízí kromě standardních režimů anti-aliasingu (tedy 2×, 4×,
8× rotated grid multi-sampling) ještě tzv. CSAA (Coverage Sampling
Anti-Aliasing). Jeho režimy se liší počtem ukládaných vzorků (barva, Z,
textura), stručně by se dalo říct, že třeba 16× CSAA by mohlo být
kvalitativně lepší než 4× MSAA, ale povětšinou horší než 8× MSAA.
Výkonnostně je z podstaty své funkce ale blíže 4× MSAA. U GeForce GTX
nechybí ani režimy transparency multi-sampling a super-sampling pro
anti-alias průhledných textur (tráva, listí, stromy). Zatímco první
není kolikrát ani poznat, druhý je sice vizuálně bezva, ale dopad na
výkon bývá drastický.
Radeony
je na tom se základní výbavou podobně. Stejné režimy multi-samplingu
(zajímavý 6× sparse odešel společně s Radeony X1950, tedy generací
R520/R580), obdobné režimy anti-aliasu průhledných textur (jen se
jmenují adaptivní vyhlazování kvalita/výkon). Radeony HD 4800 nemají
žádné CSAA, ale CFAA. Custom Filters Anti-Aliasing sice není až tak
custom, jak byste možná doufali, zato mezi mnoha ostatní skrývá dva
poklady. Zatímco wide tent a narrow tent se většině lidí nelíbí kvůli
možnému rozmazávání (některé weby vzpomínaly na ošklivý Nvidia
Quincunx), režimy edge-detect (12× a 24×, tedy čtyři vzorky plus
detekce hran, resp. osm vzorků s detekcí hran) jsou jiná káva. 24× CFAA
(edge-detect) je dost možná vůbec nejkvalitnější dostupný režim
anti-aliasingu na herních grafikách.
Měření ve vysokých rozlišeních, DX11, verdikt
To úplně nejdůležitější jsem si nechal na poslední kapitolu a není to tentokráte verdikt, ale jsou to měření mimo obvyklou metodiku: ve vysokých rozlišeních či v nově příchozích DirectX 11 benchmarcích a demech. Něco jste mohli už vidět v kapitole se Stalkerem: Call of Pripyat a dvěma Radeony HD 5970 v CrossFire.
Kde jsou měření obvyklou metodikou, kde je spotřeba, hlučnost...
V tomto článku nenajdete běžné pruhové grafy ze 13 her, na které jste zvyklí. Nenajdete zde ani Radeon HD 5970 srovnán po stránce hlučnosti, teploty GPU či spotřeby s dalšími mnoha grafickými kartami. To vše, navíc se snad komfortními interaktivními grafy obsahuje včerejší článek: Žebříček 28 grafických karet (v interaktivních grafech)
Teď si ukážeme srovnání s nejvýkonnější jednočipovou kartou ATI (HD
5870) a Nvidia (GTX 285). GeForce GTX 295 jsem bohužel neměl k
dispozici a redakční Radeon HD 4870 X2 nepřežil montáž Accelera Xtreme od u mě nyní neoblíbené společnosti Arctic Cooling (na stěžovací dopis jsem dosud nedostal odpověď).
Upozornění: neberte nárůsty výkonu s Radeonem HD 5970 oproti HD 5870 jak škálování CrossFire. Nárůsty lze srovnávat spíše s Radeonem HD 5850, neboť třeba test na Hardware.fr prokázal, že dva Radeony HD 5850 v CrossFireX jsou výkonnější než jeden HD 5970 (ač specifikacemi silnější, přece jen má k dispozici méně PCIe linek).
Při studiu výsledků v Žebříčku 28 grafických karet vás možná zarazilo pár výsledků, zde je k nim vysvětlení:
- Assassin's Creed – bohužel, Radeony HD 5000 nepředvádějí zřejmě vinou ovladačů stejně dobrý výkon jako řada HD 4000, a to ani ve verzi 1.01 (DX10.1), ani ve 1.02 (DX10)
- Call of Duty: World at War – CrossFire by pomohl, nebýt výbůchů: ty jakmile začnou, jdou výkony CrossFire řešení pod úroveň single karet (je to vidět i na grafu průběhu fps)
- Crysis Warhead, ET:QW a Far Cry 2 – především ve vyšších rozlišeních dobré škálování
- Mirror's Edge – bez PhysX na výkonných kartách více jak 100 fps, s PhysX benchmark GeForce anebo procesoru
- Race Driver GRID – nejvýkonnější Radeony jsou již limitovány procesorem
- The Elder Scrolls IV: Oblivion – nutno přejmenovat na Crysis.exe pro nějaké škálování CrossFire, výkon za očekáváním (vzhledem k tomu, kam už se dostala řada HD 4000)
- Tom Clancy's HAWX – CF funguje, výkon řady HD 5000 je oproti HD 4000 stále za očekáváním
- Trackmania Nations Forever – nutno přejmenovat na FEAR.exe, poté je tu jistý nárůst výkon s CrossFire
- World in Conflict – bezproblémové škálování, dobrý výkon
- Zaklínač (The Witcher) – i s Catalyst 9.11 WHQL stále zmíněné chyby v obraze, slabší výkon proti řadě HD 4000
Verdikt
Ač obecně nemám Multi-GPU karty příliš rád, nutno přiznat, že testování Radeonu HD 5970 mě bavilo. Bylo opravdu zábavné i na 30" LCD panelu hledat nějaké praktické scénáře (2560 × 1600 px s 8× MSAA za příliš praktický scénář nepovažuji; možná jen jako simulaci výkonu vyššího stupně anti-aliasingu s počtem pixelů podobným některým z Eyefinity rozlišení), které dostanou HD 5970 na kolena. Her, které to dokážou, není opravdu mnoho a dají se spočítat na jednomu člověku patřících prstech.
Radeon HD 5970 nebude pro běžné uživatele: bude tu stát jako možnost pro ty, kdo mají k dispozici zobrazovací zařízení s velmi vysokým rozlišením anebo hrají spíše pomalejší „kochací“ hry s maximalním nastavením. Je hezké, že kromě velkého prostoru ve skříni už nepotřebujete supersilný zdroj a za zbytečně neprohříváte skříň grafikou, co by odebírala 120 W v idle. Naopak, měření prokázala, že oněch AMD uváděných cca 40 W v idle je údaj pravdivý a to je pro výkonnou Multi-GPU kartu veliký úspěch. Nakonec nebudete muset hrát ani se sluchátky, jelikož otáčky ventilátoru jsou řízeny s ohledem na vaše uši. Jen u testované karty to trochu pokazila vrčící motůrek ventilátoru, vada, na níž jsem narazil už u dvou testovaných HD 4800 se stejným větrákem.
Na Radeonu HD 5970 mě ve skutečnosti mrzí jen dvě věci: žádné Multi-GPU řešení neškáluje vždy ve všech hrách a situacích a ATI/AMD stále odmítá zavést uživatelsky definovatelné profily pro jednotlivé hry jako má Nvidia u SLI. Musíte tak čekat buď na opravu v ovladačích anebo zkoušet všelijaké přejmenování spouštěcího souboru. Tou druhou věcí je fakt, že vydání HD 5970 v listopadu 2009 je vzhledem k zoufalé nedostupnosti Radeonů HD 5800 opravdu jen na dělání ramen. Na druhou stranu, krok je to pochopitelný, na první místa v grafech a testech lidé slyší a díky takovým kartám jako HD 5970 se pak prodají i ty méně výkonné, ale již dostupné Radeony.
Sapphire Radeon HD 5970, 2× 1024 MB
+ nejvýkonnější grafická karta současnosti
+ vzhledem k výkonu nízká spotřeba
+ rezerva pro přetaktování
+ DirectX 11, Eyefinity
+ libuje se ve vysokých rozlišeních
+ super-sampling je nezřídka plynulý i ve vysokých rozlišeních
+ aktuálně nejmenší zlo mezi Multi-GPU (i jeden Cypress přinejhorším stačí)
- Multi-GPU/CrossFireX
- jen 1024 MB paměti pro jádro
- velmi dlouhá karta
- u testované karty vrčel motorek větráku (může platit pro více karet)
- špatná dostupnost