Jeden, dva, tři kajmani – test HD 6970 v CrossFireX

22. 2. 2011

Sdílet

 Autor: Redakce

Tři plus šest je... 790 W

Když se mi tu společně se šestijádrovým Core i7-980X sešly tři Radeony HD 6970, tak jsem neodolal a využil příležitosti vyzkoušet, zda spolu dokážou komunikovat podobně dobře jako u CrossFireX ze dvou Radeonů.

Novou generaci Radeonů není zapotřebí znova rozebírat, pokud vám něco uteklo, rovnou vás odkážu na podrobný popis nové architektury v článku AMD Cayman (HD 6900): architektura a technologie.

Pro testování jsem využil referenční Radeon HD 6970 přímo od AMD a „kufříkový“ Radeon HD 6970 od Sapphire, který byl rovněž v referenčním provedení (jeho podrobnou recenzi a srovnání s ostatními kartami najdete v recenzi Radeon HD 6970: Nejvýkonnější Cayman v testu:

A konečně monstrózní Radeon HD 6970 DirectCU II, na který připravujeme recenzi:

Radeon od Asusu má takt jádra o 10 MHz vyšší než zbývající dvě karty, v praxi je ale rozdíl ve výkonu neměřitelný. Spíše než rozdíl v taktech by paradoxně mohl být problém v účinnějším chlazení, resp. méně výkonných chladičích referenčních karet, ale o tom až dál.

Ostatně, u CrossFireX není vyloučená ani kombinace různých modelů karet se stejným jádrem (byť v různě ořezaných variantách). Přímo AMD nám nabízí i přehlednou tabulku, které kombinace karet v CrossFireX jsou možné a které lze doporučit.

U karet vyšší střední a vyšší třídy je zapotřebí využít interního můstku (žluté obdélníčky), modely střední a nižší střední třídy pak můstky nevyžadují (béžové obdélníčky), ale mohou spolu komunikovat pouze sběrnici PCIe .

Se třemi kartami bych narazil… na dno skříně. Tříslotová Asus HD 6970 DirectCU II přesahuje desku o šíři jednoho slotu. Rozmístění PCIe slotů na desce nedovoluje při CrossFireX osadit tříslotovou kartu jinam než do spodního slotu. Pod deskou formátu ATX už ale v CM Centurion v naší sestavě není dost místa, proto jsem měl desku položenou mimo skříň a zapojenou na „mimotělní oběh“.

Už z fotky je patrné, že kryt chladiče s jednoduchým tvarem kvádru není pro chlazení stěsnaných a už tak hodně horkých Radeonů HD 6970 zrovna ideální řešení. Škvíra mezi dvěma kartami má jen pár milimetrů. Masivní kovový rozvaděč tepla na spodní straně karty, který kartě na tloušťce přidá i nad slotem, není v tomto případě také ku prospěchu věci.

Použitá základní deska Gigabyte EX58-UD5 není vybavená žádným přídavným PCIe rozbočovačem, ale spoléhá jen na linky, kterými disponuje čipová sada Intel X58. V případě dvou karet to ještě stačí na konfiguraci 2× PCIe ×16, se třemi kartami už se ale šestnáct linek z druhého slotu rozdělí mezi druhý a třetí a karty běží v režimu 1× PCIe ×16 + 2× PCIe ×8.

Testovací sestava

Testovací konfigurace

Podrobný popis testovací sestavy najdete v článku Ze zákulisí: nové sestavy pro měření grafik a hlučnosti. Testoval jsem na hotfix verzi ovladačů AMD Catalyst 11.1a. Ve stávající verzi 11.2 podle release notes k žádným změnám, které by byly v případě naší konfigurace a testovaných titulů podstatné.

V grafech tentokrát nenajdete srovnání všech naměřených karet – jednak se zajímáme především o škálování v CrossFireX, jednak je ještě nemám přeměřené na nové sestavě. Pro orientaci jsem alespoň doměřil v současnosti ještě nejvýkonnější kartu Nvidie – GeForce GTX 580.

Základní deska Gigabyte EX58-UD5 je osazená „extrémním“ šestijádrovým Core i7-980X. Procesor je přetaktovaný na 3,8 GHz při napětí zvýšeném na 1,344 V (podle CPU-Z).

V BIOSu jsou vypnuté úsporné technologie. Důvod je opět jednoduchý – co nejvíce omezit vliv procesoru při měření spotřeby grafické karty. Kvůli snížení chyby při měření, ke kterým by jinak docházelo kvůli automatickým a nevyzpytatelným změnám taktovací frekvence, je vypnutý TurboBoost.

testovací sestavy 27

Paměti DDR3-1600 běží na 1360 MHz při časování 8-8-8-22-1T a 1,64 V.

Procesor chladí výkonný Coolink Corator DS, který můžete znát z testu zveřejněného na ExtraHardware.

„Levný“ Centurion od Cooler Master se k podobné sestavě na pohled ani trochu nehodí, ale jde o skříň s typickou (a stále ještě nejčastěji používanou) koncepcí a konfigurací chlazení. V bočnici jsem zalepil otvor v místě chladiče procesoru – při použitém chladiči procesoru a daném uspořádání systémového chlazení nadělal víc škody než užitku.

testovací sestavy 23

Vepředu je 1000otáčkový Cooler Master dodávaný se skříní. Zadní systémový ventilátor Nanoxia FX12 (možná si jej ještě pamatujete z naší recenze) může v případě potřeby běžet až na 2000 ot./min, pomocí panelu je zregulovaný na 1500 ot./min, při kterých je aerodynamický hluk ještě únosný.

O napájení se stará 920W Enermax Revolution 85+ má vysokou účinnost, nabízí vysoký výkon a umožňuje i bezproblémový provoz řešení postavených na 3-way SLI či CrossFireX ze tří karet. Při časté manipulaci se náramně hodí odpojitelná kabeláž, která ve skříni zbytečně nepřekáží. K samotnému průvanu ve skříni zase tolik nepřispívá, ventilátor obvykle běží v rozmezí 800-900 ot./min.

Pevný disk VelociRaptor VR150 (WD3000GLFS) s kapacitou 300 GB používáme především kvůli rychlejšímu načítání her.

testovací sestavy 28

 

Procesor

Intel Core i7-980X

základní parametry

počet jader / vláken 6 / 12
taktovací frekvence 3,33 GHz
násobič 25×
TurboBoost až 3,6 GHz, násobič 1/1/1/1/2/2
cache 12 MB

použité nastavení

taktovací frekvence 3,8 GHz (28 × 136 MHz), 1,344 V, vypnutý HyperThreading, TurboBoost a C1E/EIST

recenze

Šestijádrový Intel Core i7-980X (Gulftown) v testu
Intel Za zapůjčení procesoru děkujeme společnosti Intel

 

Základní deska

Gigabyte GA-EX58-UD5

základní parametry

patice LGA 1366
čipová sada Intel X58, ICH 10R
paměťové sloty 6× DDR3, max. 24 GB
PCIe sloty, PCI sloty 3× PCIe ×16 (16+16+1/16+8+8), 1× PCIe x4, 1× PCIe ×1, 2× PCI
podrobné specifikace viz specsheet

recenze

Gigabyte EX58-UD5: výkon s Ultra Durable 3
Za zapůjčení základní desky děkujeme společnosti Gigabyte
 

 

Paměti

Kingston KHX1600C7D3K3/6GX (3× 2 GB)

základní parametry

typ DDR3
taktovací frekvence 1600 MHz
časování 7-8-7-20
napájecí napětí 1,65 V
udávaná spotřeba 1,8 W na modul
podrobné specifikace viz specsheet

použité nastavení

takt/časování 1360 MHz, 8-8-8-22-1T, 1,64 V
Kingston Za zapůjčení pamětí děkujeme společnosti Kingston

 

Pevný disk

Western Digital VelociRaptor VR150 (WD3000GLFS)

základní parametry

kapacita 300 GB
otáčky 10 000 ot./min
rozhraní SATA 3 Gb/s
vyrovnávací paměť 16 MB
průměrná přístupová doba (čtení/zápis) 4,2 ms / 4,7 ms
podrobné specifikace viz specsheet
  Za zapůjčení pevného disku děkujeme společnosti Western Digital

 

Optická mechanika

Lite-On DH4O1S

základní parametry

typ BD-ROM
podporované formáty [BD] BD-R, BD-RE , BD- ROM , BD-R DL , BD-RE DL , BD- ROM-DL
[DVD] DVD Video, DVD-5, DVD-9, DVD-10, DVD-18, DVD+RW 4.7GB, DVD+R 4.7GB, DVD-RW 4.7GB (closed session), DVD-R 4.7GB, DVD+R9
[CD] CD-DA, RAW, CD-ROM XA (m1,m2,m2f1/m2f2), CD-R, CD-RW, CD-PLUS, CD-I
rychlost čtení BD-R/RE/ROM/SL/DL : 4× CAV
DVD +R/-R SL : 12×
DVD +R/-R DL : 8×
DVD +RW/-RW SL :

DVD-9 : 8×
CDR/CDRW : 32×
podrobné specifikace viz specsheet
Za zapůjčení optické mechaniky děkujeme společnosti LiteOn

 

Zdroj

Enermax Revolution 85+ ERV920EWT-00, 920 W

základní parametry

celkový výkon 920 W
špičkový výkon 1010 W
podrobné specifikace viz specsheet
Za zapůjčení zdroje děkujeme společnosti Enermax

 

Skříň

Cooler Master Centurion 534

základní parametry

formát miditower
standard ATX

 

Chladič

Coolink Corator DS

základní parametry

podporované patice Intel LGA 775/1156/1366, AMD AM2/AM2+/AM3
rozměry 155 × 140 × 121 mm
hmotnost pasivu 1040 g
materiál měděná základna, hliníková žebra
ventilátor 120 × 120 × 25 mm, 800–1700 ot./min, PWM
podrobné specifikace viz specsheet

recenze

Test chladičů (finále): Noctua, Thermalright, Zalman…
  Za zapůjčení chladiče děkujeme společnosti Rascom

 

Operační systém, nastavení a ovladače

  • Microsoft Windows 7 Ultimate (64bitová verze)
  • vypnuta automatické defragmentace, aktualizace i swap file na
    všech jednotkách
  • DirectX redist August 2010
  • Intel INF
    9.1.1.1
  • ATI Catalyst 11.1a pro Radeon HD6970
  • Nvidia GeForce 266.58 pro GeForce GTX 580

Grafické karty testujeme na 30" LCD panelu HP LP3065

Za

poskytnutí her Battlefield Bad Company 2 děkujeme
společnosti Electronic Arts Czech Republic.

EA logo

Za
poskytnutí hry Aliens vs. Predator děkujeme společnosti CD Projekt.

CD Projekt

Za
poskytnutí hry Anno 1404 děkujeme společnosti Playman.

 

Aliens vs. Predator (DX11), Anno 1404 (DX10)

Aliens vs. Predator

Scénu z úvodu hry jsme nově nahradili samostatným benchmarkem, který je na internetu k dispozici ke stažení zdarma. Běží pouze v režimu DirectX 11 a je o poznání náročnější než náš původní test.

 

 


CD Projekt

Anno 1404

U této překrásně vypadající strategie (schválně zkuste kliknout na náhledový obrázek nad tímto odstavcem anebo tento přímo z testovací sekvence) jsem se nechal podobně jako u Call of Duty World at War inspirovat metodikou PC Games Hardware a tu tedy máme plně srovnatelnou. Postup je takovýto: Stáhněte si uloženou pozici PCGH, uložte ji do C:\Users\xyz\Documents\Anno 1404\Savegames. Nastavte všechny grafické detaily ve hře na maximum, vypněte vertikální synchronizaci a MSAA i anizotropní filtrování aktivujte také skrze hru.

Po načtení uložené pozice pomocí kurzorových kláves několikrát přelétněte přes ostrov a pak pozici znovu nahrajte. Zafunguje to jako cache proti vlivu pevného disku. FRAPS nastavte na 20 sekund a měřte vždy od doby, kdy začne v pravém horním rohu mluvit Zahir. 

Za poskytnutí hry Anno 1404 děkujeme společnosti Playman.

Battlefield Bad Company 2 (DX11), Call of Duty 5: World at War (DX9)

 

Battlefield Bad Company 2

Hned v úvodní misi se po probití zákopy dostanete po louku. Zde se po střetu s Japonci hra uloží. Nastavím FRAPS na 45 sekund a z tohoto checkpointu běžím kolem hořícího zera a dále pralesem až k můstku u vodopádu. Karty jsou otestovány v režimu DirectX 10 i novějším DirectX 11. Ten u DX11 GPU vynutíte v souboru C:\Users\xyz\Documents\BFBC2\settings.ini. Nastavení společně s uloženou pozicí si můžete stáhnout zde.

Za poskytnutí hry Battlefield Bad Company 2 děkujeme společnosti Electronic Arts Czech Republic.

EA logo

Call of Duty 5: World at War

Benchmark probíhá pomocí FRAPSu. Ten nastavte na 35 sekund. V
možnostech hry aktivujte konzoli a do ní vepište devmap pel1b. Tím se
dostanete na začátek mise Houževnatý (Relentless). Jakmile se tak stane,
spusťte FRAPS. Nově už nemusíte pro srovnatelnost výsledků s EHW držet klávesu pro pohyb vpřed, nechte jen doběhnout oněch 35 sekund a nic nedělejte.

 

Colin McRae: DiRT 2 (DX11, DX9)

Colin McRae: DiRT 2

Pro testování DiRT 2 používám velký dávkový soubor, který umožňuje otestovat bez nějakého zasahování čtyři různé tratě ve čtyřech nastaveních. Pro srovnatelnost výsledků s DirectX 10 a 10.1 kartami mám sadu konfiguračních XML s vynuceným DirectX 9, další sada XML zapíná DirectX 11 (na GPU, jež ho umí), teselaci i nejvyšší úroveň detailů postprocessingu.

Měří se na čtyřech tratích: Maroko (méně náročná, ale výsledky srovnatelné s volně stažitelným demem), L.A. (noční, stadión dělá některým kartám problémy), Malajsie (na některých GPU nejnáročnější) a Londýn (ten je v plné hře jako základní benchmark). Veškeré použité XML a dávky pro testování najdete v tomto ZIPu.

Crysis Warhead (DX10)

Crysis Warhead

K otestování výkonu v Crysis: Warhead používám utilitu Framebuffer
Crysis Warhead Benchmarking Tool 0.31. Aby bylo měření kompatibilní s
ověřovaným (ranked) benchmarkem, nechávám volbu na mapě ambush a
implicitním čase (v tomto případě noc). Používám rozhraní DirectX 10 a
zkouším jak nastavení Gamer (hráč, odpovídá detailům high v původním
Crysis), tak Enthusiast (very high). Beru výsledek druhého měření, kdy
už je hra načtena v paměti. Měření jsou opakovatelná s minimální odchylkou.

Far Cry 2 (DX10.1), Just Cause 2 (DX10)

Far Cry 2

Pro testy jsem používal zabudovaný benchmark, test Ranch Medium. Výsledky v grafech jsou z plynulejšího ze dvou opakování. Používám režim DirectX 10 a maximální detaily. Anti-aliasing zapínám přes nabídku hry.

Více v článku Far Cry 2: výkon grafických karet a vliv nastavení.

Just Cause 2

Just Cause 2 bylo jedním z příjemných překvapení první čtvrtiny roku 2010 (alespoň po grafické stránce) a autoři mysleli i na integrovaný benchmark. Ty jsou ve hře hned tři, všechny vypadají velmi dobře, konec Desert Sunrise a hlavně nejnáročnější Concrete Jungle pak přímo parádně. Výsledky měření jsou z náročnějšího Dark Tower a Concrete Jungle, méně náročný Desert Sunrise už vynechávám.

Je trochu škoda, že Bokeh filtr a GPU simulace vody (která pak vypadá opravdu fantasticky) je realizována pouze přes Nvidia CUDA a nikoli třeba DirectCompute. V tomto max. nastavení by se tedy mohly srovnávat jen GeForce.

Mafia II (DX9), Metro 2033 (DX11), Napoleon: Total War (DX9)

Mafia II

Do metodiky jsme zařadili i zejména u nás populární Mafii II. Testy se zapnutým vyhlazováním jsou oproti většině ostatních her trochu exotické. Ve hrách se totiž nejčastěji používá vyhlazování MSAA (obvykle 4×, náročnější uživatelé nastavují i 8×), zatímco vývojáři Mafie sáhli k méně efektivnímu 2× SSAA (supersampling).

 

Metro 2033

Z testovaných her největší zabiják grafických karet, který na trůnu
vystřídal Crysis a Stalkery: CS a CoP. V Game Options je položka Advanced PhysX vypnuta, na kartě Video je vybrána kvalita Very High, DX10 pro všechny karty a znovu navíc potom DX11 pro nejnovější GPU s jeho podporou, dále 4× MSAA a 16× AF. Používám uloženou hru takřka ze začátku hry (Chase), vozíkem jedete tunelem a než se vám ve snové vizi objeví příšera, logování FRAPSem ukončím (180 s). Benchmarkovací sekvence asi není nejtěžší možná, i tak ale současným kartám stačí a asi pár let ještě bude, výhodou je dobrá opakovatelnost.

 

Uloženou pozici před jízdou tunelem si můžete opět stáhnout, pro otestování používám následující nastavení. Kombinace MSAA, vysokého rozlišení a profilu very high u mnoha karet znemožňuje prakticky už pohyb v menu a přitom slevení z maximálních detailů hru vizuálně zřejmě až tolik nepokazí. Testuji pouze nižší rozlišení 1920 × 1200, vyšší rozlišení 2560×1600 už je na většině karet při stejném nastavení nehratelné.

Napoleon: Total War

V Napoleon:
Total War (demo, 1.0.0) používám pro testování bitvu u
Ligny. Fraps nastavuji na
62 sekund, jakmile získám kontrolu nad myší a klávesnicí, nastavím
pohled hned na zcela
nejnižší možný u země (náročná detailní animace vlnící se trávy či
obilí).

 

S.T.A.L.K.E.R.: Call of Pripyat (DX11), H.A.W.X. 2 (DX11), World in Conflict (DX10)

S.T.A.L.K.E.R.: Call of Pripyat

Pro testování této moderními technologiemi nabité hry používám samostatný benchmark. V něm pak celkové nastavení Ultra, Enhan. full dynamic lighting (DX10 nebo DX11 podle toho, co GPU podporuje). Je-li DirectX10.1 podporován, je zatržen i v Advanced Options. DirectX 10 karty testuji pouze s 4× MSAA, DirectX 11 akcelerátory potom ještě navíc s MSAA for A-teste objects (anti-aliasing transparentních textur), SSAO Mode nastaveným na HDAO, kvalitou na Ultra (verze Compute Shader), zaplou teselací i CHS (Contact hardening shadows).

Tom Clancy's H.A.W.X. 2 benchmark

Hlavním tématem benchmarku H.A.W.X. 2 je teselace a distribuci dema pomáhala v počátcích hodně Nvidia. I z tohoto důvodu se snad ještě před jeho uvedením ozvalo samotné AMD s komentářem, že je benchmark nachystaný pro karty Nvidie a záměrně vypuštěný těsně před uvedením nové generace Radeonů se záměrem poškodit je. Na vině má být zbytečně jemná teselace polygonové sítě, která kartám GeForce nedělá problémy, zatímco Radeony výrazně brzdí.

  

Kvůli kontroverznosti, dost možná i troše pravdy na až zbytečném počtu malých trojúhelníků v síti (v kontrastu s odfláklými animacemi výbuchů apod.) a také faktu, že i na slabším hardwaru (i s logem Radeon) jede test na vysoké detaily plynule, jsme se rozhodli nechat jej mimo metodiku, z níž počítáme celkový (průměrný) výkon.

World in Conflict

Testuji s upraveným profilem very high details (zapnul jsem i
water reflects clouds (voda odráží oblaka), anizotropní filtrování
navýšil na 16×). Používám vestavěný benchmark.

Shrnutí výsledků a verdikt

Závěrečné shrnutí

Nepříjemnou vlastností nových Radeonů HD 6970 jsou vysoké teploty jádra, v případě CrossFireX to platí dvojnásob (či trojnásob). S teplotou obou Radeonů v referenčním provedení ostře kontrastuje karta od Asusu. Zásluhu na tom nemá ale jen výkonnější chladič, ale i to, že ventilátory na kartě od Asusu si na nedostatek kyslíku nemohou stěžovat.

Na vině jsou snad právě vyšší teploty (a s nimi potažmo i vyšší spotřeba karty) – zatímco u referenčních Radeonů není snižování taktů při intenzivní zátěži nic neobvyklého, karta od Asusu vydrží prakticky po celou dobu běžet na nominální frekvenci bez podtaktování.

Automatické podtaktování podle všeho přinejmenším komplikuje synchronizaci všech zapojených karet. Netroufám si to tvrdit s jistotou, ale mám za to, že právě asynchronní a nezávislé podtaktovávání jednotlivých karet (často až někam k nízkým 550 MHz) je důvodem, proč se zejména při CrossFireX s trojicí karet často objevoval „microstuttering“ a obraz i přes vysoké průměry nepříjemně zadrhával.

S vysokými teplotami souvisí i vysoké otáčky ventilátoru – ventilátor na jedné z karet se často roztáčel kousek pod čtyři tisíce otáček, na kterých už karta dosahuje hodně vysokých 66 dBA.

Zatímco spotřeba celé sestavy bez zátěže se dvěma i třemi Radeony celkem příjemně překvapila (8 W navíc oproti sestavě s jednou GTX 580 je docela pěkný výsledek), v zátěži už bylo myslím horko i našemu 920W Enermaxu (i když do špičkových 1010 W, které ještě krátkodobě ustojí, to má pořád ještě hodně daleko).

Podotýkám, že jde o špičkovou spotřebu, kterou karty dosahují po asi dvacetiminutovém trýznění náročnou scénou v Crysis, průměrná spotřeba při hraní se pohybuje níže.

Zatímco nárůst výkonu u dvou karet příjemně překvapil, CrossFireX ze tří karet není příliš funkční. Někde ale tři karty fungují přímo zázračně. Jindy náročné a problémové Metro 2033 běželo na 2,7–2,9násobku výkonu jedné karty. Unigine Heaven běží rovněž téměř na trojnásobku výkonu jediné karty. Také Crysis Warhead při náročnějším nastavení Enthusiast v rozlišení 2560×1600 se blíží trojnásobku výkonu jedné karty.

Dost často ale také dochází k propadům výkonu na či dokonce pod úroveň dvou karet (např. v Mafia II).

Průměr sráží a řešení ze tří karet deklasují k jeho škodě v celkovém hodnocení především méně náročné tituly – tady musím ale zdůraznit, že si jej budete pořizovat spíše kvůli náročným hrám a nárůst výkonu ze 50 na 74 fps v metru je určitě zajímavý, to, že takový Far Cry 2 poskočí ze 182 jen na 192 fps už nám může být snad s výjimkou vyšší spotřeby celkem jedno.

Poměr cena/výkon je s přibývajícími kartami logicky horší. Vzhledem k vyšším nárůstům výkonu ve vysokém rozlišení je to při vyšších rozlišeních o něco lepší. Není ale bez zajímavosti, že prostým přepočtem cena/hrubý výkon v procentech se dvojice Radeonů za šestnáct tisíc vyrovná jedné GeForce GTX 580.

CrossFireX 2× Radeon HD 6970

+ výrazný nárůst výkonu ve většině titulů
+ špičkový hrubý výkon
+ slušná spotřeba bez zátěže
+ ještě zajímavý poměr cena/výkon

ICTS24

- problémové chlazení
- vysoká hlučnost
- podtaktovávání při přehřátí
- vyšší spotřeba
- výjimečně i horší výkon než jedna karta
- cena

CrossFireX 3× Radeon HD 6970

+ v nejnáročnějších hrách slušně škáluje
+ dobrá spotřeba bez zátěže

- často minimální nebo záporný nárůst výkonu oproti dvěma kartám
- nelze doporučit na nic jiného než na experimentování
- extrémní spotřeba
- i přes vysoké průměry FPS často znatelné trhání
- vysoké teploty
- nároky na prostor
- cena