Retro-test: GeForce 8800 GTX vs. současné grafiky

18. 10. 2010

Sdílet

 Autor: Redakce

G80 odstartovala zlatou éru Nvidie

Na ExtraHardware už od vzniku alespoň jednou za rok zveřejníme větší souhrnný test grafických karet. Letos tak možná učiním ještě před uvedením Radeonů HD 6000, které už budou otestovány jen s několika přímými konkurenty v modernizované metodice. Předtím jsem se ale rozhodl udělat to, co na EHW bývalo také vždycky zvykem: zařadit mezi aktuální grafické karty alespoň jednu starší, která bude sloužit jako pojítko s minulostí.

Protože v minulých velkých testech grafických karet jsem jako jakousi referenční kartu zvolil střídavě GeForce 8800 GT a právě 8800 GTX, tak už třeba víte, že výkon druhé nejvyšší G80 se v průměru obyčejně pohyboval například 10–15 % pod Radeonem HD 4850. Podobným ne úplně exaktním odvozováním se dostaneme na výkon o něco pod Radeonem HD 4770 či výkonnostní hladinu Radeonu HD 5750.

Když už jsem zmínil, jaká událost bylo uvedení G80, připomenu ještě trochu více. Z dlouhodobého pohledu je souboj ATI vs. Nvidia jako na houpačce. Když pominu fakt, že ATI je společností, která tu bude pomalu čtvrt století (jakožto stará škola se nemíním smířit s ATI by AMD), tak od vzniku Nvidie tohle stále platilo. Jen-Hsunova Nvidia byla na dně první roky od svého založení, NV1 špatně vsadila na jakési kvadratické plochy místo polygonů, NV2 (Mutara) zůstala snad u prototypů a teprve Riva 128 přinesla firmu sídlící v Santa Claře na výsluní.

V té době zase ATI nesklízela v 3D zrovna ovace, její karty Rage byly ceněny spíše pro 2D část a akceleraci videa. V dalších letech tak Nvidia bojovala především s 3Dfx. O tom, jak to dopadlo, asi všichni víte. Karty, které stojí za to z té doby připomenout byly právě Riva 128 a pak GeForce256. První GeForce a první herní grafika s hardwarovou TnL (transform and lighting) jednotkou. Hlavně Rivu připomínám proto, že to byla karta podporující všemonžé (neproprietární) standardy a znamenala úspěch.

Léta plynula a ATI se dostala do hry nejen Radeonem SDR/DDR, ale s určitou pauzou, kdy na GeForce 2 a hlavně GeForce 3 (DirectX 8, první vertex a pixel shader jednotky a dokonce první teselace (RT-patches) končící ve slepé uličce) reagovala pozdě, už byla v souboji o hráče důstojným soupeřem kvapící Nvidie. V době uvedení dvojice Radeon 8500 a 7500 pak měla nejvýkonnější akcelerátor ve svých rukou. Odpovědí byla hrubá síla GeForce 4 a pak zase klidné vedení Nvidie.

V létě roku 2002 pak přišel blesk z čistého nebe. Radeon 9700 Pro byl nejen až násobně rychlejší než GeForce 4 (hlavně s anti-aliasingem), ale podporoval nový DirectX 9. A to tak, že rychle. 24-bit FP v DX9 a přesná implementace v R300 sice byla sice především zastánci Nvidie kritizována, ale mezitím vyvíjená GeForce FX (podporující 16 a 32-bit FP) byla horší kartou nejen vinou tohoto „nestandardu“. Z GeForce FX si později dělali legraci přímo v Nvidii, v roce 2002 a 2003 této partě ale asi nebylo zrovna do smíchu. Alespoň my v ČR jsme snili o Radeonu 9700 (nejlépe v nádherné krabici se zubícím se skřetem od značky Hercules), na Invexu sledovali na této kartě Dragothic z 3DMark2001 ve stovkách fps a nakonec sháněli Radeon 9500 s 256bitovou sběrnicí a zkoušeli štěstí s „odemykáním pipeline“.

GeForce FX 5700/5900 trochu nepoměr sil korigovaly, ale teprve GeForce 6800 a hlavně 6600 dostaly Nvidii zpět na špičku. ATI lehce zaspala DirectX 9.0c (shader model 3.0) a Radeony X800/X600 hlavně kvůli slabší střední třídě nebyly tak lákavé. Radeony X1800/X1600 a později X1900 trochu předběhly dobu (poměrem ALU:TEX:RBE) a až na výjimky opět platilo, že slabší střední třídy Kanaďanům rozvazovala tkaničky na bruslích.

Nvidia slavila úspěch s relativně malými čipy G70/G71 (GeForce 7800 a 7900), technologií SLI (zejména v době, kdy měla velice konkurenceschopné čipsety) a skoro ideální střední třídou (GeForce 7600). To, že GeForce 7 měly opravdu ošklivé filtrování textur (viditelný shimmering), zajímalo vždy jen poctivé čtenáře HW magazínů a na GeForce 7600 GT hledala ATI odpověď pomocí kleštění svých vyšších řad.

Tak jako dnes nevyvolává sympatie GeForce GTX 465 nebo Radeon HD 5830, ani tehdy se třeba Radeon X1800 GTO moc neuchytil. Teprve Radeon X1950 Pro (RV570) byl tou správnou kartou, která až na větší velikost (stále ale „pohodových“ cca 23 cm) a zřejmě vyšší na výrobu (256bitová sběrnice) dal pádný argument kupovat něco jiného. Radeon X1650 XT přišel zoufale pozdě a vlastně se nikdy moc nerozšířil. To už ale odbíhám trochu mimi špičku. Tam ATI v té době byla.

Radeon X1900 XTX a později X1950 XTX s DDR4 čím dál více profitovaly ze 48 výkonných pixel shader jednotek a hlavně vyšší poměr ALU:TEX/RBE začínal být někde i výhodou a GeForce 7 mohly zaujmout už leda nižší spotřebou. Bylo to ale ticho před bouří.

V listopadu 2006 totiž Nvidia odhalila kartu, na níž pracovala čtyři roky. Ty nazvala jako roky plné chyb, z nichž se učili. A tentokrát to nebyla „velká huba“. G80 konkurenční ATI na dlouho vyrazila dech a přestože R600 vypadal papírově fantasticky, jeho vývoj byl nešťastný. GeForce 8800 GTX navzdory očekávání už představila unifikované shader jednotky, kterým se tak mohlo začít říkat stream procesory, podporovala zapojení tří karet do SLI (i když v době uvedení se u druhého SLI konektoru uvádělo, že je pro budoucí účely) a stejně jako předchozí GeForce měla oddělené takty shader domény (1350 MHz) a zbytku jádra (576 MHz). Na tehdy nevídaně dlouhém PCB (dnes běžných 27 cm) byly paměti GDDR3 připojeny 384bitovou paměťovou sběrnicí a Nvidia začala doporučovat hraní na 30" LCD s rozlišením 2560 × 1600 px.

Vědoma si velkého potenciálu G80 uvedla také CUDA. Modifikace C pro programování aplikací běžících na GPU bylo v podobně dotažené podobě také prvenstvím. Unifikované stream procesory podporovaly shader model 4.0 (DirectX 10), v době uvedení to nebylo ale moc na čem vyzkoušet. Právě DX10 a vůbec podpora Windows Vista byly tehdy Achillovou patou Nvidie, jenže se o ní moc nemluvilo. Zde nahrál Kaliforňanům osud. ATI neměla protizbraň a R600 jen nabíral zpoždění. Navíc ještě dnes vidíme uvádění velkého množství (mnohdy stejně graficky lákavých) her využívajících pouze DirectX 9.





 


Dnes věc nepřípustná: plné takty i v klidu (desktop Windows) a tím i vyšší teploty, spotřeba i otáčky ventilátoru

Radeon HD 2900 XT, tedy konečně konečná podoba vývoje R600 na hegemonii GeForce 8800 GTX nic nezměnil. S 4× AA, který je i při dnešních typických úhlopříčkách, rozlišeních a technologii LCD považován za optimální kompromis, prohrávala vlajková loď ATI i s druhou nejvýkonnější kartou Nvidie (GTS, 640 MB). A to ještě Nvidia záhy uvedla 8800 Ultra a navíc měla v té době mnohem lépe fungující SLI (oproti CrossFire, CrossFireX to začal být myslím až u HD 3000 series).

Další podzim tak Tony Tamasi, Drew Henry a další s klidem představili G92 v podobě GeForce 8800 GT. Tedy o něco slabší kartu než 8800 GTX, samozřejmě vylepšenou po stránce spotřeby, velikosti atd. I relativně očesaná 8800 GT (G92 v ní měl nízký takt a některé neaktivní jednotky) si s Radeonem HD 2900 XT hravě poradila a nebýt toho, že ATI zrychlila a uvedla přeci jen už lepší RV670 (Radeon HD 3850 a 3870), začalo by to vypadat pro konkurenci na trhu grafik hodně špatně.

Rok 2007 a ještě i část 2008 byly zlatým obdobím Nvidie, který trochu kazil jen úpadek čipsetové divize. Intel nerad viděl vydělávání drzé Nvidie na svém poli a AMD získala pro svou platformu vlastní čipsety právě akvizicí ATI. Každopádně zde Nvidia usnula na vavřínech, nebo se následně vydala špatným směrem (nebo od obojího trochu), protože uvedení GT200 sice ústilo v nejlepší kartu své doby (GeForce GTX 280 byla nejvýkonnější grafikou s dobře vyřešenými provozními vlastnostmi) z pohledu případného majitele-hráče, ale malým manévrovacím prostorem pro Nvidii.

S výkonem už nebylo možné jít někam dál a konkurenční RV770 s mnohem úsporněji navrženým čipem byl ve své podobě XT (HD 4870) výkonem nedaleko. ATI stačilo dát ale dva čipy na jediné PCB a měla marketingový tahák nejvýkonnější grafiky světa, trochu podtaktovaný RV770 (Pro, HD 4850) se pak stal tím pravým zlatým středem. Ale to už jsme v době, kterou si pamatuje asi většina z vás. Takže kromě toho, že jsem vám tak trochu nenápadně na screenshotech z GPU-Z a fotkách ukázal eVGA GeForce 8800 GTX (referenční design i takty) vytaženou do testu z šuplíku, uvedu vás do obrazu obvyklou parametrovou tabulkou.

GeForce GeForce GeForce GeForce GeForce GeForce GeForce
8800 GTX 8800 GT 9800 GTX GTX 280 GTX 285 GTS 450 GTX 480
Jádro G80 G92 G92 G200 G200 GF106 GF100
Výrobní proces 90 nm 65 nm 65 nm 65 nm 55 nm 40 nm 40 nm
Velikost jádra 484 mm² 324 mm² 324 mm² 576 mm² 470 mm² 240 mm² 526 mm²
Tranzistorů 681 mil. 754 mil. 754 mil. 1,4 mld. 1,4 mld. 1,17 mld. 3,2 mld.
Stream
procesorů
128 112 128 240 240 192 480
Takt jádra 576 MHz 600 MHz 675 MHz 602 MHz 648 MHz 783 MHz 700 MHz
Takt SP 1350 MHz 1500 MHz 1688 MHz 1296 MHz 1476 MHz 1566 MHz 1401 MHz
ROP/RBE 24 16 16 32 32 16 48
Texturovacích
jedn.
32 56 64 80 80 32 60
Paměť 768 MB GDDR3 512 MB GDDR3 512 MB GDDR3 1 GB GDDR3 1 GB GDDR3 1 GB GDDR5 1536 MB GDDR5
Takt pamětí 1800 MHz 1800 MHz 2200 MHz 2214 MHz 2484 MHz 3608 MHz 3696 MHz
Šířka sběrnice 384-bit 256-bit 256-bit 512-bit 512-bit 128-bit 384-bit
Propustnost
pamětí
86,4 GB/s 57,6 GB/s 70,4 GB/s 141,7 GB/s 159,0 GB/s 57,7 GB/s 177,4 GB/s
Fillrate
(pixely)
13,8 Gpx/s 9,6 Gpx/s 10,8 Gpx/s 19,3 Gpx/s 20,8 Gpx/s 12,5 Gpx/s 33,6 Gpx/s
Fillrate
(textury)
18,4 Gtx/s 33,6 Gtx/s 43,2 Gtx/s 48,2 Gtx/s 51,8 Gtx/s 25,1 Gtx/s 42 Gtx/s
FLOPS 346 GFLOPS 336 GFLOPS 432 GFLOPS 933 GFLOPS 1063 GFLOPS 601 GFLOPS 1345 GFLOPS
Max. spotřeba 176 W 105 W 168 W 236 W 183 W 106 W 250 W
Délka karty 27 cm 23 cm 27 cm 27 cm 27 cm 21 cm 27 cm
Shader model 4.0 4.0 4.0 4.0 4.0 5.0 5.0
Radeon Radeon Radeon Radeon Radeon Radeon Radeon
X1950 XTX HD 2900 XT HD 3870 HD 4850 HD 5770 HD 5850 HD 5870
Jádro R580+ R600 RV670 RV770 Juniper Cypress Cypress
Výrobní proces 90 nm 80 nm 55 nm 55 nm 40 nm 40 nm 40 nm
Velikost jádra 315 mm² 420 mm² 196 mm² 263 mm² 181 mm2 330 mm² 330 mm²
Tranzistorů 384 mil. 700 mil. 666 mil. 956 mil. 1,04 mld. 2,15 mld. 2,15 mld.
Stream
procesorů
48 px/8 vert. 64 (320) 64 (320) 160 (800) 160 (800) 288 (1440) 320 (1600)
Takt jádra 650 MHz 743 MHz 777 MHz 625 MHz 850 MHz 725 MHz 850 MHz
Takt SP 650 MHz 743 MHz 777 MHz 625 MHz 850 MHz 725 MHz 850 MHz
ROP/RBE 16 16 16 16 16 32 32
Texturovacích
jedn.
16 16 16 40 40 72 80
Paměť 512 MB GDDR4 512 MB GDDR3 512 MB GDDR4 512 MB GDDR3 1 GB GDDR5 1 GB GDDR5 1 GB GDDR5
Takt pamětí 2000 MHz 1656 MHz 2252 MHz 1986 MHz 4800 MHz 4000 MHz 4800 MHz
Šířka sběrnice 256-bit 512-bit 256-bit 256-bit 128-bit 256-bit 256-bit
Propustnost
pamětí
64 GB/s 106 GB/s 72 GB/s 63,5 GB/s 76,8 GB/s 128 GB/s 153,6 GB/s
Fillrate
(pixely)
10,4 Gpx/s 11,9 Gpx/s 12,4 Gpx/s 10 Gpx/s 13,6 Gpx/s 23,2 Gpx/s 27,2 Gpx/s
Fillrate
(textury)
10,4 Gtx/s 11,9 Gtx/s 12,4 Gtx/s 25 Gtx/s 34,3 Gtx/s 52,2 Gtx/s 68 Gtx/s
FLOPS 426 GFLOPS 475 GFLOPS 496 GFLOPS 1 TFLOPS 1,36 TFLOPS 2,09 TFLOPS 2,4 TFLOPS
Max. spotřeba cca 140 W 215 W 105 W 110 W 108 W 170 W 188 W
Délka karty 23 cm 24 cm 23 cm 23 cm 22 cm 24 cm 28 cm
Shader model 3.0 4.0 4.1 4.1 5.0 5.0 5.0

 

Testovací sestava

Testovací konfigurace

Hardware

  • monitor: HP LP3065 (30", 2560 × 1600 px, S-IPS)
  • procesor: Intel Core i7-920 (20× 200 MHz = 4,00 GHz, Turbo
    Boost a HyperThreading vypnuty)
  • základní deska: Gigabyte GA-X58A-UD5 (Intel X58, ICH10R, BIOS
    F3)
  • paměti: 6 GB Kingston DDR3-1866 (1200 MHz, 7-7-7-20-2T, 1,66 V)
  • pevný disk: Western Digital VelociRaptor VR150 (WD3000GLFS)
  • optická mechanika: Lite-On DH-4O1S (Blu-ray, DVD-ROM)
  • zdroj: Gigabyte Odin GT 800W (GE-S800A-D1)
  • skříň: Cooler Master Centurion 534
  • chladič CPU: Scythe Mugen 2 (1300 rpm) + Noctua NT-H1
  • systémové větráky: Arctic Fan12 PWM + Cooler Master 12 cm @
    1000
    rpm

Pouze pro testy hlučnosti je použit jiný počítač
(a noční klid):

  • hlučnost okolí: 36,5 až 37,5 dBA (měřeno cca
    20 cm od grafické karty, odejmutá bočnice skříně)
  • pevné disky:
    WD7500AAKS a WD20EADS v boxech Acutake Dark Disc 2
  • zdroj:
    Enermax Modu82+, 625 W
  • skříň: Cooler Master Centurion 5
  • chladič CPU: Noctua NH-U12P
  • systémový větrák: Noctua
    NF-S12

Operační systém, nastavení a ovladače

  • Microsoft Windows 7 Ultimate (64bitová verze)
  • vypnuta automatické defragmentace, aktualizace i swap file na
    všech jednotkách
  • DirectX redist February 2010
  • Intel INF
    9.1.1.1
  • ATI Catalyst 10.3 pro Radeon HD 5770/5830/5850/5870/5970
  • Nvidia
    GeForce 197.25 pro GeForce GTX 285/295
  • Nvidia GeForce 197.17
    pro GeForce GTX 470/480
  • Nvidia GeForce 257.15 pro GeForce GTX 465, 258.96 pro GTX 460, 260.52 pro GTS 450
  • Nvidia GeForce 258.96 pro GeForce 8800 GTX

Grafické karty testujeme na 30" LCD panelu HP LP3065

Za poskytnutí procesoru Intel Core i7-920 děkujeme společnosti Intel

Za poskytnutí testovacích pamětí DDR3 děkuji společnosti Kingston

Kingston

Za
poskytnutí základní desky GA-X58A-UD5 a zdroje Odin GT děkujeme
společnosti
Gigabyte

Mugen 2 v bedně

Za zaslání Blu-ray mechaniky děkuji společnosti Lite-On
IT

Za poskytnutí desítek balení teplovodivé pasty Noctua NT-H1
děkujeme
společnosti RASCOM
Computerdistribution

Za

poskytnutí her Battlefield Bad Company 2 a Dragon Age: Origins děkujeme
společnosti
Electronic Arts Czech Republic.

EA logo

Za
poskytnutí hry Aliens vs. Predator děkujeme společnosti CD Projekt.

CD Projekt

Za
poskytnutí hry Anno 1404 děkujeme společnosti Playman.

Aliens vs. Predator (DX11), Anno 1404 (DX10)

Aliens vs. Predator

Kdybyste potřebovali odemknutou první misi za predátora, můžete si uloženou pozici stáhnout na tomto místě. AvP lze spouštět v DX9 a DX11 režimu (přímo ze Steamu). DX11 režim běží i na DX10 kartách, jen nejsou k dispozici funkce jako teselace nebo multi-sampling. DX11 režim je při stejných detailech jak na Radeonech, tak na GeForce o několik procent (až cca deset) rychlejší než DX9. Všechny
karty proto byly srovnány v nastavení DX11/bez teselace – šílený překlad
mozaika) a 4x MSAA, DX11 akcelerátory potom ještě se zapnutou teselací, vylepšenými stíny a právě multi-samplingem o čtyřech vzorcích.

Testovanou sekvencí je předskriptované intro příletu a přistání predátora do džungle (mise Džungle). FRAPS nastavuji na 45 sekund.

DX11
rendering path lze tedy použít i pro DirectX 10 karty, na GeForce GTX
260 a GTS 250 jsem si ověřil, že z toho profitují výkonnostně
(samozřejmě lze testovat jen bez teselace, MSAA a vylepšených stínů).
Na problémy jsem narazil pouze u SLI, zde mise s predátorem po načtení
padá a je nutné použít DX9 rendering path.

Za poskytnutí hry Aliens vs. Predator děkujeme společnosti CD Projekt.


CD Projekt

Anno 1404

U této překrásně vypadající strategie (schválně zkuste kliknout na náhledový obrázek nad tímto odstavcem anebo tento přímo z testovací sekvence) jsem se nechal podobně jako u Call of Duty World at War inspirovat metodikou PC Games Hardware a tu tedy máme plně srovnatelnou. Postup je takovýto: Stáhněte si uloženou pozici PCGH, uložte ji do C:\Users\xyz\Documents\Anno 1404\Savegames. Nastavte všechny grafické detaily ve hře na maximum, vypněte vertikální synchronizaci a MSAA i anizotropní filtrování aktivujte také skrze hru.

Po načtení uložené pozice pomocí kurzorových kláves několikrát přelétněte přes ostrov a pak pozici znovu nahrajte. Zafunguje to jako cache proti vlivu pevného disku. FRAPS nastavte na 20 sekund a měřte vždy od doby, kdy začne v pravém horním rohu mluvit Zahir. 

Za poskytnutí hry Anno 1404 děkujeme společnosti Playman.

ArmA II (DX9), Battlefield Bad Company 2 (DX11)

ArmA II

Při testování v velmi náročné hře českého původu jsem využil integrovaného benchmarku. Všechny detaily kromě anti-aliasingu jsem zvolil nanejvyšší hodnotu, dohled vytáhl na 10 000. U ATI bylo vyhlazování nastaveno na normální, u Nvidie na vysoké. Steam verze hry byla ručně aktualizována na sestavení 1.05. Používám Benchmark 01, který je i v demu hry.

Nastavení vyhlazování (ve hře) se totiž liší u ATI (nízké = 2× MSAA, normální = 4× MSAA,
vysoké = 8× MSAA) a Nvidie, kde je to vše složitější. Nízké a normální
je 2× MSAA, vysoké a velmi vysoké potom 4× MSAA a 8× MSAA odpovídá
nastavení 6. Další čísla jsou pak některé z režimů CSAA.

Battlefield Bad Company 2

Hned v úvodní misi se po probití zákopy dostanete po louku. Zde se po střetu s Japonci hra uloží. Nastavím FRAPS na 45 sekund a z tohoto checkpointu běžím kolem hořícího zera a dále pralesem až k můstku u vodopádu. Nové karty jsou otestovány v DirectX 11 režimy, všechny včetně starších pak společně v DirectX 10. Ten u DX11 GPU vynutíte v souboru C:\Users\xyz\Documents\BFBC2\settings.ini. Nastavení společně s uloženou pozicí si můžete stáhnout zde.

Za poskytnutí hry Battlefield Bad Company 2 děkujeme společnosti Electronic Arts Czech Republic.

EA logo

Call of Duty 5: World at War (DX9), Colin McRae: DiRT 2 (DX11, DX9)

Call of Duty 5: World at War

Benchmark probíhá pomocí FRAPSu. Ten nastavte na 35 sekund. V
možnostech hry aktivujte konzoli a do ní vepište devmap pel1b. Tím se
dostanete na začátek mise Houževnatý (Relentless). Jakmile se tak stane,
spusťte FRAPS. Nově už nemusíte pro srovnatelnost výsledků s EHW držet klávesu pro pohyb vpřed, nechte jen doběhnout oněch 35 sekund a nic nedělejte.

Colin McRae: DiRT 2

Pro testování DiRT 2 jsem vytvořil veliký dávkový soubor, který mi umožňuje otestovat bez nějakého zasahování čtyři různé tratě ve čtyřech nastaveních. Pro srovnatelnost výsledků s DirectX 10 a 10.1 kartami mám sadu konfiguračních XML s vynuceným DirectX 9, další sada XML zapíná DirectX 11 (na GPU, jež ho umí), teselaci i nejvyšší úroveň detailů postprocessingu.

Měřím na čtyřech tratích: Maroko (méně náročná, ale výsledky srovnatelné s volně stažitelným demem), L.A. (noční, stadión dělá některým kartám problémy), Malajsie (na některých GPU nejnáročnější) a Londýn (ten je v plné hře jako základní benchmark). Veškeré použité XML a dávky pro testování najdete v tomto ZIPu.

Crysis Warhead (DX10)

Crysis Warhead

K otestování výkon v Crysis: Warhead používám utilitu Framebuffer
Crysis Warhead Benchmarking Tool 0.31. Abych měl měření kompatibilní s
ověřovaným (ranked) benchmarkem, nechávám volbu na mapě ambush a
implicitním čase (v tomto případě noc). Používám rozhraní DirectX 10 a
zkouším jak nastavení Gamer (hráč, odpovídá detailům high v původním
Crysis), tak Enthusiast (very high). Beru výsledek druhého měření, kdy
už je hra načtena v paměti. V tomtom druhém průběhu rovněž zaznamenám
podrobný FRAPSLOG. Měření jsou opakovatelná s minimální odchylkou.

Dragon Age: Origins (DX9), Enemy Territory: Quake Wars (OpenGL)

Dragon Age: Origins

V Dragon Age Origins používám uloženou pozici od uživatele Kharkowa. Průsmyk ve Zmrzlých horách (cestou do trpasličího města Orzammar) patří zřejmě k nejnáročnějším lokacím (na GPU) z celé hry a uložená pozice je tak šikovně udělána, že stačí držet klávesu W a přitom logovat FRAPSem (až do přerušení při přechodu do další lokace).

První načtení používám jako cache, teprve těmi dalšími testuji. Používám maximální grafické detaily, jež hra nabízí, měním jen rozlišení a anti-aliasing ponechávám na 4×.

Za poskytnutí hry Dragon Age: Origins děkujeme společnosti Electronic Arts Czech Republic.

EA logo

 

Enemy Territory: Quake Wars

Nové Enemy Territory představuje jedinou současnou moderní OpenGL hru pod Windows a zároveň jediný OpenGL test v testovací sadě. Quake Wars používají značně upravený Doom 3 engine, obohacený především o technologii MegaTexture (více o technologii v článku na Beyond3D). Pro testy používám maximální detaily, přes konzoli vypínám limit 30 (com_unlockFPS 1) i 60 fps (com_unlock_maxFPS 0, je vhodné nastavit do autoexec.cfg), AA i AF zapínám ve hře. První spuštění timedema používám opět jako cacheovací, odečítám výsledek až z druhého.

Pro účely testování jsem si nahrál vlastní timedemo (recordtimenetdemo), které měří výkon v rozsáhlé lokaci se stromy (Valley). Timedemo (pro verzi 2.0) ke stažení: zde.

Far Cry 2 (DX10.1), Just Cause 2 (DX10)

Far Cry 2

Pro testy jsem používal zabudovaný benchmark, test Ranch Medium. Výsledky v grafech jsou z plynulejšího ze dvou opakování. Používám režim DirectX 10 a maximální detaily. Anti-aliasing zapínám přes nabídku hry.

Více v článku Far Cry 2: výkon grafických karet a vliv nastavení.

Just Cause 2

Just Cause 2 je jedním z příjemných překvapení první čtvrtiny roku 2010 (alespoň po grafické stránce) a autoři mysleli i na integrovaný benchmark. Ty jsou ve hře hned tři, všechny vypadají velmi dobře, konec Desert Sunrise a hlavně nejnáročnější Concrete Jungle pak přímo parádně.

Je trochu škoda, že Bokeh filtr a GPU simulace vody (která pak vypadá opravdu fantasticky) je realizována pouze přes Nvidia CUDA a nikoli třeba DirectCompute. V tomto max. nastavení by se tedy mohly srovnávat jen GeForce.

Metro 2033 (DX11), Napoleon: Total War (DX9)

Metro 2033

Společně s Armou 2 největší zabiják grafických karet, který na trůnu
vystřídal Crysis a Stalkery: CS a CoP. V Game Options je položka Advanced PhysX vypnuta, na kartě Video je vybrána kvalita Very High, DX10 pro všechny karty a znovu navíc potom DX11 pro nejnovější GPU s jeho podporou, dále 4× MSAA a 16× AF. Používám uloženou hru takřka ze začátku hry (Chase), vozíkem jedete tunelem a než se vám ve snové vizi objeví příšera, logování FRAPSem ukončím (180 s). Benchmarkovací sekvence asi není nejtěžší možná, i tak ale současným kartám stačí a asi pár let ještě bude, výhodou je dobrá opakovatelnost.

 

Uloženou pozici před jízdou tunelem si můžete opět stáhnout, pro otestování používám následující čtyři nastavení (dost možná dojde ke změně, jelikož kombinace MSAA, vysokého rozlišení a profilu very high u mnoha karet znemožňuje prakticky už pohyb v menu a přitom slevení z maximálních detailů hru vizuálně zřejmě až tolik nepokazí).

Napoleon: Total War

Hru Empire: Total War (retail, 1.5.0) jsem začal
nahrazovat novějším dílem série zvaným Napoleon:
Total War (demo, 1.0.0), za testovací lokaci zvolil právě bitvu u
Ligny. Fraps nastavuji na
62 sekund, jakmile získám kontrolu nad myší a klávesnicí, nastavím
pohled hned na zcela
nejnižší možný u země (náročná detailní animace vlnící se trávy či
obilí).

 

S.T.A.L.K.E.R.: Call of Pripyat (DX11), The Elder Scrolls IV: Oblivion (DX9)

S.T.A.L.K.E.R.: Call of Pripyat

Pro testování této moderními technologiemi nabité hry používám samostatný benchmark. V něm pak celkové nastavení Ultra, Enhan. full dynamic lighting (DX10 nebo DX11 podle toho, co GPU podporuje). Je-li DirectX10.1 podporován, je zatržen i v Advanced Options. DirectX 10 karty testuji pouze s 4× MSAA, DirectX 11 akcelerátory potom ještě navíc s MSAA for A-teste objects (anti-aliasing transparentních textur), SSAO Mode nastaveným na HDAO, kvalitou na Ultra (verze Compute Shader), zaplou teselací i CHS (Contact hardening shadows).

Call of Pripyat je jednou z her, kde v posledních verzích ovladačů navýšila u svých karet výkon jak Nvidia (viz aktualita o ovladačích GeForce 260 a pár výsledků z Pripyat na GTX 460), tak AMD (Catalyst 10.9). Tudíž si musíte představit

Koho zajímají ještě minimální fps GTS 450 v tomto testu, pro toho mám screenshoty s detailními výsledky z obou nastavení. I v náročnějším nastavení s 4× MSAA, HDAO, teselací a CHS se GF106 drží celkem statečně.

 

 

The Elder Scrolls IV: Oblivion

Čtvrtý díl série Elder Scrolls patří i přes svůj věk stále mezi nejnáročnější hry vůbec. Zvlášť, když stejně jako já v testu, vyberete lokace s množstvím vlnící se trávy, pohupujících se stromů a přesto rozhledem do vzdálené krajiny (The West Weald). Testuji s maximálními detaily a HDR. Soubor s nastavením (vše na maximum) a uložená testovací pozice ke stažení: zde.

Anti-aliasing i anizotropní filtrování vynuťte v ovladačích, v souboru Oblivion.ini se přesvědčte, že máte vypnutou vertikální synchronizaci (iPresentInterval=0). Po spuštění hry si nahrajte mou uloženou pozici číslo 260 a po načtení ihned začnětě logování FRAPSem a pohyb vpřed. Držte stále klávesu pro pohyb vpřed, dokud se neobjeví nápis upozorňující na to, že dále už nemůžete. Když nastavíte automatické vypnutí FRAPSu po 35 vteřinách, nic taky nezkazíte.

Tom Clancy's H.A.W.X. (DX10.1), World in Conflict (DX10)

Tom Clancy's H.A.W.X.

V arkádovém simulátoru bojových letadel lze využít nejen DirectX 10 pro
efekty jako SSAO či volumetrické paprsky, ale také DirectX 10.1. Tuto
revizi lze použít jak pro zrychlení hry na kartách, které ji podporují
(což činím), nebo pro zlepšení obrazu nastavením SSAO na very high (což
kvůli porovnatelnosti výsledků s kartami bez podpory DirectX 10.1
nečiním).

V nabídce s grafikými nastaveními je i tlačítko spouštějící zabudovaný
benchmark, což v praxi znamená oblet města. Průběh loguji samozřejmě i
FRAPSem, výstupem benchmarku jsou totiž jen dvě celočíselné hodnoty
(průměrné a trošku nepochopitelně rovněž maximální fps).

World in Conflict

Testuji s upraveným profilem very high details (zapnul jsem i
water reflects clouds (voda odráží oblaka), anizotropní filtrování
navýšil na 16×). Používám vestavěný benchmark.

Unigine Heaven 2.0 a 3DMark Vantage (DX10)

Unigine Heaven 2.0

 

 

3DMark Vantage

Vantage

Zájemci o v 3DMarku Vantage použité technologie jejich popis najdou v tomto whitepaperu (PDF). V grafech najdete pouze výsledky z GPU testu.

GeForce 8800 GTX, 768 MB, Extreme:

GeForce GTS 450, 1024 MB, Performance (GPU PhysX) a Extreme:

GeForce GTX 460, 1024 MB, Extreme:

GeForce GTX 460, 768 MB, Extreme:

Radeon HD 5830, Extreme:

GeForce GTX 470, Extreme:

Radeon HD 5850, Extreme:

GeForce GTX 480, Extreme:

GeForce GTX 285, Extreme:

Radeon HD 5870, Extreme:

Radeon HD 5970, Extreme:

GeForce GTX 295, Extreme:

Zájemci o v 3DMarku Vantage použité technologie jejich popis najdou v tomto whitepaperu (PDF). V grafech najdete pouze výsledky z GPU testu.

Nastavení shrnuje tato tabulka přímo od Futuremarku:

Spotřeba, teplotní testy, otáčky ventilátoru

Spotřeba

Je měřena spotřeba celého PC (bez monitoru, viz kapitola Testovací sestava) pomocí zásuvkového wattmetru FK Technics. Nastavení jednotlivých her pro pro měření spotřeby a teploty je popsáno v následující kapitole.

Teplota

Výkon/watt

Nastavení pro jednotlivé hry:

  • Crysis: ambush, enthusiast, DX10, 1920 × 1200 px
  • Far Cry 2: ranch medium, ultra, DX10.1, 4× MSAA, 1920 × 1200 px
  • Oblivion: testovací pozice zde, max. detaily, HDR, 4× MSAA, 2560 × 1600 px
  • Anno 1404: max. detaily, 4× MSAA, 2560 × 1600 px
  • Metro 2033: chase, DX10, 1920 × 1200 px, very high, 4× MSAA

S paušálním odečtem 130 W jakožto odhadované spotřeby PC bez monitoru a bez grafické karty. Poměr výkon (jednotka snímky za sekundu) / spotřeba minus 130 (jednotkou jsou watty) by měl ještě více odrážet to, co chceme analyzovat: efektivitu GPU vzhledem k odběru elektrické energie.

Shrnutí výkonu, verdikt

Shrnutí výkonu

Na
průměrném výkonu se podílelo celkem sedmnáct her, každá stejnou vahou.
Díky přepočtu na procenta nejsou zvýhodňovány hry s vysokým průměrným
počtem snímků za sekundu, u her s vícero dílčími měřeními (Aliens vs.
Predator, Stalker: Call of Pripyat či třeba Colin McRae: DiRT 2) jsem
bral do celkového výsledku v potaz právě jen průměr z dílčích subtestů.
Základem je GeForce 8800 GTX, relativní výkon dalších karet je odvozen od
jejího výsledku.

ICTS24

Verdikt

Samozřejmě zde nehodlám na základě čtyř výše uvedených grafů pranýřovat skoro čtyři roky starou grafickou kartu. Naopak. Nakonec vyšla krásná ilustrace toho, jak velký (nebo pro někoho malý) pokrok grafické karty urazily.

  • Nejvýkonnější jednočipová grafika dneška, GeForce GTX 480 je už v 1920 × 1200 s 4× MSAA průměrně dvaapůlkrát rychlejší než GeForce 8800 GTX.
  • GeForce 8800 GTX je jen o něco pomalejší než GeForce GTS 450. Bude na tom tedy podobně jako Radeon HD 5750.
  • Právě GTS 450 nebo i Radeon HD 5770 ještě nejsou pro majitele GeForce 8800 GTX či podobně výkonných karet (. To ale platí jen v případě, že nehledíte na spotřebu, snadnost tichého chlazení nebo nové funkce (DirectX 11, GPU akcelerace videa), ale pouze na herní výkon. Výrazně si pomůžete až s Radeonem HD 5830 či spíše GeForce GTX 460.
  • Spotřeba GeForce 8800 GTX kvůli špatně řešené správně napájení činí kolem 100 W, což je v dnešní době neakceptovatelné.
  • V metodice udržuji ještě jednu hru, která je dokonce starší než 8800 GTX. V Oblivionu však k mému překvapení není (na rozdíl od některých novějších her) GeForce GTS 450 „dobovou“ 8800 GTX poražena.

GeForce 8800 GTX, 768 MB, 384-bit

+ skoro čtyři roky trvající status přinejmenším slušné herní grafiky
+ upgradem pro hry je až Radeon HD 5830 nebo GeForce GTX 460 (tedy ne GTS 450 či HD 5700)
+ s DX10 kartou stále nejste ve hrách nijak závažně ochuzeni
 
+ dostatečná paměťová propustnost i výkon příslušných jednotek udržuje výkon i ve vysokých rozlišeních s 4× MSAA
- vysoká spotřeba v klidu
- překonána daleko menšími, méně se zahřívajícími a daleko méně spotřebujícími GPU
- na nové hry ve vysokém rozlišení už není

- bez akcelerace HD videa 

- hlučnost po startu a v zátěži