Když Nvidia už někdy v době uvedení Fermi ukazovala grafy s exponenciální křivkou vyjadřující nárůsty efektivity dalších generací GPU (populární výkon/watt), zapochybovali asi nejen příznivci její konkurence. Po Fermi však přišel Kepler a pravděpodobně do načrtnuté exponenciály zapadl. GeForce GTX 750 Ti a GTX 750 jsou prvními vyslankyněmi architektury Maxwell a mají tak ještě ve zmíněném ohledu dalece předčit všechna GPU Kepler.
Nvidia přitom musela ale pracovat s tím, co je – tedy 28nm výrobním procesem. Sama uvádí, že po stránce funkcí je Maxwell takřka stejný jako Kepler. Spousta prvků v GPU je ale redesignována tak, aby byla co nejefektivnější. První čip z rodiny Maxwellů – GM107 – míří do nižší střední třídy a Nvidia nahrazuje GeForce GTX 650 Ti. To je grafická karta za ceny kolem 3000 Kč a blízko této hranice se pohybovala také GTX 650 Ti Boost. O ní se Nvidia zmíní teprve na explicitní otázku a stručně odpovídá, že tato karta už byla dříve ukončena.
Letmý pohled na uspořádání čipu vám neprozradí žádné zásadní změny. Ve srovnání Kepleru a Maxwellu jsou však důležité počty prováděcích jednotek a samozřejmě TDP:
GTX 650 | GTX 650 Ti | GTX 750 | GTX 750 Ti | GTX 650 Ti Boost | GTX 660 | |
Jádro | GK107 | GK106 | GM107 | GM107 | GK106 | GK106 |
Velikost jádra | 118 mm² | 221 mm² | 148 mm² | 148 mm² | 221 mm² | 221 mm² |
Tranzistorů | 1,3 mld. | 2,54 mld. | 1,87 mld. | 1,87 mld. | 2,54 mld. | 2,54 mld. |
Stream procesorů | 384 | 768 | 512 | 640 | 768 | 960 |
Takt jádra | 1058 MHz | 925 MHz | 1020/1085 MHz | 1020/1085 MHz | 980/1033 MHz | 980/1033 MHz |
ROP/RBE | 16 | 16 | 16 | 16 | 24 | 24 |
Texturovacích jedn. | 32 | 64 | 32 | 40 | 64 | 80 |
Takt pamětí | 5 GHz | 5400 MHz | 5400 MHz | 5400 MHz | 6008 MHz | 6008 MHz |
Šířka sběrnice | 128-bit | 128 b | 128 b | 128 b | 192 b | 192 b |
Propustnost pamětí | 80 GB/s | 86,4 GB/s | 86,4 GB/s | 86,4 GB/s | 144,2 GB/s | 144,2 GB/s |
Fillrate (textury) | 33,9 Gtx/s | 59,2 Gtx/s | 32,6 Gtx/s | 40,8 Gtx/s | 62,7 Gtx/s | 78,4 Gtx/s |
TDP | 64 W | 110 W | 55 W | 60 W | 134 W | 140 W |
GM107 papírově nevypadá opravdu bůhvíjak úžasně. Nvidia však přepracovala ALU tak, že každý SM obsahující původně u Kepleru celkem 192 stream procesorů (v hantýrce Nvidie CUDA procesorů) už není opatřen jednou řídící jednotkou, ale celkem čtyřmi. Navíc SM už je složen jen z celkem 128 SP, takže jedna kontrolní jednotka připadá na 32 SP. To dle slov Nvidie přineslo o 35 % výkonu navíc a především zdvojnásobení výkonu na watt. Co se týče šířky paměťové sběrnice (128 bitů) a relativné nízkého taktu GDDR5 (5,4 GHz efektivně), tak Nvidia tvrdí, že díky efektivní práci L2 cache v Maxwellu je dopad tohoto úzkého hrdla minimalizován.
Nvidia si jako působivá srovnání vytahuje karty z minulých generací. Například GTX 480 s TDP 250 W by měla dnes podle Nvidie předvést asi tak podobný výkon jako 60W GTX 750 Ti a údajně ještě stále populární GTX 550 Ti má ani ne poloviční herní výkon při takřka dvojnásobném příkonu. Z konkurence si bere na mušku Radeon R7 260X, který by měl být ve většině her asi o 10–25 % pomalejší a mít také takřka dvakrát vyšší TDP.
První otestovanou GTX 750 Ti se na EHW stala karta od MSI. Ta je v edici Gaming mírně přetaktována, ale především je na vlastním (větším) PCB s už mnohokrát vychváleným chladičem Twin Frozr IV. Na provedení mě trochu drásá volba výstupů: D-Sub, DVI-D a HDMI. Správně to mělo být DVI-I, HDMI a DisplayPort. Tak snad příště.
Referenční GeForce GTX 750 (Ti) je mnohem kratší (necelých 15 cm) a má velmi jednoduchý chladič. Přídavné napájení nepotřebuje ani jedna varianta GM107.
MSI bude GTX 750 i 750 Ti prodávat i ve variantě s jednodušším chladičem a o dvě stovky levněji.
Nvidia pro GTX 750 Ti stanovila cenu 115 EUR a u nás by to mělo být 3799 Kč vč. DPH (doporučená maloobchodní cena). GTX 750 s 1 GB GDDR5 by měla být k mání za 92 EUR čili 2999 Kč vč. DPH. MSI GTX 750 Ti OC s Twin Frozr IV bude stát 3950 Kč, s obyčejným chladičem pak 3750 Kč. Tytéž variace od MSI na téma GTX 750 (bez Ti) přijdou na 3150, resp. 2950 Kč.
Parametry GTX 750 Ti a detekce schopností videoprocesoru
Ovladače GeForce 334.69
GPGPU testy
Parametry referenčních karet/grafických řešení
GeForce | GeForce | GeForce | GeForce | GeForce | GeForce | |
GTX 650 | GTX 650 Ti | GTX 750 | GTX 750 Ti | GTX 650 Ti Boost | GTX 660 | |
Jádro | GK107 | GK106 | GM107 | GM107 | GK106 | GK106 |
Výrobní proces | 28 nm | 28 nm | 28 nm | 28 nm | 28 nm | 28 nm |
Velikost jádra | 118 mm² | 221 mm² | 148 mm² | 148 mm² | 221 mm² | 221 mm² |
Tranzistorů | 1,3 mld. | 2,54 mld. | 1,87 mld. | 1,87 mld. | 2,54 mld. | 2,54 mld. |
Stream procesorů | 384 | 768 | 512 | 640 | 768 | 960 |
Takt jádra | 1058 MHz | 925 MHz | 1020/1085 MHz | 1020/1085 MHz | 980/1033 MHz | 980/1033 MHz |
Takt SP | 1058 MHz | 925 MHz | 1020/1085 MHz | 1020/1085 MHz | 980/1033 MHz | 980/1033 MHz |
ROP/RBE | 16 | 16 | 16 | 16 | 24 | 24 |
Texturovacích jedn. | 32 | 64 | 32 | 40 | 64 | 80 |
Paměť | 1 GB GDDR5 | 1 GB GDDR5 | 1/2 GB GDDR5 | 2 GB GDDR5 | 2 GB GDDR5 | 2 GB GDDR5 |
Takt pamětí | 5 GHz | 5400 MHz | 5400 MHz | 5400 MHz | 6008 MHz | 6008 MHz |
Šířka sběrnice | 128-bit | 128 b | 128 b | 128 b | 192 b | 192 b |
Propustnost pamětí | 80 GB/s | 86,4 GB/s | 86,4 GB/s | 86,4 GB/s | 144,2 GB/s | 144,2 GB/s |
Fillrate (pixely) | 16,9 Gpx/s | 14,8 Gpx/s | 16,3 Gpx/s | 16,3 Gpx/s | 23,5 Gpx/s | 23,5 Gpx/s |
Fillrate (textury) | 33,9 Gtx/s | 59,2 Gtx/s | 32,6 Gtx/s | 40,8 Gtx/s | 62,7 Gtx/s | 78,4 Gtx/s |
FLOPS | 813 GFLOPS | 1421 GFLOPS | 986 GFLOPS | 1233 GFLOPS | 1881 GFLOPS | 1888 GFLOPS |
TDP | 64 W | 110 W | 55 W | 60 W | 134 W | 140 W |
Délka karty | 15 cm | 23 cm | 15 cm | 15 cm | 23 cm | 23 cm |
DirectX | 11.0 | 11.0 | 11.0 | 11.0 | 11.0 | 11.0 |
Radeon | Radeon | Radeon | Radeon | Radeon | Radeon | |
HD 7750 | R7 260 | HD 7770 GHz Ed. | HD 7850 | R7 260X | R9 270 | |
Jádro | Cape Verde | Bonaire | Cape Verde | Pitcairn | Bonaire | Curacao |
Výrobní proces | 28 nm | 28 nm | 28 nm | 28 nm | 28 nm | 28 nm |
Velikost jádra | 123 mm² | 160 mm² | 123 mm² | 212 mm² | 160 mm² | 212 mm² |
Tranzistorů | 1,5 mld. | 2,08 mld. | 1,5 mld. | 2,8 mld. | 2,08 mld. | 2,8 mld. |
Stream procesorů | 512 | 768 | 640 | 1024 | 896 | 1280 |
Takt jádra | 800 MHz | 1000 MHz | 1000 MHz | 860 MHz | 1100 MHz | 900/925 MHz |
Takt SP | 800 MHz | 1000 MHz | 1000 MHz | 860 MHz | 1100 MHz | 900/925 MHz |
ROP/RBE | 16 | 16 | 16 | 32 | 16 | 32 |
Texturovacích jedn. | 32 | 48 | 40 | 64 | 56 | 80 |
Paměť | 1 GB GDDR5 | 2 GB GDDR5 | 1 GB GDDR5 | 2 GB GDDR5 | 2 GB GDDR5 | 2 GB GDDR5 |
Takt pamětí | 4,5 GHz | 6 GHz | 4,5 GHz | 4,8 GHz | 6,5 GHz | 5,6 GHz |
Šířka sběrnice | 128-bit | 128-bit | 128-bit | 256-bit | 128-bit | 256-bit |
Propustnost pamětí | 72 GB/s | 96 GB/s | 72 GB/s | 153,6 GB/s | 104 GB/s | 179,2 GB/s |
Fillrate (pixely) | 12,8 GPx/s | 16 GPx/s | 16 GPx/s | 27,5 GPx/s | 17,6 GPx/s | 29,6 GPx/s |
Fillrate (textury) | 25,6 GTx/s | 48 GTx/s | 40 GTx/s | 55 GTx/s | 61,6 GTx/s | 74 GTx/s |
FLOPS | 819 GFLOPS | 1536 GFLOPS | 1280 GFLOPS | 1761 GFLOPS | 1969 GFLOPS | 2,37 TFLOPS |
TDP | >55 W | >95 W | >80 W | >130 W | >115 W | >150 W |
Délka karty | 15 cm | 21 cm | 17 cm | 21 cm | 21 cm | 25 cm (MSI) |
DirectX | 11.2 | 11.2 | 11.2 | 11.2 | 11.2 | 11.2 |
GeForce | GeForce | GeForce | Radeon | Radeon | Radeon | |
GT 640 DDR3 | GTX 460 | GTX 560 | HD 6670 | HD 7730 | R7 250 | |
Jádro | GK107 | GF104 | GF114 | Turks | Cape Verde | Oland |
Výrobní proces | 28 nm | 40 nm | 40 nm | 40 nm | 28 nm | 28 nm |
Velikost jádra | 118 mm² | ~330 mm² | ~330 mm² | 118 mm² | 123 mm² | 90 mm² |
Tranzistorů | 1,3 mld. | 1,95 mld. | 1,95 mld. | 716 mil. | 1,5 mld. | 1,04 mld. |
Stream procesorů | 384 | 336 | 336 | 96 (480) | 384 | 384 |
Takt jádra | 900 MHz | 675 MHz | 810 MHz | 800 MHz | 800 MHz | 1000/1050 MHz |
Takt SP | 900 MHz | 1350 MHz | 1620 MHz | 800 MHz | 800 MHz | 1000/1050 MHz |
ROP/RBE | 16 | 32 | 32 | 8 | 8 | 8 |
Texturovacích jedn. | 32 | 56 | 56 | 24 | 24 | 24 |
Paměť | 2 GB DDR3 | 1 GB GDDR5 | 1 GB GDDR5 | 1 GB GDDR5 | 1 GB GDDR5 | 1 GB GDDR5 |
Takt pamětí | 1,8 GHz | 3600 MHz | 4004 MHz | 4 GHz | 4,5 GHz | 4,5 GHz |
Šířka sběrnice | 128-bit | 256-bit | 256-bit | 128-bit | 128-bit | 128-bit |
Propustnost pamětí | 28,5 GB/s | 115,2 GB/s | 128 GB/s | 64 GB/s | 72 GB/s | 73,6 GB/s |
Fillrate (pixely) | 14,4 Gpx/s | 21,6 Gpx/s | 25,9 Gpx/s | 6,4 GPx/s | 6,4 GPx/s | 8 GPx/s |
Fillrate (textury) | 28,8 Gtx/s | 37,8 Gtx/s | 45,4 Gtx/s | 19,2 GTx/s | 19,2 GTx/s | 24 GTx/s |
FLOPS | 691 GFLOPS | 907 GFLOPS | 1088 GFLOPS | 768 GFLOPS | 614 GFLOPS | 768 GFLOPS |
TDP | 65 W | 160 W | 150 W | >66 W | ? W | >65 W |
Délka karty | 15 cm | 21 cm | 21 cm | 15 cm | 15 cm | 15 cm |
DirectX | 5.0 | 11.0 | 11.0 | 11.0 | 11.2 | 11.2 |
A6-5400K | A8-5800K | A10-6800K | A10-7850K | Pentium G3420 | Core i5-4670K | |
HD 7540D | HD 7660D | HD 8670D | R7 | HD Graphics | HD Graph. 4600 | |
Jádro | Devastator | Devastator | Devastator | Spectre | Haswell GT1 | Haswell GT2 |
Výrobní proces | 32 nm | 32 nm | 32 nm | 28 nm | 22 nm | 22 nm |
Velikost jádra | 246 mm² | 246 mm² | 246 mm² | 245 mm² | 118 mm² | 177 mm² |
Tranzistorů | 1,3 mld. | 1,3 mld. | 1,3 mld. | 2,41 mld. | ? mld. | 1,4 mld. |
Stream procesorů | 48 (192) | 96 (384) | 96 (384) | 512 | 10 | 20 |
Takt jádra | 760 MHz | 800 MHz | 844 MHz | 720 MHz | 1100 MHz | 1200 MHz |
Takt SP | 760 MHz | 800 MHz | 844 MHz | 720 MHz | 1100 MHz | 1200 MHz |
ROP/RBE | 4 | 8 | 8 | 8 | 2 | 2 |
Texturovacích jedn. | 24 | 24 | 24 | 32 | 2 | 4 |
Paměť | sdílená | sdílená | sdílená | sdílená | sdílená | sdílená |
Takt pamětí | 1866 MHz | 1866 MHz | 2133 MHz | 2400 MHz | 1600 MHz | 1600 MHz |
Šířka sběrnice | 128-bit | 128-bit | 128-bit | 128-bit | 128-bit | 128-bit |
Propustnost pamětí | 29,9 GB/s | 29,9 GB/s | 34,1 GB/s | 38,4 GB/s | 25,6 GB/s | 25,6 GB/s |
Fillrate (pixely) | 3 GPx/s | 6,4 GPx/s | 6,75 GPx/s | 5,8 GPx/s | 2,2 Gpx/s | 2,4 Gpx/s |
Fillrate (textury) | 18,2 GTx/s | 19,2 GTx/s | 20,3 GTx/s | 23 GTx/s | 2,2 GTx/s | 4,8 GTx/s |
FLOPS | 292 GFLOPS | ~700 GFLOPS | 779 GFLOPS | 737 GFLOPS | – | – |
TDP | 65 W (s CPU) | 100 W (s CPU) | 100 W (s CPU) | 95 W (s CPU) | 53 W (s CPU) | 84 W (s CPU) |
Délka karty | – | – | – | – | – | – |
DirectX | 11.0 | 11.0 | 11.0 | 11.2 | 11.1 | 11.1 |
Testovací sestavy a návod na interaktivní grafy
Testovací sestavy
Společným bodem testovacích sestav byly tyto komponenty:
- procesor: AMD A10-5800K (v případě testování diskrétních grafických karet)
- chladič: Noctua NH-C12P
- paměti: 2× 2 GB DDR3-2000 Kingston HyperX T1
(nastaveny na 1600-8-8-24-1T v případě Intel Core i3/i5 a na 1866-9-10-9-27-1T v případě AMD A10-5800K, na 2133-11-12-11-30-2T s 1,6 V u A10-6800K a konečně 2400-11-13-13-30-2T@1,65V s A10-7850K) - zdroj: Seasonic EnergyKnight (T3), 400 W
- pevný disk: WD Caviar (WD3200AAKS), 320 GB
- operační systém: Windows 7 Enterprise SP1, 64-bit
Není-li řečeno jinak, je testováno v rozlišení 1920 × 1080 px.
Za zapůjčení pamětí DDR3 děkujeme společnosti Kingston |
Za poskytnutí chladiče Noctua NH-C12P a teplovodivé pasty Noctua NT-H1 děkujeme společnosti RASCOM Computerdistribution |
Monitor
K testování grafických karet nám poskytla herní monitor Foris FS2333 společnost EIZO.
Platforma FM2+
Při sledování příkon celého PC (platformy) je důležité mít na paměti, že i při stejném nastavení je A88X-Pro trochu „žravější“ než Gigabyte F2A85X-UP4. Tak například v kombinaci s procesorem A10-5800K a zmíněnou GTX 460 (kterou se mi nakonec povedlo v F2A85X-UP4 rozjet) činil rozdíl příkonu celé sestavy v idle 6 W (52 na F2A85X a 58 s A88X-Pro), ve hře World in Conflict, kde je zatíženo poměrno dost CPU i GPU činil rozdíl 5 W (231 vs. 236 W). S GTX 660 ve slotu byl rozdíl kupodivu menší (46 vs. 48 W) a s Radeonem R9 270 jsem se opět dostal na zřetelně více wattů u A88X-Pro (52 vs. 59 W v idle, 210 vs. 220 W ve World in Conflict).
Platforma FM2
APU Trinity a Richland byla osazena do desky Gigabyte A85X-UP4. Ta patří v dané platformě spíše k těm dražším a dá se tedy očekávat, že v případě testů přetaktování lze snadno najít možnosti daného řešení (či alespoň kusu).
Platforma LGA 1150
Integrované grafiky CPU Haswell byly otestovány v základní desce Gigabyte Z87X-UD3H.
Platforma LGA 1155
Core i5-3225 jsem testoval v základní desce Gigabyte Z77X-UD5H. Jedná se určitě o vyšší střední třídu desek se silnou napájecí kaskádou pro stabilitu při přetaktování, takže to se mohlo podepsat i na příkonu.
Za zapůjčení základních desek děkujeme společnosti Gigabyte |
Interaktivní grafy 2.0
- Pokud se vám nelíbí písmo se stíny, velmi snadno je vypnete v Nastavení. Máte-li ještě problémy s rychlostí zobrazování, můžete v Nastavení povypínat také animace.
- Pořadí testovaných produktů můžete snadno změnit zvolením řazení dle naměřené hodnoty v testu, podle různých skupin apod.
- Po najetí myší na některou z položek se z této stane 100 % (základ) a ostatní položky se spočítají podle ní. Všechny absolutní hodnoty se změní na relativní. Zpět se změní, až kurzor myši opustí oblast s názvy položek.
- Budete-li chtít nějakou položku v grafech sledovat, můžete si její pruh libovolně obarvit. Stačí klepnout levým tlačítkem myši na barevném pruhu a vybrat si z palety. Máte-li povoleny cookies, mělo by vám nastavení vydržet i pro další grafy v dalších kapitolách.
- Cenu a další základní parametry můžete zobrazit kdykoliv v každém grafu: stačí u vybraného procesoru najet kurzorem myši nad pruh s hodnotou (měření) a chvíli počkat. Objeví se jako plovoucí nápověda (tooltip).
- Zámek základu (produkt, který se stane těmi 100 % a od něhož se odvíjí další relativní hodnoty) aktivujete pomocí současného stisku klávesy CTRL a levého tlačítka myši nad produktem (či jeho pruhem v grafu), který chcete uzamknout.
- Před prvním použitím grafů si pro jistotu vyprázdněte cache prohlížeče (zřejmě bude stačit refresh) a v případě problému smažte i příslušné cookies.
- Interaktivní grafy 2.0 jsou kompatibilní s prohlížeči Firefox (testovány verze 4.x), Opera (testováno s 11.x), Internet Explorer 8 a 9 (verze 7 a starší už nejsou podporovány) a Chrome (zde mají tooltipy hranaté rohy namísto kulatých).
- V případě problémů se nejdříve ujistěte, že máte v prohlížeči povoleny skripty i cookies, dále splnění bodů 7 a 8, teprve potom nám chybu prosím co nejpřesněji reportujte. Jedná se o první ostré nasazení grafů, takže i přes delší testování autorem a redakcí při komplexnosti aplikace určitě ještě nějaké mouchy v nějaké kombinaci objevíte.
Aliens vs. Predator, Battlefield 3
Aliens vs. Predator
Scénu z úvodu hry jsme nově nahradili samostatným benchmarkem, který je na internetu k dispozici ke stažení zdarma. Běží v režimu DirectX 11 a je o poznání náročnější než náš původní test. Používáme výchozí nastavení benchmarku zahrnující zapnutou teselaci.
Battlefield 3
V Battlefield 3 je využit předvolený profil nastavení kvality Vysoký. Benchmarkujeme tradičně scénu ze začátku druhého dějství kampaně (výstup z transportéru a briefing na orientálnímu trhu).
Battlefield 4, BioShock Infinite
Battlefield 4
V Battlefield 4 testuji jednu z nejnáročnějších cutscén kampaně. U multiplayeru budou zejména nároky na CPU vyšší, ale co se náročnosti GPU týče, tak tento průchod lodí s všemožnými efekty patří k těm nejlépe škálujícím.
Do celkového výsledku počítám jen předvolený profil nastavení kvality Vysoký. Testuji ale i tři další profily celkového nastavení detailů:
BioShock Infinite
Stejně jako další nové hry z AMD Game Evolved (či přímo Never Settle) i BioShock Infinite obsahuje docela hezký zabudovaný benchmark, který odzkouší několik lokací. Nastavení Ultra (DX11) zajistí využití všech moderních ve hře využitých technologií kromě DDOF (Diffusion Depth Of Field). Výsledkem v grafu jsou průměrná fps napříč všemi lokacemi (průměr průměrných fps).
Call of Duty 4, Crysis 3
Call of Duty 4: Modern Warfare
Ačkoli se asi nejvíce zapsal druhý díl této série, tak i čtvrtý byl v multiplayeru hodně rozšířen. Nijak zvlášť náročnou hru jsem testoval se všemi detaily na maximu a také s 4× MSAA a 8× AF.
Crysis 3
V Crysis 3 jsem nakonec musel zvolit předvolbu Nízký, aby hra byla plynulá alespoň na Radeonu HD 7750. Testuji scénu ze začátku příběhu, kdy se v dešti objevíte v přístavu a máte běžet za Psychem. Po vyběhnutí schodů FRAPS vypínám v první místnosti.
Enemy Territory: Quake Wars, F1 2012
Enemy Territory: Quake Wars
Enemy Territory představuje jediný OpenGL test v testovací sadě. Quake Wars používají značně upravený Doom 3 engine, obohacený především o technologii MegaTexture (více o technologii v článku na Beyond3D). Pro testy používám nejvyšší detaily s 4× MSAA a 8× AF, přes konzoli vypínám limit 30 (com_unlockFPS 1) i 60 fps (com_unlock_maxFPS 0, je vhodné nastavit do autoexec.cfg).
Pro účely testování jsem si nahrál vlastní timedemo (recordtimenetdemo), které měří výkon v rozsáhlé lokaci se stromy (Valley). Timedemo (pro verzi 2.0) ke stažení: zde.
F1 2012
Formule od Codemasters mají také zabudovaný benchmark a tím testuji celkové nastavení určené profilem Ultra.
IL-2 Sturmovik: Cliffs of Dover, Mafia II
IL-2 Sturmovik: Cliffs of Dover
V IL-2 Sturmovik: Cliffs of Dover používám replay BlackDeath.trk. 210sekundový průběh záznamu zachytím FRAPSem, předtím v nastavení vyberu profil detailů Vysoké. Anti-aliasing nezapínám, vypnuté zůstává i SSAO.
Mafia II
Druhou Mafii už i na levných grafikách testuji s celkovým nastavením High, APEX PhysX zůstává vypnuta.
Metro Last Light, Resident Evil 6
Metro Last Light
Metro: Last Light navazuje na postapokalyptické Metro 2033. Hru pohání 4A Engine, který je dílem vývojářů z 4A Games. Stojí za ním spoluautoři X-Ray Engine použitého v herní sérii S.T.A.L.K.E.R. Engine, poprvé použitý v Metro 2033, vznikl pro herní konzole a PC. Podporoval rozhraní DirectX 9, DirectX 10 a DirectX 11 a řadu pokročilých efektů a technik včetně volumetrické mlhy, rozostření (pohybové) objektů, sub-surface scattering (simulace částečné průsvitnosti objektů, což je důležité třeba pro napodobení kůže) nebo parallax mapping (simulace nerovností povrchů). Pro vykreslování obrazu s využitím velkého množství světelných zdrojů se využívá deferred lighting (či deferred shadding nebo rendering).
V novém Metro: Last Light přibyla řada efektů a technologií. Vývojáři ale pořádně zapracovali i na optimalizaci. Hra se i přes lepší grafiku chová při maximálních detailech o poznání lépe než její předchůdce.
Very High | High | Medium | Low | |
Ambient Occlusion | Precomputed + SSAO | Precomputed + SSAO | Approximate | Approximate |
Analytical Anti-Aliasing | Enabled | Enabled | Enabled | Enabled |
Bump Mapping | Precise | Precise | Coarse | Coarse |
Detail Texturing | Enabled | Enabled | Enabled | Disabled |
Geometric Detail | Very High | High | Normal | Low |
Image Post-Processing | Full | Full | Normal | Normal |
Light-Material Interaction | Full | Normal | Normal | Normal |
Motion Blur | Camera + Objects | Camera | Disabled | Disabled |
Parallax Mapping | Enabled + POM | Enabled | Disabled | Disabled |
Shadow Filtering | Hi-Quality | Hi-Quality | Normal | Fast |
Shadow Resolution | 9,43 Mpx | 6,55 Mpx | 4,19 Mpx | 2,35 Mpx |
Skin Shading | Subsurface Scattering | Simple | Disabled | Disabled |
Soft Particles | Enabled | Enabled | Disabled | Disabled |
Volumetric Texturing | Full Quality + Sun Shafts | Low Precision | Disabled | Disabled |
Nastavení grafiky přímo ve hře je oproti předchůdci výrazně zjednodušené. Podrobnější nastavení detailů zmizelo a nahradilo je jen globální nastavení. Jak ovlivňuje jednotlivé efekty je shrnuto v tabulce z GeForce.com. Pro podrobnější popis toho, co které nastavení znamená, vás odkáži tamtéž, s příklady by to vydalo na další článek.
Resident Evil 6
Pro test RE6 používám samostatný benchmark s výchozím nastavením (FXAA3HQ, Motion Blur: On, Shadow/Texture/Screen Quality: High).
Sleeping Dogs, Stalker: Call of Pripyat
Sleeping Dogs
Také Sleeping Dogs nemohli být oproštěni od zabudovaného benchmarku. Profil High jsem upravil jen na místě anti-aliasingu (volba Normal znamená pouze FXAA).
Stalker: Call of Pripyat
Ke třetímu dílu Stalkera naštěstí existuje volně šiřitelný benchmark, v něm používám k testům pouze čtvrtou, nejnáročnější část (nastavení se slunečními paprsky – SunShafts). Vše je nastaveno na naprosté maximum (DX11 funkce jako teselace nebo CHS), MSAA pak na stupeň 4×.
The Elder Scrolls V: Skyrim, The Witcher 2 (Zaklínač 2)
The Elder Scrolls V: Skyrim
Problémy nastíněné v článku Skyrim a HiRes Texture Pack: porovnání grafik mě přivedly na následující metodiku testování: po projití několika uložených pozic a zjištění, že Markarth už nedělá problémy ani Radeonům, ani GeForce, jsem vybral tři uložené pozice v lokacích Whiterun (pohled na velkou část měst a ještě i za hradby), Riverwood (stromy, voda, vesnice) a Ragged Flagon (podzemí Riftenu). Po nahrání uložené pozice počkám, až se uklidní ukazatel se snímky za sekundu (načítání z disku, obyčejně je to ale tak dvě až tři sekundy po zmizení nahrávací obrazovky) a poté měřím dvacet sekund (nastaveno ve FRAPSu). Nahraji další pozici a postup opakuji. V grafu je hodnota průměrných fps spočtena jako průměr tří dvacetisekundových měření. Více o testování v článku Skyrim a HiRes Texture Pack: porovnání grafik.
První graf je pro méně náročné nastavení, při němž je nejdříve předvolen profil High a poté jen vypnut anti-aliasing. Druhý graf obsahuje výsledky s předvolbou Ultra High a zahrnuje tak právě třeba i 8× MSAA.
The Witcher 2
Testováno bylo ve verzi hry 3.3 a měřeno bylo v rozlišení 1920 × 1080 px s upraveným profilem detailů Nízký. Jen limit paměti textur byl navýšen na Vyšší a také vzdálenost zobrazování jsem změnil na Normální.
Po seznámení se hrou jsme vybrali dvě lokace, jež patří určitě mezi nejnáročnější: poslední část kapitoly zvané Vedení útoku, kdy drak proboří hradby a útočí na vaši družinu i nepřátelské vojáky, a z pokročilejší fáze hry potom v lese se odehrávající misi Hnízda Nekkerů. První souhrnný graf prezentuje průměr z těchto dvou lokací.
" width="560" height="315" frameborder="0">
" width="560" height="315" frameborder="0">
Více o testování v článku Witcher 2 v2.1 – rychlotest 19 grafických karet
Tomb Raider (2013), Total War: Shogun 2
Tomb Raider (2013)
S novým Tomb Raiderem jste se mohli setkat už ve dvou testech podrobných měření s nástrojem FCAT (viz např. FCAT a testy (ne)plynulosti: když se nehraje jen na průměry), takže jste s teselovanou Larou jistě obeznámeni. V nastavení Normal není měřeno s teselací, v nastavení High je naopak teselaci zkoušena.
Total War: Shogun 2
Plná verze Shoguna 2 nabízí nejen DirectX 11, ale také vestavěný benchmark. Testuji jednak s přednastaveným profilem 1080p High a poté ještě s vlastním nastavením vycházející z celkových detailů „Medium“ s pár úpravami.
World in Conflict, World of Tanks
World in Conflict
Testuji s profilem Nejvyšším (zahrnuje DX10 rendering a 4× MSAA), detailně je použité nastavení vidět na screenshotech:
World of Tanks 8.5
Co se týče využití GPU, jsou nejnáročnější záležitostí World of Tanks určitě křoví nejlépe v kombinaci s pohledem skrze optiku režimu snipera. Takový záznam bitvy s delším střílením skrze křoví na malebné mapě Fjords jsme pořídili a zatím grafiky mučíme s takovýmto nastavením Graphics: Improved, vše na Low, jen Textures a Visibility: Maximum a samozřejmě Extra Effects in Sniper mode: Off.
Instrukce pro srovnatelné testování:
- uložte replay na pevný disk
- spusťte FRAPS a na kartě FPS nastavte Stop benchmark after 300 s
- pokud máte příponu .wotreplay asociovánu s WorldOfTanks.exe, potom na ni stačí poklepat. V opačném případě si vytvořte zástupce WorldOfTanks.exe a .wotreplay na ni přetáhněte
- počkejte, až na odpočtu bude 00:28 do startu zápasu (vpravo nahoře), pak spusťte logování (implicitně F11)
- výsledek najdete ve složce Frapsu jako FRAPSLOG.TXT
Více o testování a technické stránce hry v článku World of Tanks: průvodce hardwarem a nastavením pro ty, co spěchají.
Unigine Heaven 4.0 a Valley 1.0
Unigine Heaven 4.0
Jakých změn doznal Heaven, jehož první inkarnace vyšla už v roce 2009? Vývojáři údajně „drasticky“ vylepšili efekt SSDO (scene-space dimensional occlusion), vylepšili refrakci světla na čočkách (lens flare) a do části sekvence, která se odehrává v noci, zapracovali hvězdnou oblohu. Při testech nechávám teselaci na normal, anizotropní filtr nastavuji na 8:1 a multi-sampling raději vypnutý.
Unigine Valley 1.0
Poslední benchmark od Unigine vaši grafickou kartu potrápí rozlehlou krajinou a hustou, detailně renderovanou vegetací. Nastavení benchmarku vidíte na screenshotu a bude asi ještě chvíli trvat, než jej takto třída grafik zvládne.
3DMark
3DMark
Po rozličných experimentech s názvy jako 3DMark 99, 3DMark 2000 nebo 3DMark Vantage pojmenoval Futuremark nový benchmark nejjednodušeji, jak to šlo – 3DMark. Důvodem je to, že se pod tímto označením nově rozumí celý balík testů.
Verze pro Windows obsahuje tři testy – pro DirectX 11, 10 a 9. Všechny tři testy běží na enginu pro DirectX 11, takže je pro běh 3DMarku vyžadovaný operační systém s podporou DX11 (Windows Vista, Windows 7 a Windows 8), u testů pro nižší verze DirectX se ale využívají jen instrukce příslušené dané verzi, takže k jejich spuštění pak stačí grafická karta s podporou DirectX 10, případně DirectX 9.
Fire Strike
Fire Strike je určený pro výkonná PC, ze tří testů je nejnáročnější, běží pod DirectX 11 a využívá více vláken. Skládá se ze dvou testů grafiky, testu fyziky a kombinovaného testu, který zatěžuje zároveň procesor i grafickou kartu.
V enginu pro tento test se využívá multithreading, teselace (PN triangles, phong a displacement mapping s podporou triangle i quad teselace), deferred lighting, ambient occlusion, pro výpočty osvětlení povrchů může mimo jiné využívat i horizon based screen space ambient occlusion (HBAO), dále volumetrické osvětlení a osvětlení částic. Post processing zahrnuje efekty jako particle based distortion (pod tím si můžete představit třeba vlnění teplého vzduchu), depth of field (hloubka ostrosti), odrazy od čoček, bloom (počítaný Rychlou Fourierovou transformací), antialiasing (MSAA a po tone mappingu FXAA) či simulace dýmu.
Podrobnější popis použitých technologií a způsobu využití najdete opět v původní dokumentaci v angličtině, jejich přepis by vydal na další čtyři strany (kvůli používané terminologii beztak napůl anglického textu). Pokud se v daných technologiích orientujete, nemělo by vám to ani v angličtině dělat problémy.
Cloud Gate
Cloud Gate je navržený pro notebooky a domácí PC. Jde o méně náročný test, který využívá pouze rozšíření DirectX 10_0, takže se dá pouštět i na starších kartách nebo integrovaných grafikách, které DirectX 11 nepodporují. Samotný engine, na kterém běží, ale DirectX 11 vyžaduje, takže je pro spuštění zapotřebí, aby vše bylo nainstalované na operačním systému, který DirectX 11 podporuje.
Test je složený ze dvou test grafické karty a jednoho testu fyziky a je ekvivalentem pro 3DMark Vantage (v tom, že oba běží na DirectX 10). Použitý engine se ale samozřejmě liší a ani výsledné skóre není vzájemně porovnatelné. Pro test se využívá stejný engine jako u Fire Strike, pochopitelně bez rozšíření DX11.
Standardně se testuje v rozlišení 1280 × 720 bodů, test je stavěný na 256 MB videopaměti.
Ice Storm
Ice Storm je určen pro měření výkonu tabletů, ultrapřenosných notebooků a levných PC. Na měření výkonu GPU slouží první dva testy, ve třetím se testuje fyzika.
Jde o (pro PC) hodně nenáročný test, který na GeForce GTX 660 Ti někde pod dvěma tisíci fps. Má být jakýmsi ekvivalentem pro 3DMark06 pro DirectX 9, byť už není jako 3DMark06 svého času postavený na testování výkonných PC, ale na rozdíl od něj už je určený pro test výkonných mobilních zařízení.
Standardní rozlišení pro test je 1280 × 720 bodů a počítá se se 128 MB grafické paměti. S rozličnými rozměry displejů mobilních zařízení se Futuremark vyrovnal tím, že obraz v daném rozlišení renderuje napevno a následně jej zvětšuje nebo zmenšuje podle rozměrů obrazovky.
Výsledky v detailech
GeForce GTX 750 Ti
Radeon R7 (A10-7850K)
Radeon HD 5770
Radeon R9 270 OC
GeForce GTX 660 OC
Radeon HD 6950
GeForce GTX 560
GeForce GTX 460
Radeon R7 260X
Radeon HD 5850
Radeon HD 7850 OC 1 GB
GeForce GTX 650 Ti OC
GeForce GTX 650 Ti Boost OC
GeForce GT 640 GDDR5
Radeon HD 7770 GHz Ed.
Radeon HD 7790
Radeon HD 7730
Radeon HD 6670
GeForce GTX 650
GeForce GT 640
AMD Radeon HD 8670D
Intel HD 4600
Intel HD 4000
AMD Radeon HD 7660D
AMD Radeon HD 7540D
AMD Radeon HD 7750
Příkon (spotřeba), shrnutí výkonu a vyhodnocení
Příkon (spotřeba)
Spotřeba (ano příkon) celé sestavy s daným procesorem je měřena pomocí zásuvkového měřiče spotřeby elektrické energie FK Technics. A přestože chladič, zdroj a grafická karta zůstávají neměnné a paměti jsou nastaveny také velmi srovnatelně, pořád se jedná o spotřebu celé platformy dané do jisté míry také základní deskou, osazenou čipovou sadou a dalšími čipy právě na desce.
Při testování příkonu při přehrávání videa je využit program Media Player Classic Home Cinema. To, kde je DXVA (GPU) akcelerace přehrávání videa aktivní, poznáte asi i bez průkazného screenshotu.
Provozní vlastnostni a přetaktování
Nad nehlučností Twin Frozra IV se už nesčetněkrát rozplýval Adam Vágner, takže pro absolutní měření hluku TF IV při různých hladinách otáček vás odkáži na jeho článek. Bude stačit, když víte, že u GTX 750 Ti se větráky TF IV drží pořád kolem 960 ot./min.
Přetaktování je bohužel omezeno na +135 MHz k jádru – to zvládne testovaná karta bez zvyšování napětí.
U pamětí jsem vyzkoušel i přetaktování izolovaně, přidání 1 GHz efektivně však nakonec nebylo zcela stabilní pro všechny herní testy.
GeForce 750 Ti OC | + 1000 MHz mem clock | + 800 MHz mem clock + 135 MHz core clock |
|
BioShock Infinite – ultra [avg. fps] | 58,7 | 60,6 | 63,6 |
Metro Last Light – high [avg. fps] | 35,6 | DNF | 38,7 |
Total War: Shogun 2 – 1080p high [avg. fps] | 47 | 47,7 | 51 |
Příkon PC ve World in Conflict [W] (menší je lepší) | 158 | – | 166 |
Příkon PC v Crysis 3 [W] (menší je lepší) | 164 | – | 168 |
Shrnutí výkonu a verdikt
Shrnující graf je vytvořen tak, že v každé hře tvoří 100 % (základ) nejlepší výkon a od něj jsou odvezeny další relativní výkony. Takto nemá žádná hra větší váhu. V případě her, kde jsou kvůli změně metodiky otestována dvě nastavení (Tomb Raider, Bioshock Infinite, Shogun 2: Total War, World of Tanks, F1 2012 a Aliens vs. Predator), jsem do průměru v tomto případě už započítal méně náročné nastavení. Slabší grafiky tak nejsou penalizovány a naopak spíše méně vynikne odstup karet jako R9 270 či GTX 660.
Jelikož jsem u spousty her jako Battlefield 3, Crysis 3, IL-2: Cliffs of Dover, Skyrim nebo Witcher 2 ještě speciálně kvůli souboji GTX 660 s R9 270 metodiku rozšířil o měření náročnějšího nastavení (vysokých či maximálních detailů). Pokud bych průměroval jen tato náročnější nastavení a vyškrtl z počítání hry, kde obě karty běží v průměru nad 100 fps (ET:QW a Call of Duty 4). Do průměrování je přidána hra Battlefield 4 (v celkovém nastavení vysokých detailů):
Ale jak by to dopadlo, kdybych se soustředil jen na vybrání těch skutečně náročných karet i pro kalibr typu R9 270 OC? Následující graf právě ukazuje průměr z her, kde se i grafiky za 4500 Kč notně zapotí (Battlefield 4, Bioshock Infinite (Ultra), Metro Last Light (High + Teselace), Skyrim (Ultra, 8× MSAA), Tomb Raider (High + Teselace), Total War: Shogun 2, Witcher 2 a World of Tanks s max. detaily):
Jestli se vám to nechce počítat, ale stejně po tom prahnete, tak tady (pro diskrétní grafiky) najdete jednoduché srovnání poměru výkon/cena. Žádný index nenajdete u karet, které se již neprodávají, a také u IGP.
Verdikt
Bráno hru po hře je to při srovnání s GTX 750 Ti a loňským cenovým hitem GTX 650 Ti Boost jako na houpačce. V Battlefield 3 se daří lépe novému Maxwellu, v Crysis 3 má zase jasný náskok „mírně okleštěná GTX 660“. Ve většině her to v podstatě plichta.
Překvapivě dobře si GeForce GTX 750 Ti vedla ve hře World of Tanks, kde se její výkon pohybuje na úrovni dražšího a podstatně žravějšího Radeonu R9 270. Je to tím, že ve WoT je (pokud vůbec) používán anti-aliasing FXAA. Ten na rozdíl od MSAA (viz testy Call of Duty 4 nebo Skyrim s nastavením Ultra High) netrápí pouhých 16 ROP a úzkou sběrnici GTX 750 Ti.
Výsledky lepší než GTX 660 ve hrách IL-2 Sturmovik: Cliffs of Dover a Sleeping Dogs jsou pak dílem novějších ovladačů a až se dostanu k přetestování GTX 660 s aktuálními ovladači, určitě se poměr sil opraví. V průměrování z 19 či 20 her to však není tak podstatné.
Sama Nvidia uvádí, že GTX 750 Ti se výkonem přibližně vyrovná někdejší vlajkové lodi – GTX 480 (alias „GrillForce“). V tomto testu jsme zase zjistili, že překoná neméně mohutného Caymana – Radeon HD 6950. Radeon HD 7850 zůstává těsně neporažen, zato HD 7790 OC alias R7 260X už na 750 Ti docela citelně ztrácí. Vzhledem ke grafům v této kapitole asi není třeba zvlášť zdůrazňovat, že GM107 to zvládne při příkonu nesrovnatelně nižším než všechna jmenovaná grafická řešení.
Samostatnou kapitolou je provedení od Gaming od MSI. To sází na odsvědčený chladič Twin Frozr IV, který je v současnosti s vcelku pravidelně inteligentním profilem otáček ve firmwaru MSI asi nejlepším chlazením pro střední třídu grafik. S máložravým Maxwellem si poradí naprosto hravě – teploty nepřekračují 50 stupňů Celsia v zátěži a především otáčky nejdou přes hranici 1000 ot./min. A buďte si jistí, že nízkoprofilové větráky s tichými motorky jsou při takové úrovni ze skříně neslyšitelné. Možná pokud máte přímo na stole jinak zcela pasivně chlazené PC ve skříňce typu ementál, velmi nízký hluk okolí, potom možná myšíma ušima něco zaslechnete. To alespoň platí pro nový chladič, jak na tom budou ložiska třeba za dva roky, vám už nepovím.
Daní za vynikající chladič je samozřejmě takřka doslova o pár stovek vyšší cena a potom také rozměry. GTX 750 Ti v provedení Twin Frozr IV si rozměry nezadá s Radeonem R9 270 či GTX 660 v edicích Gaming. Připravte se tak na kartu délky zhruba 25 cm.
Je trochu škoda, že Nvidia od začátku nenasazuje agresivnější cenovou politiku. Přece jen jsme zmlsáni loňskou „truckartou“ GTX 650 Ti Boost a AMD ještě před vydáním GTX 750 (Ti) reagovalo snížením cen výkonnostně odpovídajícím Radeonům. Je na vás, zda připlatíte za skvělé provozní vlastnosti. Můžete také počkat, jestli se Nvidia nepustí do cenové války. Záležet bude asi hodně na prodejích – ty ukáží, zda je v této cenové kategorii a třídě karet podstatný především výkon/cena nebo výkon/příkon (a z nízkého příkonu vyplývající další pozitiva).
GM107 jakožto první zástupce architektury Maxwell vypadá slibně především z pohledu malých herních PC a snad ještě spíše herních notebooků. Sám se těším na test GTX 750 (bez Ti) – ta má přece jen méně odvážný poměr SP:ROP (či SP k šířce sběrnice) a procentuálně výrazně nižší cenu. MSI GTX 750 Ti Gaming si za předvedený výkon a fantastické provozní vlastnostni zatím odnáší ocenění We Want It!
MSI GeForce GTX 750 Ti Gaming (Twin Frozr IV), 2 GB
výkon zhruba jako GTX 650 Ti Boost či Radeon HD 7850 | |
velice nízký příkon a excelentní poměr výkon/příkon | |
podpora technologií a bonusů Nvidie (ShadowPlay, G-Sync, GF Experience…) | |
nízké zahřívání | |
pokročilý videoprocesor, vyhrazená logika pro kódování | |
rezerva pro další přetaktování | |
velmi tichý chod chladiče Twin Frozr IV v klidu i zátěži | |
vyšší cena | |
s anti-aliasingem (MSAA) či vyšším rozlišením se v pořadí karet propadá | |
rozměry testované karty (neplatí pro ref. provedení) a videovýstupy | |
Cena | 3950 Kč vč. DPH (k 18. 2. 2014) |