V druhé části testu A10-7850K se dostáváme k chloubě AMD – integrované grafice. Nepravidelné čtenáře upozorním na CPU testy A10-7850K (Recenze AMD A10-7850K (Kaveri), část I.: CPU Steamroller v akci, případně Jaký levný CPU na hry: čtyřjádro od AMD, nebo dvoujádro od Intelu?) v nichž Kaveri soupeří především s dvoujádrovými Haswelly a (ne)ukazuje výraznější zlepšení oproti Trinity či Richlandu.
Rozbor architektury včetně přínosů GPU v Kaveri, jste si mohli přečíst už v půli ledna: Čekání končí, APU Kaveri je tu. Se Steamrollerem, GCN a HSA v záloze. Nyní se dostáváme k tomu, abychom ověřili papírové předpoklady vlastními testy.
U Kaveri AMD konečně přechází na svou nejnovější architekturu GPU, označenou GCN – APU této řady budou konečně technologicky rovna aktuálním dedikovaným kartám. AMD sice již GCN nasadilo v loňských čipech Kabini, jenže „velká" APU, u nichž lze již mluvit o herních grafikách, doposud používala shadery staré architektury VLIW4. Samotná architektura GCN se pravda na trhu pohybuje již třetím rokem, nicméně v APU Kaveri AMD použilo její nejčerstvější revizi, přítomnou v novém GPU Hawaii (Radeon R9 290/290X). APU tak může těžit z optimalizací pro dedikované karty, teoreticky mu může hrát do karet i to, že sdílí architekturu s Xboxem One a Playstationem 4.
Smysluplné CrossFire?
Díky architektuře GCN má také mnohem lépe fungovat hybridní CrossFire, tedy režim, kdy spárujete integrované GPU s dedikovanou kartou. Pokud je APU spjato s podobně výkonnou kartou, má docházet k poměrně efektivnímu zvýšení výkonu. Ideální je GPU má parametry co možná odpovídajícími – AMD zde doporučuje Radeon R7 240 s pamětí DDR3.
Běh v tandemu s APU A10-7850K má údajně zhruba zdvojnásobit (+ 95 %) výkon této – pravda, ne nějak superrychlé – samostatné grafiky, a to při rozlišení 1920 × 1080 bodů. Integrované GPU má umět spolupracovat s jakoukoliv kartou založenou na GCN, ale jak už bylo řečeno, nejlépe to bude fungovat s rychlostně blízkými Radeony R7.
Podpora Mantle a TrueAudio
Díky tomu, že běží na architektuře GCN, mohou integrované Radeony R7 také těžit z podpory pro grafické API Mantle. To má značně omezit výkonnostní bariéry, které klade architektura rozhraní DirectX, jenž je stále značně závislé na jednovláknovém výkonu. Obecně také jeho běh spotřebovává relativně hodně výkonu CPU, což následně může přiškrtit i grafický výkon – zejména, pokud je CPU slabší, jako u APU.
Nezávislé testy přínosu Mantle:
- A Quick Look at Battlefield 4 Performance with Mantle on AMD’s Kaveri 7850K APU
- Battlefield 4 Mantle Performance Preview
- AMD Mantle vs. DirectX Benchmarks with Battlefield 4 and Star Swarm
V testovacím demu Star Swarm od Oxide Games je navozena situace, která toto úzké hrdlo výkonu poměrně extrémně odhaluje. APU A10-7850K spojené s Radeonem R9 290X v něm dosahuje pod DirectX méně než 10 fps; s použitím Mantle je ale stejná komplexní scéna schopna běžet až na 30 snímcích za sekundu. Vedle snížené náročnosti na CPU se projevuje též to, že Mantle umí lépe využívat více vláken. Relativně slabé CPU tak mnohem lépe živí i highendové GPU.
Star Swarm lze považovat za syntetické demo, takže tatko masivní nárůst nelze čekat v reálné herní scéně. Nicméně i tak můžou být dopady velké. V Battlefield 4 si lze zejména s relativně slabším procesorem polepšit také o 10–15 %.
Vedle Mantle umí APU Kaveri i druhou vymoženost, kterou AMD představilo spolu s uvedením čipu Hawaii, a sice akceleraci prostorového zvuku a audio efektů TrueAudio. Kaveri má integrováno patřičné DSP a jeho uživatelé tedy budou moci vyzkoušet akcelerovaný zvuk ve hrách, které budou TrueAudio podporovat (jak jsme psali v článku o této technologii, několik titulů již bylo oznámeno). Vedle herního audia je ale integrované DSP možno použít i k dalším výpočtům nad zvukovými daty – například pro potlačování šumu ve vstupu z mikrofonu.
Nový videoprocesor – UVD 4
AMD do Kaveri také integrovalo novou generaci multimediálních akcelerátorů. Relativně malé změny se týkají obvodu UVD, jenž má dostat robustnější dekodér pro formát H.264 – bude tedy snášet i abnormální streamy a zejména bude použitelnější třeba při ztrátě packetů na síti či jiných přenosových potížích. AMD zatím nepřineslo podporu pro dekódování formátu HEVC (alias H.265). Podle toho, co zatím víme, ji ale nemají mít ani procesory Broadwell. Dekódování H.265 tedy bude probíhat na CPU, nicméně na trhu by se údajně měly objevit softwarové ovladače používající alespoň částečnou akceleraci pomocí OpenCL/HSA (AMD uvádí Telestream Switch).
Kaveri však dostane jinou zajímavou novinku týkající se sledování videa, a to technologii nazvanou Fluid Motion Video. Jedná se o řešení situace, která nastává prakticky při každém sledování filmu na počítači. Zatímco zdrojové video má frekvenci 24 snímků za vteřinu, počítačové obrazovky prakticky vždy běží na 60 Hz. Při vykreslování tedy musí GPU kreslit snímky v průměru dvaapůlkrát, což znamená, že snímky jsou střídavě zobrazovány třikrát a dvakrát. Podobně jako microstuttering při hraní toto vede k nepříjemnému cukání obrazu, který lze pozorovat při plynulých zoomech, rotacích a pojezdech kamery, či pokud je na obrazovce plynule se hýbající objekt.
AMD Fluid Motion Video tuto nepříjemnost řeší tak, že snímkovou frekvenci zvýší na 60 Hz pomocí interpolace. Kvalita této konverze bude pochopitelně záležet na tom, jak dobře bude algoritmus rozpoznávat pohyb a jak kvalitně bude syntetizovat nové snímky. Pokud vše bude fungovat dobře, bude pohyb mnohem plynulejší než i při přehrávání na nativních 24 Hz.
Konverze snímkové frekvence by měla běžet na GPU a fungovat by snad měla v rámci existujících přehrávačů videa založených na frameworku DirectShow. Snad by tedy mohla fungovat transparentně v rámci vykreslovače, i když to jen spekuluji; teoreticky také může vyžadovat dekódování na UVD, aby mělo GPU k dispozici informaci o pohybových vektorech ve videu.
Nicméně s přepočítáváním je obvykle spojen určitý úbytek kvality, neboť program jednoduše není vševědoucí a v mnoha případech jednoduše není správné interpolace schopen – zejména pokud dochází k pohybu nepravidelnému, na scéně se něco objevuje, mění se osvětlení. Interpolace obecně dosti špatně funguje například u kreslené animace. Použití Fluid Motion Videa tedy asi bude záležitostí vkusu (osobně bych preferoval raději přehrávání na kompatibilní frekvenci, tedy 24/48/120 Hz, či řešení tohoto problému pomocí G-sync či FreeSync).
Větší změny než u UVD nastaly u enkodéru VCE. Kaveri nese jeho druhou generaci, která je oproti té první v čipech Trinity poněkud schopnější. Zatímco původní VCE kódovalo H.264 s omezenými schopnostmi (umělo například jen snímky typu I a P), Kaveri by mělo kvalitu výstupu o něco zlepšit (umí už i snímky s obousměrnou predikcí, tzv. B-frames).
VCE 2 ale přináší zlepšení kvality i pro bezdrátový přenos obrazu AMD Wireless Display. Pro jeho potřeby dokáže enkodér video komprimovat ve formátu se vzorkováním 4:4:4, takže nedochází k rozmazávání například červeného textu kvůli podvzorkování kanálů chroma U/V. Tento režim je zejména důležitý pro kvalitní a ostré zobrazení GUI programů a operačního systému, a často také textu. Vzorkování 4:4:4 ale VCE 2 zřejmě umí jen při intra-kompresi, takže AMD má co zlepšovat. Pokud by totiž enkodér zvládl i P-snímky, mohly by se snížit nároky na přenosovou rychlost bezdrátové sítě či zvýšit kvalita. Pochopitelně by ale byla nutná podpora i ze strany přijímače.
Parametry GPU A10-7850K a detekce schopností videoprocesoru
Parametry referenčních karet/grafických řešení
A6-5400K | A8-5800K | A10-6800K | A10-7850K | Pentium G3420 | Core i5-4670K | |
HD 7540D | HD 7660D | HD 8670D | R7 | HD Graphics | HD Graph. 4600 | |
Jádro | Devastator | Devastator | Devastator | Spectre | Haswell GT1 | Haswell GT2 |
Výrobní proces | 32 nm | 32 nm | 32 nm | 28 nm | 22 nm | 22 nm |
Velikost jádra | 246 mm² | 246 mm² | 246 mm² | 245 mm² | 118 mm² | 177 mm² |
Tranzistorů | 1,3 mld. | 1,3 mld. | 1,3 mld. | 2,41 mld. | ? mld. | 1,4 mld. |
Stream procesorů | 48 (192) | 96 (384) | 96 (384) | 512 | 10 | 20 |
Takt jádra | 760 MHz | 800 MHz | 844 MHz | 720 MHz | 1100 MHz | 1200 MHz |
Takt SP | 760 MHz | 800 MHz | 844 MHz | 720 MHz | 1100 MHz | 1200 MHz |
ROP/RBE | 4 | 8 | 8 | 8 | 2 | 2 |
Texturovacích jedn. | 24 | 24 | 24 | 32 | 2 | 4 |
Paměť | sdílená | sdílená | sdílená | sdílená | sdílená | sdílená |
Takt pamětí | 1866 MHz | 1866 MHz | 2133 MHz | 2400 MHz | 1600 MHz | 1600 MHz |
Šířka sběrnice | 128-bit | 128-bit | 128-bit | 128-bit | 128-bit | 128-bit |
Propustnost pamětí | 29,9 GB/s | 29,9 GB/s | 34,1 GB/s | 38,4 GB/s | 25,6 GB/s | 25,6 GB/s |
Fillrate (pixely) | 3 GPx/s | 6,4 GPx/s | 6,75 GPx/s | 5,8 GPx/s | 2,2 Gpx/s | 2,4 Gpx/s |
Fillrate (textury) | 18,2 GTx/s | 19,2 GTx/s | 20,3 GTx/s | 23 GTx/s | 2,2 GTx/s | 4,8 GTx/s |
FLOPS | 292 GFLOPS | ~700 GFLOPS | 779 GFLOPS | 737 GFLOPS | – | – |
TDP | 65 W (s CPU) | 100 W (s CPU) | 100 W (s CPU) | 95 W (s CPU) | 53 W (s CPU) | 84 W (s CPU) |
Délka karty | – | – | – | – | – | – |
DirectX | 11.0 | 11.0 | 11.0 | 11.2 | 11.1 | 11.1 |
Radeon | Radeon | Radeon | Radeon | Radeon | Radeon | |
HD 6670 | HD 7730 | R7 250 | HD 7750 | R7 260 | HD 7770 GHz Ed. | |
Jádro | Turks | Cape Verde | Oland | Cape Verde | Bonaire | Cape Verde |
Výrobní proces | 40 nm | 28 nm | 28 nm | 28 nm | 28 nm | 28 nm |
Velikost jádra | 118 mm² | 123 mm² | 90 mm² | 123 mm² | 160 mm² | 123 mm² |
Tranzistorů | 716 mil. | 1,5 mld. | 1,04 mld. | 1,5 mld. | 2,08 mld. | 1,5 mld. |
Stream procesorů | 96 (480) | 384 | 384 | 512 | 768 | 640 |
Takt jádra | 800 MHz | 800 MHz | 1000/1050 MHz | 800 MHz | 1000 MHz | 1000 MHz |
Takt SP | 800 MHz | 800 MHz | 1000/1050 MHz | 800 MHz | 1000 MHz | 1000 MHz |
ROP/RBE | 8 | 8 | 8 | 16 | 16 | 16 |
Texturovacích jedn. | 24 | 24 | 24 | 32 | 48 | 40 |
Paměť | 1 GB GDDR5 | 1 GB GDDR5 | 1 GB GDDR5 | 1 GB GDDR5 | 2 GB GDDR5 | 1 GB GDDR5 |
Takt pamětí | 4 GHz | 4,5 GHz | 4,5 GHz | 4,5 GHz | 6 GHz | 4,5 GHz |
Šířka sběrnice | 128-bit | 128-bit | 128-bit | 128-bit | 128-bit | 128-bit |
Propustnost pamětí | 64 GB/s | 72 GB/s | 73,6 GB/s | 72 GB/s | 96 GB/s | 72 GB/s |
Fillrate (pixely) | 6,4 GPx/s | 6,4 GPx/s | 8 GPx/s | 12,8 GPx/s | 16 GPx/s | 16 GPx/s |
Fillrate (textury) | 19,2 GTx/s | 19,2 GTx/s | 24 GTx/s | 25,6 GTx/s | 48 GTx/s | 40 GTx/s |
FLOPS | 768 GFLOPS | 614 GFLOPS | 768 GFLOPS | 819 GFLOPS | 1536 GFLOPS | 1280 GFLOPS |
TDP | >66 W | ? W | >65 W | >55 W | >95 W | >80 W |
Délka karty | 15 cm | 15 cm | 15 cm | 15 cm | 21 cm | 17 cm |
DirectX | 11.0 | 11.2 | 11.2 | 11.2 | 11.2 | 11.2 |
GeForce | GeForce | GeForce | GeForce | GeForce | GeForce | |
GT 640 DDR3 | GTX 460 | GTX 560 | GTX 650 | GTX 650 Ti | GTX 650 Ti Boost | |
Jádro | GK107 | GF104 | GF114 | GK107 | GK106 | GK106 |
Výrobní proces | 28 nm | 40 nm | 40 nm | 28 nm | 28 nm | 28 nm |
Velikost jádra | 118 mm² | ~330 mm² | ~330 mm² | 118 mm² | 221 mm² | 221 mm² |
Tranzistorů | 1,3 mld. | 1,95 mld. | 1,95 mld. | 1,3 mld. | 2,54 mld. | 2,54 mld. |
Stream procesorů | 384 | 336 | 336 | 384 | 768 | 768 |
Takt jádra | 900 MHz | 675 MHz | 810 MHz | 1058 MHz | 925 MHz | 980/1033 MHz |
Takt SP | 900 MHz | 1350 MHz | 1620 MHz | 1058 MHz | 925 MHz | 980/1033 MHz |
ROP/RBE | 16 | 32 | 32 | 16 | 16 | 24 |
Texturovacích jedn. | 32 | 56 | 56 | 32 | 64 | 64 |
Paměť | 2 GB DDR3 | 1 GB GDDR5 | 1 GB GDDR5 | 1 GB GDDR5 | 1 GB GDDR5 | 2 GB GDDR5 |
Takt pamětí | 1,8 GHz | 3600 MHz | 4004 MHz | 5 GHz | 5400 MHz | 6008 MHz |
Šířka sběrnice | 128-bit | 256-bit | 256-bit | 128-bit | 128 b | 192 b |
Propustnost pamětí | 28,5 GB/s | 115,2 GB/s | 128 GB/s | 80 GB/s | 86,4 GB/s | 144,2 GB/s |
Fillrate (pixely) | 14,4 Gpx/s | 21,6 Gpx/s | 25,9 Gpx/s | 16,9 Gpx/s | 14,8 Gpx/s | 23,5 Gpx/s |
Fillrate (textury) | 28,8 Gtx/s | 37,8 Gtx/s | 45,4 Gtx/s | 33,9 Gtx/s | 59,2 Gtx/s | 62,7 Gtx/s |
FLOPS | 691 GFLOPS | 907 GFLOPS | 1088 GFLOPS | 813 GFLOPS | 1421 GFLOPS | 1881 GFLOPS |
TDP | 65 W | 160 W | 150 W | 64 W | 110 W | 134 W |
Délka karty | 15 cm | 21 cm | 21 cm | 15 cm | 23 cm | 23 cm |
DirectX | 5.0 | 11.0 | 11.0 | 11.0 | 11.0 | 11.0 |
Testovací sestavy a návod na interaktivní grafy
Testovací sestavy
Společným bodem testovacích sestav byly tyto komponenty:
- procesor: AMD A10-5800K (v případě testování diskrétních grafických karet)
- chladič: Noctua NH-C12P
- paměti: 2× 2 GB DDR3-2000 Kingston HyperX T1
(nastaveny na 1600-8-8-24-1T v případě Intel Core i3/i5 a na 1866-9-10-9-27-1T v případě AMD A10-5800K, na 2133-11-12-11-30-2T s 1,6 V u A10-6800K a konečně 2400-11-13-13-30-2T@1,65V s A10-7850K) - zdroj: Seasonic EnergyKnight (T3), 400 W
- pevný disk: WD Caviar (WD3200AAKS), 320 GB
- operační systém: Windows 7 Enterprise SP1, 64-bit
Není-li řečeno jinak, je testováno v rozlišení 1920 × 1080 px.
Za zapůjčení pamětí DDR3 děkujeme společnosti Kingston |
Za poskytnutí chladiče Noctua NH-C12P a teplovodivé pasty Noctua NT-H1 děkujeme společnosti RASCOM Computerdistribution |
Monitor
K testování grafických karet nám poskytla herní monitor Foris FS2333 společnost EIZO.
Platforma FM2+
Při sledování příkon celého PC (platformy) je důležité mít na paměti, že i při stejném nastavení je A88X-Pro trochu „žravější“ než Gigabyte F2A85X-UP4. Tak například v kombinaci s procesorem A10-5800K a zmíněnou GTX 460 (kterou se mi nakonec povedlo v F2A85X-UP4 rozjet) činil rozdíl příkonu celé sestavy v idle 6 W (52 na F2A85X a 58 s A88X-Pro), ve hře World in Conflict, kde je zatíženo poměrno dost CPU i GPU činil rozdíl 5 W (231 vs. 236 W). S GTX 660 ve slotu byl rozdíl kupodivu menší (46 vs. 48 W) a s Radeonem R9 270 jsem se opět dostal na zřetelně více wattů u A88X-Pro (52 vs. 59 W v idle, 210 vs. 220 W ve World in Conflict).
Platforma FM2
APU Trinity a Richland byla osazena do desky Gigabyte A85X-UP4. Ta patří v dané platformě spíše k těm dražším a dá se tedy očekávat, že v případě testů přetaktování lze snadno najít možnosti daného řešení (či alespoň kusu).
Platforma LGA 1150
Integrované grafiky CPU Haswell byly otestovány v základní desce Gigabyte Z87X-UD3H.
Platforma LGA 1155
Core i5-3225 jsem testoval v základní desce Gigabyte Z77X-UD5H. Jedná se určitě o vyšší střední třídu desek se silnou napájecí kaskádou pro stabilitu při přetaktování, takže to se mohlo podepsat i na příkonu.
Za zapůjčení základních desek děkujeme společnosti Gigabyte |
Interaktivní grafy 2.0
- Pokud se vám nelíbí písmo se stíny, velmi snadno je vypnete v Nastavení. Máte-li ještě problémy s rychlostí zobrazování, můžete v Nastavení povypínat také animace.
- Pořadí testovaných produktů můžete snadno změnit zvolením řazení dle naměřené hodnoty v testu, podle různých skupin apod.
- Po najetí myší na některou z položek se z této stane 100 % (základ) a ostatní položky se spočítají podle ní. Všechny absolutní hodnoty se změní na relativní. Zpět se změní, až kurzor myši opustí oblast s názvy položek.
- Budete-li chtít nějakou položku v grafech sledovat, můžete si její pruh libovolně obarvit. Stačí klepnout levým tlačítkem myši na barevném pruhu a vybrat si z palety. Máte-li povoleny cookies, mělo by vám nastavení vydržet i pro další grafy v dalších kapitolách.
- Cenu a další základní parametry můžete zobrazit kdykoliv v každém grafu: stačí u vybraného procesoru najet kurzorem myši nad pruh s hodnotou (měření) a chvíli počkat. Objeví se jako plovoucí nápověda (tooltip).
- Zámek základu (produkt, který se stane těmi 100 % a od něhož se odvíjí další relativní hodnoty) aktivujete pomocí současného stisku klávesy CTRL a levého tlačítka myši nad produktem (či jeho pruhem v grafu), který chcete uzamknout.
- Před prvním použitím grafů si pro jistotu vyprázdněte cache prohlížeče (zřejmě bude stačit refresh) a v případě problému smažte i příslušné cookies.
- Interaktivní grafy 2.0 jsou kompatibilní s prohlížeči Firefox (testovány verze 4.x), Opera (testováno s 11.x), Internet Explorer 8 a 9 (verze 7 a starší už nejsou podporovány) a Chrome (zde mají tooltipy hranaté rohy namísto kulatých).
- V případě problémů se nejdříve ujistěte, že máte v prohlížeči povoleny skripty i cookies, dále splnění bodů 7 a 8, teprve potom nám chybu prosím co nejpřesněji reportujte. Jedná se o první ostré nasazení grafů, takže i přes delší testování autorem a redakcí při komplexnosti aplikace určitě ještě nějaké mouchy v nějaké kombinaci objevíte.
Aliens vs. Predator, Battlefield 3
Aliens vs. Predator
Scénu z úvodu hry jsme nově nahradili samostatným benchmarkem, který je na internetu k dispozici ke stažení zdarma. Běží v režimu DirectX 11 a je o poznání náročnější než náš původní test. Používáme výchozí nastavení benchmarku zahrnující zapnutou teselaci.
Battlefield 3
V Battlefield 3 je využit předvolený profil nastavení kvality Vysoký. Benchmarkujeme tradičně scénu ze začátku druhého dějství kampaně (výstup z transportéru a briefing na orientálnímu trhu).
Battlefield 4, BioShock Infinite
Battlefield 4
V Battlefield 4 testuji jednu z nejnáročnějších cutscén kampaně. U multiplayeru budou zejména nároky na CPU vyšší, ale co se náročnosti GPU týče, tak tento průchod lodí s všemožnými efekty patří k těm nejlépe škálujícím.
Do celkového výsledku počítám jen předvolený profil nastavení kvality Vysoký. Testuji ale i tři další profily celkového nastavení detailů:
BioShock Infinite
Stejně jako další nové hry z AMD Game Evolved (či přímo Never Settle) i BioShock Infinite obsahuje docela hezký zabudovaný benchmark, který odzkouší několik lokací. Nastavení Ultra (DX11) zajistí využití všech moderních ve hře využitých technologií kromě DDOF (Diffusion Depth Of Field). Výsledkem v grafu jsou průměrná fps napříč všemi lokacemi (průměr průměrných fps).
Call of Duty 4, Crysis 3
Call of Duty 4: Modern Warfare
Ačkoli se asi nejvíce zapsal druhý díl této série, tak i čtvrtý byl v multiplayeru hodně rozšířen. Nijak zvlášť náročnou hru jsem testoval se všemi detaily na maximu a také s 4× MSAA a 8× AF.
Crysis 3
V Crysis 3 jsem nakonec musel zvolit předvolbu Nízký, aby hra byla plynulá alespoň na Radeonu HD 7750. Testuji scénu ze začátku příběhu, kdy se v dešti objevíte v přístavu a máte běžet za Psychem. Po vyběhnutí schodů FRAPS vypínám v první místnosti.
Enemy Territory: Quake Wars, F1 2012
Enemy Territory: Quake Wars
Enemy Territory představuje jediný OpenGL test v testovací sadě. Quake Wars používají značně upravený Doom 3 engine, obohacený především o technologii MegaTexture (více o technologii v článku na Beyond3D). Pro testy používám nejvyšší detaily s 4× MSAA a 8× AF, přes konzoli vypínám limit 30 (com_unlockFPS 1) i 60 fps (com_unlock_maxFPS 0, je vhodné nastavit do autoexec.cfg).
Pro účely testování jsem si nahrál vlastní timedemo (recordtimenetdemo), které měří výkon v rozsáhlé lokaci se stromy (Valley). Timedemo (pro verzi 2.0) ke stažení: zde.
F1 2012
Formule od Codemasters mají také zabudovaný benchmark a tím testuji celkové nastavení určené profilem Ultra.
IL-2 Sturmovik: Cliffs of Dover, Mafia II
IL-2 Sturmovik: Cliffs of Dover
V IL-2 Sturmovik: Cliffs of Dover používám replay BlackDeath.trk. 210sekundový průběh záznamu zachytím FRAPSem, předtím v nastavení vyberu profil detailů Vysoké. Anti-aliasing nezapínám, vypnuté zůstává i SSAO.
Mafia II
Druhou Mafii už i na levných grafikách testuji s celkovým nastavením High, APEX PhysX zůstává vypnuta.
Metro Last Light, Resident Evil 6
Metro Last Light
Metro: Last Light navazuje na postapokalyptické Metro 2033. Hru pohání 4A Engine, který je dílem vývojářů z 4A Games. Stojí za ním spoluautoři X-Ray Engine použitého v herní sérii S.T.A.L.K.E.R. Engine, poprvé použitý v Metro 2033, vznikl pro herní konzole a PC. Podporoval rozhraní DirectX 9, DirectX 10 a DirectX 11 a řadu pokročilých efektů a technik včetně volumetrické mlhy, rozostření (pohybové) objektů, sub-surface scattering (simulace částečné průsvitnosti objektů, což je důležité třeba pro napodobení kůže) nebo parallax mapping (simulace nerovností povrchů). Pro vykreslování obrazu s využitím velkého množství světelných zdrojů se využívá deferred lighting (či deferred shadding nebo rendering).
V novém Metro: Last Light přibyla řada efektů a technologií. Vývojáři ale pořádně zapracovali i na optimalizaci. Hra se i přes lepší grafiku chová při maximálních detailech o poznání lépe než její předchůdce.
Very High | High | Medium | Low | |
Ambient Occlusion | Precomputed + SSAO | Precomputed + SSAO | Approximate | Approximate |
Analytical Anti-Aliasing | Enabled | Enabled | Enabled | Enabled |
Bump Mapping | Precise | Precise | Coarse | Coarse |
Detail Texturing | Enabled | Enabled | Enabled | Disabled |
Geometric Detail | Very High | High | Normal | Low |
Image Post-Processing | Full | Full | Normal | Normal |
Light-Material Interaction | Full | Normal | Normal | Normal |
Motion Blur | Camera + Objects | Camera | Disabled | Disabled |
Parallax Mapping | Enabled + POM | Enabled | Disabled | Disabled |
Shadow Filtering | Hi-Quality | Hi-Quality | Normal | Fast |
Shadow Resolution | 9,43 Mpx | 6,55 Mpx | 4,19 Mpx | 2,35 Mpx |
Skin Shading | Subsurface Scattering | Simple | Disabled | Disabled |
Soft Particles | Enabled | Enabled | Disabled | Disabled |
Volumetric Texturing | Full Quality + Sun Shafts | Low Precision | Disabled | Disabled |
Nastavení grafiky přímo ve hře je oproti předchůdci výrazně zjednodušené. Podrobnější nastavení detailů zmizelo a nahradilo je jen globální nastavení. Jak ovlivňuje jednotlivé efekty je shrnuto v tabulce z GeForce.com. Pro podrobnější popis toho, co které nastavení znamená, vás odkáži tamtéž, s příklady by to vydalo na další článek.
Resident Evil 6
Pro test RE6 používám samostatný benchmark s výchozím nastavením (FXAA3HQ, Motion Blur: On, Shadow/Texture/Screen Quality: High).
Sleeping Dogs, Stalker: Call of Pripyat
Sleeping Dogs
Také Sleeping Dogs nemohli být oproštěni od zabudovaného benchmarku. Profil High jsem upravil jen na místě anti-aliasingu (volba Normal znamená pouze FXAA).
Stalker: Call of Pripyat
Ke třetímu dílu Stalkera naštěstí existuje volně šiřitelný benchmark, v něm používám k testům pouze čtvrtou, nejnáročnější část (nastavení se slunečními paprsky – SunShafts). Vše je nastaveno na naprosté maximum (DX11 funkce jako teselace nebo CHS), MSAA pak na stupeň 4×.
The Elder Scrolls V: Skyrim, The Witcher 2 (Zaklínač 2)
The Elder Scrolls V: Skyrim
Problémy nastíněné v článku Skyrim a HiRes Texture Pack: porovnání grafik mě přivedly na následující metodiku testování: po projití několika uložených pozic a zjištění, že Markarth už nedělá problémy ani Radeonům, ani GeForce, jsem vybral tři uložené pozice v lokacích Whiterun (pohled na velkou část měst a ještě i za hradby), Riverwood (stromy, voda, vesnice) a Ragged Flagon (podzemí Riftenu). Po nahrání uložené pozice počkám, až se uklidní ukazatel se snímky za sekundu (načítání z disku, obyčejně je to ale tak dvě až tři sekundy po zmizení nahrávací obrazovky) a poté měřím dvacet sekund (nastaveno ve FRAPSu). Nahraji další pozici a postup opakuji. V grafu je hodnota průměrných fps spočtena jako průměr tří dvacetisekundových měření. Více o testování v článku Skyrim a HiRes Texture Pack: porovnání grafik.
První graf je pro méně náročné nastavení, při němž je nejdříve předvolen profil High a poté jen vypnut anti-aliasing. Druhý graf obsahuje výsledky s předvolbou Ultra High a zahrnuje tak právě třeba i 8× MSAA.
The Witcher 2
Testováno bylo ve verzi hry 3.3 a měřeno bylo v rozlišení 1920 × 1080 px s upraveným profilem detailů Nízký. Jen limit paměti textur byl navýšen na Vyšší a také vzdálenost zobrazování jsem změnil na Normální.
Po seznámení se hrou jsme vybrali dvě lokace, jež patří určitě mezi nejnáročnější: poslední část kapitoly zvané Vedení útoku, kdy drak proboří hradby a útočí na vaši družinu i nepřátelské vojáky, a z pokročilejší fáze hry potom v lese se odehrávající misi Hnízda Nekkerů. První souhrnný graf prezentuje průměr z těchto dvou lokací.
" width="560" height="315" frameborder="0">
" width="560" height="315" frameborder="0">
Více o testování v článku Witcher 2 v2.1 – rychlotest 19 grafických karet
Tomb Raider (2013), Total War: Shogun 2
Tomb Raider (2013)
S novým Tomb Raiderem jste se mohli setkat už ve dvou testech podrobných měření s nástrojem FCAT (viz např. FCAT a testy (ne)plynulosti: když se nehraje jen na průměry), takže jste s teselovanou Larou jistě obeznámeni. V nastavení Normal není měřeno s teselací, v nastavení High je naopak teselaci zkoušena.
Total War: Shogun 2
Plná verze Shoguna 2 nabízí nejen DirectX 11, ale také vestavěný benchmark. Testuji jednak s přednastaveným profilem 1080p High a poté ještě s vlastním nastavením vycházející z celkových detailů „Medium“ s pár úpravami.
World in Conflict, World of Tanks
World in Conflict
Testuji s profilem Nejvyšším (zahrnuje DX10 rendering a 4× MSAA), detailně je použité nastavení vidět na screenshotech:
World of Tanks 8.5
Co se týče využití GPU, jsou nejnáročnější záležitostí World of Tanks určitě křoví nejlépe v kombinaci s pohledem skrze optiku režimu snipera. Takový záznam bitvy s delším střílením skrze křoví na malebné mapě Fjords jsme pořídili a zatím grafiky mučíme s takovýmto nastavením Graphics: Improved, vše na Low, jen Textures a Visibility: Maximum a samozřejmě Extra Effects in Sniper mode: Off.
Instrukce pro srovnatelné testování:
- uložte replay na pevný disk
- spusťte FRAPS a na kartě FPS nastavte Stop benchmark after 300 s
- pokud máte příponu .wotreplay asociovánu s WorldOfTanks.exe, potom na ni stačí poklepat. V opačném případě si vytvořte zástupce WorldOfTanks.exe a .wotreplay na ni přetáhněte
- počkejte, až na odpočtu bude 00:28 do startu zápasu (vpravo nahoře), pak spusťte logování (implicitně F11)
- výsledek najdete ve složce Frapsu jako FRAPSLOG.TXT
Více o testování a technické stránce hry v článku World of Tanks: průvodce hardwarem a nastavením pro ty, co spěchají.
Unigine Heaven 4.0 a Valley 1.0
Unigine Heaven 4.0
Jakých změn doznal Heaven, jehož první inkarnace vyšla už v roce 2009? Vývojáři údajně „drasticky“ vylepšili efekt SSDO (scene-space dimensional occlusion), vylepšili refrakci světla na čočkách (lens flare) a do části sekvence, která se odehrává v noci, zapracovali hvězdnou oblohu. Při testech nechávám teselaci na normal, anizotropní filtr nastavuji na 8:1 a multi-sampling raději vypnutý.
Unigine Valley 1.0
Poslední benchmark od Unigine vaši grafickou kartu potrápí rozlehlou krajinou a hustou, detailně renderovanou vegetací. Nastavení benchmarku vidíte na screenshotu a bude asi ještě chvíli trvat, než jej takto třída grafik zvládne.
3DMark
3DMark
Po rozličných experimentech s názvy jako 3DMark 99, 3DMark 2000 nebo 3DMark Vantage pojmenoval Futuremark nový benchmark nejjednodušeji, jak to šlo – 3DMark. Důvodem je to, že se pod tímto označením nově rozumí celý balík testů.
Verze pro Windows obsahuje tři testy – pro DirectX 11, 10 a 9. Všechny tři testy běží na enginu pro DirectX 11, takže je pro běh 3DMarku vyžadovaný operační systém s podporou DX11 (Windows Vista, Windows 7 a Windows 8), u testů pro nižší verze DirectX se ale využívají jen instrukce příslušené dané verzi, takže k jejich spuštění pak stačí grafická karta s podporou DirectX 10, případně DirectX 9.
Fire Strike
Fire Strike je určený pro výkonná PC, ze tří testů je nejnáročnější, běží pod DirectX 11 a využívá více vláken. Skládá se ze dvou testů grafiky, testu fyziky a kombinovaného testu, který zatěžuje zároveň procesor i grafickou kartu.
V enginu pro tento test se využívá multithreading, teselace (PN triangles, phong a displacement mapping s podporou triangle i quad teselace), deferred lighting, ambient occlusion, pro výpočty osvětlení povrchů může mimo jiné využívat i horizon based screen space ambient occlusion (HBAO), dále volumetrické osvětlení a osvětlení částic. Post processing zahrnuje efekty jako particle based distortion (pod tím si můžete představit třeba vlnění teplého vzduchu), depth of field (hloubka ostrosti), odrazy od čoček, bloom (počítaný Rychlou Fourierovou transformací), antialiasing (MSAA a po tone mappingu FXAA) či simulace dýmu.
Podrobnější popis použitých technologií a způsobu využití najdete opět v původní dokumentaci v angličtině, jejich přepis by vydal na další čtyři strany (kvůli používané terminologii beztak napůl anglického textu). Pokud se v daných technologiích orientujete, nemělo by vám to ani v angličtině dělat problémy.
Cloud Gate
Cloud Gate je navržený pro notebooky a domácí PC. Jde o méně náročný test, který využívá pouze rozšíření DirectX 10_0, takže se dá pouštět i na starších kartách nebo integrovaných grafikách, které DirectX 11 nepodporují. Samotný engine, na kterém běží, ale DirectX 11 vyžaduje, takže je pro spuštění zapotřebí, aby vše bylo nainstalované na operačním systému, který DirectX 11 podporuje.
Test je složený ze dvou test grafické karty a jednoho testu fyziky a je ekvivalentem pro 3DMark Vantage (v tom, že oba běží na DirectX 10). Použitý engine se ale samozřejmě liší a ani výsledné skóre není vzájemně porovnatelné. Pro test se využívá stejný engine jako u Fire Strike, pochopitelně bez rozšíření DX11.
Standardně se testuje v rozlišení 1280 × 720 bodů, test je stavěný na 256 MB videopaměti.
Ice Storm
Ice Storm je určen pro měření výkonu tabletů, ultrapřenosných notebooků a levných PC. Na měření výkonu GPU slouží první dva testy, ve třetím se testuje fyzika.
Jde o (pro PC) hodně nenáročný test, který na GeForce GTX 660 Ti někde pod dvěma tisíci fps. Má být jakýmsi ekvivalentem pro 3DMark06 pro DirectX 9, byť už není jako 3DMark06 svého času postavený na testování výkonných PC, ale na rozdíl od něj už je určený pro test výkonných mobilních zařízení.
Standardní rozlišení pro test je 1280 × 720 bodů a počítá se se 128 MB grafické paměti. S rozličnými rozměry displejů mobilních zařízení se Futuremark vyrovnal tím, že obraz v daném rozlišení renderuje napevno a následně jej zvětšuje nebo zmenšuje podle rozměrů obrazovky.
Výsledky v detailech
Radeon R7 (A10-7850K)
Radeon HD 5770
Radeon R9 270 OC
GeForce GTX 660 OC
Radeon HD 6950
GeForce GTX 560
GeForce GTX 460
Radeon R7 260X
Radeon HD 5850
Radeon HD 7850 OC 1 GB
GeForce GTX 650 Ti OC
GeForce GTX 650 Ti Boost OC
GeForce GT 640 GDDR5
Radeon HD 7770 GHz Ed.
Radeon HD 7790
Radeon HD 7730
Radeon HD 6670
GeForce GTX 650
GeForce GT 640
AMD Radeon HD 8670D
Intel HD 4600
Intel HD 4000
AMD Radeon HD 7660D
AMD Radeon HD 7540D
AMD Radeon HD 7750
Příkon (spotřeba), shrnutí výkonu a vyhodnocení
Příkon (spotřeba)
Spotřeba (ano příkon) celé sestavy s daným procesorem je měřena pomocí zásuvkového měřiče spotřeby elektrické energie FK Technics. A přestože chladič, zdroj a grafická karta zůstávají neměnné a paměti jsou nastaveny také velmi srovnatelně, pořád se jedná o spotřebu celé platformy dané do jisté míry také základní deskou, osazenou čipovou sadou a dalšími čipy právě na desce.
Při testování příkonu při přehrávání videa je využit program Media Player Classic Home Cinema. To, kde je DXVA (GPU) akcelerace přehrávání videa aktivní, poznáte asi i bez průkazného screenshotu.
Přetaktování
Většina Radeonů R7 v A10-7850K se při přetaktování v recenzích dostala na frekvenci okolo 1 GHz. Od 960 MHz nahoru už přestane fungovat detekce frekvence v GPU-Z, funkčnost nastavení z AMD OverDrive lze ale ověřit nárůstem v testech. Takřka optimální je GPU OpenCL test v AIDA64, kde se frekvence téměř rovná předvedeným GFLOPS (takže s taktem grafiky těsně nad 1 GHz v benchmarku dosáhnete 1 TFLOPS v single-precision).
Původní jsem myslel, že pro můj vzorek bude stabilní právě takt 1 GHz (navýšení o 280 MHz z původních 720), ale to platí jen pro některé testy. Například Bioshock Infinite či Metro Last Light v takovém přetaktování stabilní nebyly. Momentálně ověřuji stabilitu a výkon v těchto hrách při 960 945 MHz.
Aktualizace: 945 MHz pro jádro se zdá být stabilním taktem pro všechny zatím odzkoušené hry.
GeForce GTX 650 OC | Radeon HD 7750 (s G3420) | Radeon HD 7730 | Radeon R7 OC @ 945 MHz (A10-7850K) | Radeon R7 (A10-7850K) | |
BioShock Infinite – medium [avg. fps] | 48,3 | 45,2 | 32,1 | 33,6 | 31,2 |
Metro Last Light – low [avg. fps] | 37,4 | 41,8 | 26,1 | 24,3 | 22,9 |
Total War: Shogun 2 – med. [avg. fps] | 42,9 | 45,2 | 32 | 33,8 | 31,8 |
Shrnutí výkonu a verdikt
Shrnující graf je vytvořen tak, že v každé hře tvoří 100 % (základ) nejlepší výkon a od něj jsou odvezeny další relativní výkony. Takto nemá žádná hra větší váhu. V případě her, kde jsou kvůli změně metodiky otestována dvě nastavení (Tomb Raider, Bioshock Infinite, Shogun 2: Total War, World of Tanks, F1 2012 a Aliens vs. Predator), jsem do průměru v tomto případě už započítal méně náročné nastavení. Slabší grafiky tak nejsou penalizovány a naopak spíše méně vynikne odstup karet jako R9 270 či GTX 660.
Jelikož jsem u spousty her jako Battlefield 3, Crysis 3, IL-2: Cliffs of Dover, Skyrim nebo Witcher 2 ještě speciálně kvůli souboji GTX 660 s R9 270 metodiku rozšířil o měření náročnějšího nastavení (vysokých či maximálních detailů). Pokud bych průměroval jen tato náročnější nastavení a vyškrtl z počítání hry, kde obě karty běží v průměru nad 100 fps (ET:QW a Call of Duty 4). Do průměrování je přidána hra Battlefield 4 (v celkovém nastavení vysokých detailů):
Ale jak by to dopadlo, kdybych se soustředil jen na vybrání těch skutečně náročných karet i pro kalibr typu R9 270 OC? Následující graf právě ukazuje průměr z her, kde se i grafiky za 4500 Kč notně zapotí (Battlefield 4, Bioshock Infinite (Ultra), Metro Last Light (High + Teselace), Skyrim (Ultra, 8× MSAA), Tomb Raider (High + Teselace), Total War: Shogun 2, Witcher 2 a World of Tanks s max. detaily):
Jestli se vám to nechce počítat, ale stejně po tom prahnete, tak tady (pro diskrétní grafiky) najdete jednoduché srovnání poměru výkon/cena. Žádný index nenajdete u karet, které se již neprodávají, a také u IGP.
Verdikt
Když jsem navrhoval novou metodiku testů levných grafik tak, aby se v ní Radeon HD 7750 pohyboval kolem ještě hratelných snímkových frekvencí, věřil jsem, že nová generace integrovaných grafik AMD bude dosahovat právě jeho výkonu. A možná by byla velmi blízko, kdyby došlo na GDDR5M, nebo čtyřkanálový řadič. Na srovnání s Radeonem HD 7730 je bohužel vidět, že 2400 MHz efektivně při 128bitové šířce paměťové sběrnice už neumožňuje plně využít potenciál 512 stream procesorů architektury GCN v kombinaci se solidním počtem texturovacích jednotek (32).
Samotné APU A10-7850K je zcela zabito cenou. Momentálně se dá dokonce uvažovat nejen o párování CPU s HD 7750, ale třeba i HD 7770 (alias R7 250X). A těmto diskrétním grafikám nemůže Spectre zadržovaná nízkou propustností paměti konkurovat. Z tohoto pohledu jsou také slibnější levnější varianty Kaveri, kde má R7 „jen“ 384 stream procesorů. Zde nebude brzda tak citelná, výkon ve hrách nejspíše tedy jen o málo nižší a cena rozumnější.
A10-7850K je zajímavá asi jen pro vskutku maličká PC s mini-ITX a bez místa na diskrétní grafiku. Tam oceníte možnost mít v malé krabičce povětšinou použitelnou herní grafiku, nebo naopak docela výkonný procesor pro nějakou konverzi videa nebo jakou náročnější činnost zrovna děláte.
Radeon R7 (A10-7850K)
nejvýkonnější dostupná integrovaná grafika | |
zlepšuje možnosti postavit velmi malé PC použitelné na hry | |
moderní technologie (DirectX 11.2, Mantle, TrueAudio, OpenCL 1.2, HSA, …) | |
pokročilý videoprocesor | |
podpora tří monitorů v Eyefinity | |
rezerva pro přetaktování (které je díky OverDrive snadné) | |
absurdní cena | |
citelné omezení dvěma kanály DDR3 – pomalejší než HD 7730 | |
kombinace levnějších CPU s HD 7750/7770 jsou výhodnější | |
Cena | 4300 Kč (celé APU, tedy procesor i integrovaná grafika) |
Další testy A10-7850K či A8-7600 hledejte v tématu AMD Kaveri - „extra“ testy, GPGPU, přetaktování…. V něm se také můžete zeptat na to, co konkrétně vás zajímá a pokud to už nebude otestováno jinde a současně to bude pro mě realizovatelné, pokusím se to otestovat. Podmínkou je mít některé APU zrovna v testovací sestavě na stole (kit se musí prostřídat ještě v další redakci).