Recenze AMD A10-7850K (Kaveri), část I.: CPU Steamroller v akci

4. 2. 2014

Sdílet

 Autor: Redakce

Steamroller CPU

Celý test APU AMD A10-7850K bude mít na ExtraHardware tři části. V té první se budeme zabývat pouze vlastnostmi CPU části celého APU. V druhé se zaměříme na herní výkon a tedy především v Kaveri integrovaný Radeon R7. V závěrečné části bude prostor pro vyzkoušení toho, co vás zajímá, či nějaké testy GPGPU apod. Spousta podnětů jako poměření takt na takt proti Core i3 (Haswell) či třeba otestování na 2GHz frekvenci kvůli porovnání s Kabini už padla v diskuzním fóru, další můžete přidat třeba pod tento článek.

Všichni, kdo se do detailů zajímají o architekturu a nesčetně mezigeneračních „zlepšováků“, by si určitě neměli nechat ujít článek Honzy Olšana:

Čekání končí, APU Kaveri je tu. Se Steamrollerem, GCN a HSA v záloze

Z něj si připomene jen to nejdůležitější a zejména to vztažené k CPU části Kaveri – tedy výpočetním jednotkám architektury Steamroller.

Zatímco u dvou předchozích generací APU AMD nejprve na trh posílalo čipy pro notebooky, Kaveri jde ven nejprve ve variantě pro stolní počítače. Nová APU pasují do socketu FM2+, což je nová revize starší platformy FM2. Podobně jako dříve u platformy AM3+ tedy nové procesory vyžadují nové desky, ty jsou však již pár měsíců na trhu. Patice FM2+ fyzicky vychází ze socketu FM2 a lze v ní provozovat i starší APU Richland a Trinity, opačně to však nefunguje kvůli odlišné pozici zaslepených pinů. Kaveri do desek FM2 nevložíte.

V polovině ledna AMD uvedla na trh první dva modely ze sestavy čipů Kaveri, a to odemčená čtyřjádra A10-7850K a A10-7700K. O něco později by k nim měl přibýt ještě procesor A8-7600, jehož TDP je nižší – 65 či 45 W. Jak hned uvidíte, AMD už ve svých materiálech přestalo používat zvláštní označení pro grafická jádra, která označuje toliko jako (u těchto tří modelů) Radeon R7. Konkrétní konfiguraci tedy bude určovat samo modelové číslo APU.

Modely APU Kaveri. A10-7850K a A10-7700K jdou na trh dnes

K modelům A10 má AMD přikládat kupon na stažení hry Battlefield 4. Bohužel, ani jeden český e-shop nemá Kaveri zalistováno v bundlu s touto hrou. Namátkou jsem zkusil americký Newegg.com a zde je A10-7850K prodáván za 185 USD právě včetně BF4. Nabídka je označena jako omezená.

Jak můžete vidět v tabulce, finálními takty se Kaveri zastavilo o notný kousek níž, než jeho předchůdce Richland. Situace je mírně podobná tomu, co jsme viděli u APU Llano, což byl první 32nm čip AMD. Kaveri je prvním velkým procesorem, který firma vyrábí na 28nm procesu v továrnách GlobalFoundries. Ten jednak ještě není natolik vyladěný jako 32nm linky, vedle toho ale obecně neumožňuje jít s takty CPU tak vysoko, což AMD samo přiznává.

 

Aby zdůraznilo vzájemnou integraci GPU a CPU, začalo AMD v propagačních materiálech obě části APU označovat za „výpočetní jádra“ (compute cores), postavené sobě na roveň. Kaveri tak vcelku obsahuje až 12 takto definovaných jednotek (4 jádra CPU, až 8 GPU bloků architektury GCN po 64 stream procesorech). AMD se nicméně dušuje, že si tímto způsobem nechce hrát na nějaké dvanáctijádro. Trvající rozdíly mezi vlastnostmi a schopnostmi CPU a GPU se slovy každopádně smazat nedají.

Kaveri - první APU s architekturou HSA
Kaveri - první APU s architekturou HSA

Kaveri je prvním APU, u kterého lze říci, že AMD dotáhlo původní koncepci „Fusion“. Mezitím již ale AMD toto marketingové označení opustilo a preferuje termín HSA, což je zkratka pro Heterogenous System Architecture. Doposud byla grafická jádra čipů vždy spíše integrovanými grafikami a na čipu žila tak trochu ve vlastním světě. S HSA má ale toto skončit a z výpočetních jednotek GPU se mají stát plnoprávní účastníci unifikovaného výpočetního provozu. Tedy alespoň dle AMD.

Ačkoliv předběžné informace hovořily o paměťovém řadiči toliko s oficiální podporou toliko pamětí DDR3 na efektivním taktu 2133 MHz. Nakonec AMD slibuje i podporu RAM taktované na 2400 MHz. Podmínkou ale je, aby paměť podporovala rozšířené profily AMP (AMD Memory Profile). 

Steamroller v zásadě přebírá modulovou koncepci Bulldozeru. Základem architektury Steamroller je tedy opět úzce integrované dvoujádro se sdílenými komponentami. Sdílená je celá FPU (která obsahuje také jednotky pro výpočet všech instrukcí typu SIMD a FMA3/FMA4), která zároveň počítá vlákna běžící na obou jádrech. Jádra samotná jsou tak vlastně klastry jednotek ALU a jednotek AGU pro přístup do paměti. Bulldozer mimo FPU mezi dvěma jádry v modulu sdílel ještě L2 cache, L1 pro instrukce cache a frontend. Právě v něm se zřejmě skrývala jedna ze zásadnějších achillových pat architektury – instrukční dekodér, který byl sdílený mezi oběma jádry a střídavě přepínal mezi oběma aktivními vlákny.

Steamroller od sdíleného dekodéru pro obě jádra v modulu upouští. V Kaveri tak budou mít obě jádra dekodér svůj, který budou moci plně vytížit i pokud je aktivní druhé jádro v modulu. Profitovat z této změny by měl ale jak vícevláknový, tak jednovláknový kód. Zdvojení dekodérů znamená, že lze lépe vytížit dostupné jednotky ALU a FPU. Dle AMD má být řazení instrukcí v rámci vykonávání kódu Out-of-Order efektivnější o nějakých 5–10 %.

Schéma architektury Steamroller
Schéma architektury Steamroller

Frontend modulu doznal dále zlepšení co se týče predikce větvení kódu. Chyby prediktoru byly omezeny o 20 % (chování prediktorů je ale závislé na podobě kódu). IPC by mělo i vylepšené přednačítání dat z paměti a také optimálnější vykonávání zápisů. Procesor by měl lépe zvládat tzv. store-to-load forwarding, tedy situaci, kdy čte z paměti či cache data, která tam dříve sám zapsal, a opětovné čtení hodnoty lze tedy přeskočit.

Zatímco velikost L2 cache modulu a datové L1 cache obou jader zůstává u Steamrolleru (potažmo APU Kaveri) stejná, AMD přistoupilo k zvětšení instrukční L1 cache. Ta měla u Bulldozeru poměrně slušných 64 KB, byla však sdílená, a měla poměrně nízkou (dvoucestnou) asociativitu. AMD zřejmě její výkon považovalo za slabé místo, proto byla u Steamrolleru rozšířena o 50% na 96 KB. Sekce navíc zřejmě umožnila zvýšit asociativitu na třícestnou. I samotné zvýšení velikosti by ale mělo mít dopad na výkon. Dle AMD byly celkem o 30 % zredukován počet případů, kdy procesor při práci nenalezne v instrukční L1 potřebný kousek kódu.

AMD přepracovalo také uspořádání sdílené FPU. Ta v Bulldozeru obsahovala celkem čtyři jednotky či pipeline – dvě FMAC a dvě jednotky pro celočíselné SIMD. U Steamrolleru byl počet pipeline zredukován na tři, měly by ale obsahovat všechny funkční jednotky, které obsahovaly pipeline v bulldozeru, pouze se skrývají za menším počtem portů. Výpočetní propustnost by tedy měla být zachována, i když by teoreticky mohlo dojít k propadům výkonu v extrémních případech. Zdá se ovšem, že výkon v aplikacích, které intenzivně využívají instrukce SIMD, u Steamrolleru neklesl – o tom níže. Reorganizace FPU nicméně má snížit plochu CPU a také o něco zredukovat spotřebu.

Tabulka s orientačními údaji o nárůstu výkonu oproti architektuře Piledriver při stejném taktu (AMD)
Tabulka s orientačními údaji o nárůstu výkonu oproti architektuře Piledriver při stejném taktu (AMD).
Poznámka: U Cinebench R15 jsou přehozené výsledky Single core a 2C-4T. 

Podle čísel, která pocházejí přímo od AMD, se výkon jader CPU při stejném taktu oproti Piledriveru (APU Richland) zlepšil až o 20 %, nicméně průměrný nárůst je nižší. Tabulku vidíte výše – nejlépe na tom je APU v enkódování videa pomocí programu x264, což je úloha, ve které podávaly relativně slušný výkon již Bulldozery a Piledrivery. Průměrné zlepšení IPC o 10 % je dobrým výsledkem, v reálu to nicméně není až taková výhra, neboť je kompenzováno obdobným snížím taktů (alespoň u 95W desktopových čipů). 

Co se týče podpory instrukčních rozšíření, zůstává Steamroller na stejné úrovni, kam se AMD dostalo s architekturou Piledriver. Jádra tedy umí SSE4, AES, XOP, AVX, FMA3 a FMA4, méně významné instrukce jako TBM, BMI1, F16C. Naopak se nekoná podpora novinek, které Intel přinesl s Haswellem – tedy AVX2, což jsou celočíselné instrukce SIMD nad 256bitovým vektorem a TSX, tedy podpora pro transakční paměť. AVX2 a některé další instrukce ale AMD uvede u další generace architektury, Excavatoru. Ten by měl bagrovat už v příští generaci APU, nazvané Carrizo, kterou zatím očekáváme na rok 2015.

    

     

Parametry vybraných procesorů ve srovnání

Výrobce  AMD  AMD  AMD  AMD  AMD  AMD 
Řada  A8  Athlon X4 A6 A10 A10 A10
Model  A3870K 750K 5400K 5800K 6800K 7850K
Frekvence  3,0 GHz 3,4 GHz  3,6 GHz  3,8 GHz  4,1 GHz  3,7 GHz 
Turbo  –  4,0 GHz 3,8 GHz 4,2 GHz 4,4 GHz 4,0 GHz
Počet jader  4 4 2 4 4 4
Počet vláken 4 4 2 4 4 4
Kódové označení  Llano  Trinity Trinity Trinity Richland Kaveri
L1 cache  4× 128 kB  4× 16 +
2× 64 kB 
2× 16 + 64 kB  4× 16 +
2× 64 kB 
4× 16 +
2× 64 kB 
4× 16 +
2× 96 kB 
L2 cache  4× 1024 kB  2× 2048 kB  2048 kB  2× 2048 kB  2× 2048 kB  2× 2048 kB 
L3 cache  –  –  –  –  –  – 
Paměti DDR3-1866 DDR3-1866 DDR3-1866 DDR3-1866 DDR3-2133 DDR3-2400*
Paměťových kanálů 2 2 2 2 2 2
Max. kapacita RAM 64 GB 64 GB 64 GB 64 GB 64 GB 64 GB
Sběrnice 5 GT/s (UMI) 5 GT/s (UMI) 5 GT/s (UMI) 5 GT/s (UMI) 5 GT/s (UMI) 5 GT/s (UMI)
BCLK 100 MHz 100 MHz 100 MHz 100 MHz 100 MHz 100 MHz
Násobič  30 34 36 38 41 37
Výrobní proces  32 nm  32 nm  32 nm  32 nm  32 nm  28 nm 
Velikost jádra  224 mm²  224 mm²  224 mm²  224 mm²  224 mm²  245 mm² 
Počet tranzistorů  1,18 mld.  1,18 mld.  1,18 mld.  1,18 mld.  1,18 mld.  2,41 mld. 
TDP  100 W  100 W  65 W  100 W  100 W  95 W
Instrukční sady 3DNow!+, SSE4A SSE 4.2, AES-NI, AVX SSE 4.2, AES-NI, AVX, FMA3 SSE 4.2, AES-NI, AVX, FMA3 SSE 4.2, AES-NI, AVX, FMA3 SSE 4.2, AES-NI, AVX, FMA3
Virtualizace AMD-V AMD-V AMD-V AMD-V AMD-V AMD-V
Integrovaná grafika HD 6550D HD 7540D HD 7660D HD 8670D R7, 512 SP
PCI Express 2.0, 20× 2.0, 20× 2.0, 20× 2.0, 20× 2.0, 20× 3.0, 20×
Patice  FM1  FM2 FM2 FM2 FM2 FM2+
Výrobce  AMD  AMD  AMD  AMD  AMD  AMD 
Řada  Phenom II X4  FX  FX  FX  FX  FX 
Model  965 BE  4300 6100 6300 8120 8350
Frekvence  3,4 GHz  3,8 GHz 3,3  GHz  3,5 GHz 3,1 GHz  4,0 GHz
Turbo  –  3,9–4,0 GHz 3,6–3,9  GHz  3,8–4,1 GHz 3,4–4,0  GHz  4,1– 4,2 GHz
Počet jader  4 4 6 6 8 8
Počet vláken 4 4 6 6 8 8
Kódové označení  Deneb  Vishera Zambezi  Vishera Zambezi  Vishera
L1 cache  4× 128 kB  4× 16 + 2× 64 kB  6× 16 + 3× 64 kB  6× 16 + 3× 64 kB  8× 16 + 4× 64 kB  8× 16 + 4× 64 kB 
L2 cache  4× 512 kB  2× 2048 kB  3× 2048 kB  3× 2048 kB  4× 2048 kB  4× 2048 kB 
L3 cache  6 MB 8 MB 8 MB 8 MB 8 MB 8 MB
Paměti DDR3-1333 DDR3-1866 DDR3-1866 DDR3-1866 DDR3-1866 DDR3-1866
Paměťových kanálů 2 2 2 2 2 2
Max. kapacita RAM 32 GB 32 GB 32 GB 32 GB 32 GB 32 GB
Sběrnice 4 GT/s (HT) 5,2 GT/s (HT)  5,2 GT/s (HT)  5,2 GT/s (HT)  5,2 GT/s (HT)  5,2 GT/s (HT) 
BCLK 200 MHz 200 MHz 200 MHz 200 MHz 200 MHz 200 MHz
Násobič  17 19 16,5 17,5 18 20
Výrobní proces  45 nm SOI  32 nm  32 nm  32 nm  32 nm  32 nm 
Velikost jádra  258 mm²  319 mm²  319 mm²  319 mm²  319 mm²  319 mm² 
Počet tranzistorů  758 milionů  ~1,6 mld. ~1,6 mld. ~1,6 mld. ~1,6 mld. ~1,6 mld.
TDP  125 W  95 W 95 W  95 W 125 W  125 W 
Instrukční sady 3DNow!+/Pro, SSE4A SSE 4.2, AES-NI, AVX, FMA3 SSE 4.2, AES-NI, AVX, FMA4 SSE 4.2, AES-NI, AVX, FMA3 SSE 4.2, AES-NI, AVX, FMA4 SSE 4.2, AES-NI, AVX, FMA3
Virtualizace AMD-V AMD-V AMD-V AMD-V AMD-V AMD-V
Integrovaná grafika
PCI Express
Patice  AM3  AM3+  AM3+  AM3+  AM3+  AM3+ 
Výrobce  Intel  Intel  Intel  Intel  Intel  Intel 
Řada  Celeron Pentium  Pentium  Pentium Core i3 Core i3
Model  G1610 G860 G2020 G3420 3220 4330
Frekvence  2,6 GHz 3,0 GHz 2,9 GHz 3,2 GHz  3,3 GHz 3,5 GHz 
Turbo  –  –  –  –  –  – 
Počet jader  2 2 2 2 2 2
Počet vláken 2 2 2 2 4 4
Kódové označení  Ivy Bridge Sandy Bridge  Ivy Bridge Haswell Ivy Bridge Haswell
L1 cache  2× 64 kB  2× 64 kB  2× 64 kB  2× 64 kB  2× 64 kB  2× 64 kB 
L2 cache  2× 256 kB  2× 256 kB  2× 256 kB  2× 256 kB  2× 256 kB  2× 256 kB 
L3 cache  2 MB 3 MB 3 MB 3 MB 3 MB 4 MB
Paměti DDR3-1333 DDR3-1333 DDR3-1333 DDR3-1600 DDR3-1600 DDR3-1600
Paměťových kanálů 2 2 2 2 2 2
Max. kapacita RAM 32 GB 32 GB 32 GB 32 GB 32 GB 32 GB
Sběrnice 5 GT/s (DMI) 5 GT/s (DMI) 5 GT/s (DMI) 5 GT/s (DMI) 5 GT/s (DMI) 5 GT/s (DMI)
BCLK 100 MHz 100 MHz 100 MHz 100 MHz 100 MHz 100 MHz
Násobič  26 30 29 32 33 35
Výrobní proces  22 nm high-k  32 nm high-k  22 nm high-k  22 nm high-k  22 nm high-k  22 nm high-k 
Velikost jádra  160 mm²  131 mm²  160 mm²  118 mm²  160 mm²  118 mm² 
Počet tranzistorů  1,4 mld. 504 milionů  1,4 mld. ? mld. 1,4 mld. ? mld.
TDP  55 W 65 W  55 W 53 W 55 W 54 W
Instrukční sady SSE 4.2 SSE 4.2 SSE 4.2 SSE 4.2 SSE 4.2, AVX SSE 4.2, AES-NI, AVX, AVX2, FMA3
Virtualizace VT-x VT-x VT-x VT-x VT-x VT-x
Integrovaná grafika HD HD HD HD HD 2500 HD 4600
PCI Express 2.0, 16× 2.0, 16× 2.0, 16× 3.0, 16× 2.0, 16× 3.0, 16×
Patice  1155 1155 1155 1150 1155 1150
Výrobce  Intel  Intel  Intel  Intel  Intel  Intel 
Řada  Core i5 Core i5 Core i7 Core i7  Core i7  Core i7 
Model  3350P 4670K 4770K 3820 3960X 4960X
Frekvence  3,1 GHz  3,4 GHz  3,5 GHz 3,6 GHz  3,3 GHz  3,6 GHz 
Turbo  3,3 GHz 3,8 GHz  3,9 GHz 3,9 GHz  3,9 GHz  4,0 GHz 
Počet jader  4 4 4 4 6 6
Počet vláken 4 4 8 8 12 12
Kódové označení  Ivy Bridge Haswell Haswell Sandy Bridge-E  Sandy Bridge-E  Ivy Bridge-E 
L1 cache  4× 64 kB  4× 64 kB  4× 64 kB  4× 64 kB  6× 64 kB  6× 64 kB 
L2 cache  4× 256 kB  4× 256 kB  4× 256 kB  4× 256 kB  6× 256 kB  6× 256 kB 
L3 cache  6 MB 6 MB 8 MB 10 MB 15 MB 15 MB
Paměti DDR3-1600 DDR3-1600 DDR3-1600 DDR3-1600 DDR3-1600 DDR3-1866
Paměťových kanálů 2 2 2 4 4 4
Max. kapacita RAM 32 GB 32 GB 32 GB 64 GB 64 GB 64 GB
Sběrnice 5 GT/s (DMI) 5 GT/s (DMI) 5 GT/s (DMI) 5 GT/s (DMI) 5 GT/s (DMI) 5 GT/s (DMI)
BCLK 100 MHz 100 MHz 100 MHz 100 MHz 100 MHz 100 MHz
Násobič  31 34 35 36 33 36
Výrobní proces  22 nm high-k  22 nm high-k  22 nm high-k  32 nm high-k  32 nm high-k  22 nm high-k 
Velikost jádra  160 mm²  160 mm²  160 mm²  294 mm²  435 mm²  257 mm² 
Počet tranzistorů  1,4 mld. 1,4 mld. 1,4 mld. 1,27 mld. 2,27 mld. 1,86 mld.
TDP  69 W 84 W 84 W 95 W  130 W  130 W 
Instrukční sady SSE 4.2, AES-NI, AVX SSE 4.2, AES-NI, AVX, AVX2, FMA3 SSE 4.2, AES-NI, AVX, AVX2, FMA3 SSE 4.2, AES-NI, AVX SSE 4.2, AES-NI, AVX SSE 4.2, AES-NI, AVX
Virtualizace VT-x, VT-d VT-x VT-x VT-x, VT-d VT-x, VT-d VT-x, VT-d
Integrovaná grafika HD 4600 HD 4600
PCI Express 3.0, 16× 3.0, 16× 3.0, 16× 2.0, 40× 2.0, 40× 3.0, 40×
Patice  1155 1150 1150 2011 2011 2011

 

Asus A88X-Pro, testovací konfigurace a návod na interaktivní grafy

Asus A88X-Pro

A88X-Pro mi Asus dodal k testům už někdy v létě. Zapojil jsem ji do dřívějšího testování levných grafik, jen ale ve chvíli, kdy selhala kompatibilita Gigabyte F2A85X-UP4 (s ref. GTX 460). Jelikož Kaveri potřebuje desku s podporou FM2+ a mezi ně docela smutně žádná s čipsetem AMD A85X nepatří, šetřil jsem si ji pro tuto příležitost.

Mezitím došlo k trochu pikantní záležitosti – deska zmizela z českého trhu a taky z českých stránek Asusu. Jelikož ale v době prodeje nabízela za danou cenu velice dobrou výbavu i provedení (chvályhodné je zejména chlazení), tak doufejme, že se do nabídky zase vrátí. Každopádně podpora desky funguje stále a i v lednu vyšly (zřejmě kvůli Kaveri) dvě nové verze UEFI. Testoval jsem nakonec s verzí 0802 z konce ledna, níže uvidíte ale ještě i pár obrázků z verze 0801.

 

Při sledování příkon celého PC (platformy) je důležité mít na paměti, že i při stejném nastavení je A88X-Pro trochu „žravější“ než Gigabyte F2A85X-UP4. Tak například v kombinaci s procesorem A10-5800K a zmíněnou GTX 460 (kterou se mi nakonec povedlo v F2A85X-UP4 rozjet) činil rozdíl příkonu celé sestavy v idle 6 W (52 na F2A85X a 58 s A88X-Pro), ve hře World in Conflict, kde je zatíženo poměrno dost CPU i GPU činil rozdíl 5 W (231 vs. 236 W). S GTX 660 ve slotu byl rozdíl kupodivu menší (46 vs. 48 W) a s Radeonem R9 270 jsem se opět dostal na zřetelně více wattů u A88X-Pro (52 vs. 59 W v idle, 210 vs. 220 W ve World in Conflict). Budete-li tak srovnávat příkon celé sestavy s Kaveri proti příkonu PC s Trinity či Richlandem, berte v potaz úspornější desku u později jmenovaných nebo hleďte jen na izolované měření na ATX12V.


 

I když AMD v kitu dodávala svoje paměťové moduly DDR3 se značkou Radeon, použil jsem osvědčené Kingston HyperX T1. Ty zvládají 2400 MHz zcela bez problémů, ale nenabízí profil AMP. Podporují jen konkurenční XMP, jenže se ukázalo, že to pro kombinaci A88X-Pro s A10-7850K není žádný problém a vše šlapalo jako hodinky. Jen v UEFI zvolíte XMP Profile #1 a v podstatě se dá říct, že Kaveri A10 podporuje nikoli max. DDR3-2133, ale DDR3-2400. Trochu něco jiného je Kaveri A8, ale to už bych trochu předbíhal.

UEFI desky A88X-Pro je velmi povedené. Žádné omalovánky, pěkně přehledné, účelně uspořádané, rychlé a opravdu bezvadný je výpis provedených změn před případným uložením či opuštěním UEFI.

 

Testovací konfigurace

AMD FX-8120 vs. Intel Core i5-3570K

Testovací sestava pro jednotlivé procesory se liší jen v nutném minimu. Změny se kromě procesoru samotného týkají v případě různé platformy samozřejmě také základní desky, ty stejné paměti od Kingstonu jsou potom nastaveny dle schopností procesoru (na nejvyšší oficiálně podporovanou frekvenci). 

Operační systémy:

  • Microsoft Windows 7 Enterprise x64, SP1
  • Ubuntu 12.04.1 LTS, 64-bit

Společné komponenty:

  • grafická karta: Gigabyte GeForce GTX 680 OC, 2 GB (GV-N680OC-2GD)
  • systémový disk: Intel X25-M, 160 GB
  • zdroj: Enermax Modu87+, 800 W
  • chladič procesoru: Noctua NH-C12P
  • paměti: 2× 4 GB Kingston HyperX T1 DDR3-2400 (KHX24C11T1K2/8X)

Platforma FM2+:

  • základní deska: Asus A88X-Pro
  • nastavení pamětí: 2400 MHz, 11-13-13-30-2T @ 1,65 V


 

Platforma LGA 1150:

  • základní deska: Gigabyte Z87X-UD3H
  • nastavení pamětí: 1600 MHz, 8-8-8-24-1T @ 1,5 V

Platforma AM3+:

  • základní deska: Gigabyte GA-990FXA-UD7
  • nastavení pamětí: 1866 MHz, 9-10-10-27-1T @ 1,65 V, resp. 2133-11-12-11-30-2T @ 1,60 V v případě A10-6800K

AMD FX-8120 vs. FX-6100 vs. Intel Core i5-3570K

Testování CPU EHW 2012

Platforma LGA 1155:

  • základní deska: Gigabyte Z77X-UD5H
  • nastavení pamětí: 1600 MHz, 8-8-8-24-1T @ 1,5 V

AMD FX-8120 vs. FX-6100 vs. Intel Core i5-3570K

Testování CPU EHW 2012

Platforma LGA 2011:

  • základní deska: Asus P9X79 Deluxe, BIOS 0650
  • nastavení pamětí (čtyři moduly v čtyřkanálovém zapojení): 1866 MHz, 9-10-10-27-1T @ 1,65 V pro Ivy Bridge-E, resp. 1333-8-8-24-1T @ 1,5 V pro Sandy Bridge-E 

Platforma FM2:

  • základní deska: Gigabyte GA-F2A85X-UP4
  • nastavení pamětí: 1866 MHz, 9-10-10-27-1T @ 1,65 V

AMD A10-5800K test

AMD A10-5800K test

AMD A10-5800K s Gigabyte GA-F2A85X-UP4

Platforma FM1:

  • základní deska: ASrock A75 Pro4
  • nastavení pamětí: 1866 MHz, 9-10-10-27-1T @ 1,65 V

V ovladačích grafické karty jsem vypnul vertikální synchronizaci a kvůli opakovatelnosti měření také adaptivní správu napájení v 3D režimu.

Testování CPU EHW 2012

Testování CPU EHW 2012

Za zapůjčení grafické karty děkujeme společnosti Gigabyte

Testování CPU EHW 2012

Kingston Za zapůjčení pamětí DDR3 děkujeme společnosti Kingston

Za zapůjčení zdroje děkujeme společnosti Enermax

Za poskytnutí chladiče Noctua NH-C12P a teplovodivé pasty Noctua NT-H1 děkujeme společnosti RASCOM Computerdistribution

 

Jak na interaktivní grafy 2.0

  1. Pokud se vám nelíbí písmo se stíny, velmi snadno je vypnete v Nastavení. Máte-li ještě problémy s rychlostí zobrazování, můžete v Nastavení povypínat také animace. 
  2. V základním nastavení jsou pruhy seskupeny dle úhlopříčky monitory a dále seřazeny dle naměřené hodnoty (vzestupně, či sestupně pak podle toho, je-li zrovna vyšší = lepší či naopak). Toto můžete snadno změnit zvolením řazení dle naměřené hodnoty v testu, seskupením třeba podle matrice apod.
  3. Po najetí myší na některou z položek (třeba na HP ZR24w) se z této stane 100 % (základ) a ostatní položky se spočítají podle ní. Všechny absolutní hodnoty se změní na relativní. Zpět se změní, až kurzor myši opustí oblast s názvy položek (v tomto případě procesorů).
  4. Budete-li chtít nějakou položku (monitor) v grafech sledovat, můžete si její pruh libovolně obarvit. Stačí klepnout levým tlačítkem myši na barevném pruhu a vybrat si z palety. Máte-li povoleny cookies, mělo by vám nastavení vydržet i pro další grafy v dalších kapitolách.
  5. Cenu a další základní parametry (například rozlišení či úhlopříčku) můžete zobrazit kdykoliv v každém grafu: stačí u vybraného procesoru najet kurzorem myši nad pruh s hodnotou (měření) a chvíli počkat. Objeví se jako plovoucí nápověda (tooltip).
  6. Zámek základu (monitor, který se stane těmi 100 % a od něhož se odvíjí další relativní hodnoty) aktivujete pomocí současného stisku klávesy CTRL a levého tlačítka myši nad procesorem (či jeho pruhem v grafu), který chcete uzamknout.
  7. Před prvním použitím grafů si pro jistotu vyprázdněte cache prohlížeče (zřejmě bude stačit refresh) a v případě problém smažte i příslušné cookies.
  8. Interaktivní grafy 2.0 jsou kompatibilní s prohlížeči Firefox (testovány verze 4.x), Opera (testováno s 11.x), Internet Explorer 8 a 9 (verze 7 a starší už nejsou podporovány, verze 10 zatím také ne) a Chrome (zde mají tooltipy hranaté rohy namísto kulatých).
  9. V případě problémů se nejdříve ujistěte, že máte v prohlížeči povoleny skripty i cookies, dále splnění bodů 7 a 8, teprve potom nám chybu prosím co nejpřesněji reportujte. Jedná se o první ostré nasazení grafů, takže i přes delší testování autorem a redakcí při komplexnosti aplikace určitě ještě nějaké mouchy v nějaké kombinaci objevíte.


Video a hudba

Video

x264 benchmark HD v5.0 64-bit

x264 benchmark testuje výkon procesoru při převodu videa v rozlišení 1080p s použitím kodeku x264. Benchmark je ke stažení na TechARP.com, nově používáme výsledky z obou průchodů.

x264 FHD benchmark v1.0.1 64-bit

FHD benchmark také používá bezplatný x264, počítá už s 64bitovými systémy a má příjemnější rozhraní. Benchmark si můžete stáhnout třeba z Guru3D (181 MB), archiv stačí rozbalit a už můžete testovat. Na rozdíl od x264 HD benchmarku nepotřebujete ani instalovat Avisynth. O výsledky se můžete podělit už v připraveném vlákně v našem diskuzním fóru.

Windows Media Encoder 9

1GB full HD video pořízené Frapsem ve hře Empire: Total War je převáděno do WMV9 720p, 5,5 Mb/s.

VirtualDubMod + XviD 1.3.2

VirtualDubMod slouží pouze jako rozhraní pro převod 1GB full HD videa ze hry Empire: Total War do .AVI s kodekem XviD. Profile @ Level je nastaveno na XviD HD 1080, dále jeden průchod a kvalita na 4,00 (1,00 je nejlepší kvalita, 31 nejhorší). Je zapnuta autodetekce a volba použitelných instrukčních sad (podporovány jsou jak SSE až do SSE4, tak 3DNow! 2), z voleb post-processingu nic vybráno není.

XMedia Recode 3.1.2.5 H.264

Oblíbený freewarový převaděč všech možných formátů videí používám v jeho portable verzi. Opět znásilňuji 1GB Full HD video z Empire: Total War, tentokrát je cílem v programu předdefinovaný profil YouTube 1080p s H.264. V nastavení kvality pak volím místo jednoho průchodu průchody dva (2-pass, cílový průměrný bitrate 8000). Zvuková část je převáděna do AAC.

Shrnutí

Hudba

WAV do MP3: LameEnc 3.99

Dva rozměrné stereo WAV (jeden 201MB, 16-bit/44 kHz, druhý 327MB 24-bit/96 kHz (L. v. Beethoven, Sonate 32 z 2L) jsou převáděny do formátu MP3. Použita je poslední stabilní verze LameEnc, VBR a kvalita extreme. LameEnc využívá instrukční sady MMX, SSE a SSE2.

WAV do AAC (Advanced Audio Coding): iTunes přes qaac (CoreAudioTool 7.9.9.7)

Dva rozměrné stereo WAV (jeden 201MB, 16-bit/44 kHz, druhý 327MB 24-bit/96 kHz (L. v. Beethoven, Sonate 32 z 2L) jsou převáděny do formátu AAC.

WAV do ALAC (Apple Lossless Audio Codec) pomocí refalac64 0.51

Dva rozměrné stereo WAV (jeden 201MB, 16-bit/44 kHz, druhý 327MB 24-bit/96 kHz (L. v. Beethoven, Sonate 32 z 2L) jsou převáděny do formátu ALAC.

WAV do FLAC (Free Lossless Audio Codec) pomocí FLAC 1.2.1b

Dva rozměrné stereo WAV (jeden 201MB, 16-bit/44 kHz, druhý 327MB 24-bit/96 kHz (L. v. Beethoven, Sonate 32 z 2L) jsou převáděny do formátu FLAC.

Shrnutí


Bitmapová grafika, fotografie, rendering

Bitmapová grafika, fotografie

Autopano Giga 64-bit 2.6.4

Autopano mám nastaveno na využití maxima jader procesoru i pomoc GPU. Zdrojem je 57 fotografií (JPEG) o rozlišení 2848 × 4288 px, výstupem pak jeden soubor JPEG se slepeným panoramatem. Jako výstupní kvalita je zvolen HDR output (obsahuje anti-ghost).

Testování CPU EHW 2012

Oproti minulým letům nechává ve výpočtech pomáhat GPU. Nevím ale, jestli se při finálním renderingu panoramatu nějak významně uplatní. V globálním nastavení Autopano dávám maximum vláken, které je procesor schopen paralelně zpracovávat.

Hugin 2011.4 64-bit 

Také zdarma dostupný Hugin pracuje nad 57 fotografiemi panoramatu (fotky je třeba slepovat v ose X i Y) od uživatele Johnyn (děkuji!). Měřím čas od zarovnání obrázků až po kompletní náhled panoramatu v editoru.

 Testy CPU nastavení Testy CPU nastavení

Paint.NET 3

Pro testování výkonu ve volně šiřitelném bitmapovém editoru používáme rozhraní TPUbench a benchmark PdnBench.

RawTherapee 64-bit v3.0.1

Zdarma dostupnou alternativu k placeným editorům RAW (Adobe Lightroom, Apple Aperture) trápím celkem 100 soubory RAW ze tří fotoaparátů (TIFF, CR2, DNG). Ty převádím na JPEG v nejvyšší kvalitě s uchováním EXIFu

3.0.1 byla poslední stabilní verzí v době sestavování metodiky. Vyzkoušel jsem také vývojovou 4.0.9.50, ale na Core i5 se mi podařila konverze stovky souborů dokončit jen někdy, na platformě s AMD FX ani jednou. Vyzkoušel jsem také několik o trochu starších sestavení 4.0.8.x a 4.0.7.x, bohužel s podobným výsledkem. Výkonnostní optimalizace ve verzi 4.x jsou přitom slibné, stejná úloha, co ve verzi 3.0.1 trvala procesoru Core i5-3570K 5:19 (min:s), zabrala ve 4.0.9 už jen 4:29,4 (min:s).

Zoner Photo Studio 15 x64

V jednom sub-testu jsou prováděny dávkové operace nad 56 fotografiemi ve formátu JPEG, v dalším je převáděno 100 fotek ve formátu RAW (TIFF a CR2 z přístrojů Canon a Adobe DNG z DSLR Pentax) do JPEG.

Shrnutí

Rendering

Cinebench R11.5 64-bit

Poslední verze benchmarku výkonu v Cinema 4D. Výsledek při renderingu na jediném jádru uvádíme spíše jako teoretickou zajímavost.

 

 

Frybench 64-bit

Postup měření v programu Frybench je popsán v tomto článku. Vaše výsledky můžete ukázat a s dalšími konfiguracemi srovnávat zde: Frybench – výsledky.

POV-Ray v3.7 beta RC6 64-bit

Beta verze freeware raytraceru POV-Ray umožňuje využít vícejádrové procesory. Pro testy používáme jednu ze scén mezi příklady dodanými s programem: chess2.pov a rozlišení 1600 × 1200 px s AA 0.3 (800 × 600 px bez anti-aliasingu měřím už jen pro srovnání s minulými generacemi procesorů/testů).

Blender 2.63 64-bit

Pro testování v 3D modeláři Blender používám demo-projekt Helicopter (demonstrace Cycles, stažitelné v balíku dem pro 2.61 z blender.org).

Testování CPU EHW 2012

Bez změny nastavení (mimo snížení rozlišení na 800 × 600 px, abych nečekal na výsledek věčnost) spustím rendering (F12) a měřím čas.

LuxMark 2.0 64-bit

LuxMark 2.0 vám v jednoduchém rozhraní otestovat výkon vašeho procesoru (CPU) nebo grafické karty (GPU) na několika scénách vykreslovaných právě pomocí LuxRenderu. U grafické karty budete samozřejmě potřebovat mít dostatečně moderní (včetně ovladačů) – podpora OpenCL (potažmo GPGPU) je minimálním požadavkem. LuxRender je možné využít ve spojení se spoustou modelářů Blenderem či 3Ds Max počínaje a Poserem nebo SketchUpem konče. Více informací ve starší aktualitě o LuxMarku. V systému je nainstalován balík Intel SDK for OpenCL 2012 64-bit a AMD APP SDK v2.7 x64. Do shrnujících grafů započítávám výsledky v komplexní scéně „Room“.

Shrnutí

Do shrnutí z předešlého nepočítám jen Cinebench Single core a LuxMark medium.

 

Komprese a šifrování

WinRAR 4.20 64-bit

Používám zabudovaný benchmark (ALT + B) se zapnutou volbou multithreading. 

Pokud byste se na to náhodou chtěli zeptat, tak namátkou jsem  u procesoru Core i5-3570K vyzkoušel v registru Windows vypnout i Core parking. Výsledkem bylo mírné zhoršení výsledku (což se možná vešlo do běžné chyby měření). U procesorů bez HyperThreadingu dokonce ani kvůli WinRARu nemusíte Core parking nijak řešit.

AMD FX-8120 vs. FX-6100 vs. Intel Core i5-3570K AMD FX-8120 vs. FX-6100 vs. Intel Core i5-3570K

7-zip 9.20 x64

I v 7-zipu využívám integrovaného benchmarku, v grafu je celkový výsledek počítaný z výkonu při kompresi i dekompresi.

WinZIP 16.5 + AES

Extrakce 3,5GB zaheslovaného archivu ZIP (šifrování AES, zkomprimovaná celá složky hry World of Tanks). Zatím se bohužel zdá, že výsledky jsou dost podle toho, jak se zrovna SSD vyspí. Dost nesedí hlavně výsledek Core i3-3220 (byť je to nejlepší ze tří měření).

Testy CPU nastavení

TrueCrypt 7.1a

Testy pochází z integrovaného benchmarku (Tools, Benchmark), velikost bufferu nastavena na 500 MB. Výsledek je průměrem šifrování a dešifrování.

V prvním grafu je spočtena průměrná rychlost ze všech dílčích testů TrueCryptu (tento jediný graf je taková počítán do dalších souhrnů):

Dílčí testy TrueCrypt 7.1a:

Shrnutí

 

Virtualizace (VirtualBox)

VirtualBox 4.1.20 + Ubuntu 12.04.01 x64

Ve VirtualBoxu přiděluji maximum dostupných fyzických jader a 2048 MB RAM.

AMD FX-8120 vs. FX-6100 vs. Intel Core i5-3570K
AMD FX-8120 vs. FX-6100 vs. Intel Core i5-3570K
AMD FX-8120 vs. FX-6100 vs. Intel Core i5-3570K

Shrnutí

PCMark 7 a multi-tasking

Poslední verzi PCMarku jsem do metodiky zařadil především díky snadnějšímu srovnání s vašimi případně naměřenými výsledky a také proto, že nabízí ještě vcelku přesnou možnost změření výkonu při dvou paralelně prováděných úlohách (multi-tasking).

 


Následující dva testy jsou spouštěny současně:

 


Následující dva testy jsou spouštěny současně:

 

 


 


Následující dva testy jsou spouštěny současně:


 

Linux (Ubuntu 12.04.1 LTS 64-bit)

Ubuntu 12.04.1 LTS 64-bit

Po určitém rozvažování jsem se rozhodl testování v linuxové distribuci nakonec zařadit. Zvolil jsem asi tu „nejlidovější“ a musím říct, že návrat k mému kdysi primárnímu OS se mi docela líbil (přece jen kompletní start docela pěkně vypadajícího prostředí na testovacím HW za šest sekund má něco do sebe).

S vámi bych se chtěl pro začátek poradit, jestli byste uvítali výsledky z Linuxu zařazené mezi ostatní (například C-Ray v renderingu, RAMspeed v kapitole s rychlostí pamětí atd.), nebo takto vyseparovány do své kapitoly?

Phoronix Test Suite

Kompilace jádra

Vždy s parametrem -j počet_vláken (max. podporovaných procesorem).

7-zip 9.20 x64

Stejně jako ve Windows je uváděn jen celkový výsledek (komprese i dekomprese).

GtkPerf

Pro vyšší přesnost navyšuji výchozích 100 kol testů na 1000.

Shrnutí

Tento shrnující graf je sice velkou směskou, ale je zároveň mezivýsledkem účastnícím se na hlavním shrnujícím grafu, tak vám jej pro zajímavost předkládám také.

 

Teoretické testy, PI, prvočísla, Zlib, AES, Hash, VP8, fraktály

Deep Fritz 12 Chess benchmark

Benchmark simulující počítání šachových kombinací skutečného šachového programu Fritz má svoji zdarma dostupnou verzi. Já jsem ale použil benchmark přímo v programu Deep Fritz 12, který by měl být stejný až na jednu drobnost – umožňuje nastavit více než osm vláken (za tip děkuji Flank3rovi).

Testy CPU nastavení Testy CPU nastavení

SuperPI mod XS 1.5

Výpočet Ludolfova čísla na milion desetinných míst.

wPrime 2.0

Vícevláknová obdoba jednoduchého benchmarku SuperPI (samozřejmě se nepočítá Ludolfovo číslo, ale prvočísla).

Y-cruncher 0.5.5

Údajně nejrychlejší program pro výpočet Ludolfova čísla je vícevláknový a autor se chlubí tím, že předčí nejen SuperPi na jednojádru, ale také PiFast na dvoujádru či QuickPi na čtyřjádru.

AIDA64 v2.60

Následující sada testů v AIDA64 (dříve Everest, předtím jen AIDA32) jsou do jisté míry low-level benchmarky. Většina zatíží hlavně ALU, ty od VP8 níže pak FPU. AES je v podstatě testem přítomnosti instrukční sady AES-NI (+ velkou roli hraje propustnost paměti – v single channelu je výsledek sotva 60%).

Shrnutí

Rychlost pamětí

AMD FX i Ax podporují frekvenci až 1866 MHz, čehož jsem využil. Ani tak bohužel pro AMD není dosaženo na propustnost a latence níže taktovaných pamětí ve společnosti Ivy Bridge. RAMspeed v OS Ubuntu x64 potvrzuje to samé. Tento linuxový paměťový test však na rozdíl od AIDA64 dokáže těžit i ze čtyřkanálového přístupu procesorů LGA 2011.

Pozor, nová verze benchmarku AIDA64 – v grafech níže bude potřeba přeměřit ostatní CPU touto verzí! (teď je to skutečně míchání jablek s hruškama, orientujte se spíše podle benchmarku RAMspeed v Ubuntu)

Kaveri (A10-7850K):

Haswell (Pentium G3420):

Haswell (Core i3-4330):

Ivy Bridge-E (Core i7-4930K):

 

 

Trinity (A6-5400K):

Trinity (Athlon X4 750K):

Ivy Bridge (Celeron G1610):

Ivy Bridge (Pentium G2020):

Ivy Bridge-E (Core i7-4960X):

  

Sandy Bridge-E (Core i7-3960X):


Richland (A10-6800K):

  

Haswell (Core i5-4670K):

 

Haswell (Core i7-4770K):

 

Ivy Bridge (Core i5-3350P):

Vishera (FX-6300):

Ivy Bridge (Core i7-3770K):

Sandy Bridge (Pentium G860):

Pentium G860: detekce a testy

 Deneb:

AMD Phenom II X4 965

Piledriver:

AMD FX-8350 (Vishera) screenshoty

Trinity:

AMD A10 vs Intel Core i3

Bulldozer:

AMD FX-8120 vs. FX-6100 vs. Intel Core i5-3570K

Sandy Bridge-E:

AMD FX-8350 (Vishera) screenshoty

Shrnutí

 

Hry

Není-li řečeno jinak, jedná se o průměrné snímkové frekvence (avg. fps). Téměř vždy jde o nejvyšší možné nastavitelné detaily, jen anti-aliasing zůstává vypnut.

Vysoké rozlišení

Jestli mi někdo bude brečet v diskuzi, že nemám „ful hádé“, tak mu už raději dopředu sděluji, že rozdíl (v Mpx) mezi 1680 × 1050 px a 1920 × 1080 px je malý a ještě více v optice testu CPU. Stejně uvidíte, že i při nastavení max. detailů (jen bez anti-aliasingu, který je opravdu čistě záležitostí GPU) je vliv rozlišení i třeba proti 800 × 600 px vcelku malý – vybrané testy jsou v případě použití GeForce GTX 680 opravdu hodně závislé na procesoru.

 

Call of Duty 4: Modern Warfare

Stále nejspíše nejhranější díl CoD (možná společně s dvojkou) testuji pomocí timedema obsaženého v již dále nevyvíjeném automatizovaném nástroji TpuBench. Detaily jsou nastaveny na maximum, anti-aliasing vypnut.

Enemy Territory: Quake Wars

V OpenGL ET:QW používám osvědčené timedemo a v nastavení dávám předvolbu Quality: High. Ta nastaví skoro vše na maximální hodnoty, jen osvětlení je na hodnotě Normal a anti-aliasing vypnut. Vypnuty jsou i soft particles, anizotropní filtrování je na hodnotě 8×. Přes konzoli hru zbavuji omezení snímkové frekvence. Jiný poměr stran může způsobit, že v rozlišení 640 × 480 px bude výsledek nižší než v 1680 × 1050 px.

Testy CPU nastavení Testy CPU nastavení Testy CPU nastavení    

Left 4 Dead

Zástupce enginu Source je otestován pomocí vlastního timedema, kvůli kterému musím opatrně konzervovat verzi hry (Steam má neustálé tendendce všechno navzdory předvolbám aktualizovat). Nastavuji maximální detaily, trilineární filtraci textur a jen anti-aliasing zůstává vypnut. Důležité je zapnutí multicore renderingu a vypnutí vertikální synchronizace.

 Testy CPU nastavení Testy CPU nastavení

The Elder Scrolls V: Skyrim

Pro testování jsem vybral dvě uložené pozice v lokacích Whiterun (pohled na velkou část měst a ještě i za hradby) a Riverwood (stromy, voda, vesnice - v ZIPu je ještě třetí pozice Ragged Flagon (podzemí Riftenu), kterou jsem pro testy CPU nevyužil). Po nahrání uložené pozice počkám, až se uklidní ukazatel se snímky za sekundu (načítání z disku, obyčejně je to ale tak dvě až tři sekundy po zmizení nahrávací obrazovky) a poté měřím deset sekund (nastaveno ve FRAPSu). Nahraji další pozici a postup opakuji. V grafu je hodnota průměrných fps spočtena jako průměr dvou desetisekundových měření. Použitá verze hry je 1.7.7.0.6, nejsou přidány žádné balíčky textur ani jiná rozšíření.

Testy CPU nastavení Testy CPU nastavení Testy CPU nastavení

Unreal Tournament 3

Letitý UT3, jehož engine je stále základem obrovského množství her, testuji pomocí průletu na VCTF-Suspense. Detaily jsou nastaveny na maximum (ve hře číslo 5, což obnáší i 16× AF), fyzika softwarová. Beru lepší výsledek ze dvou opakování.

World in Conflict

Oproti minulé metodice mohu díky dostatečně výkonné grafické kartě nastavit celkové grafické detaily na hodnotu Nejvyšší. To obnáší DX10 rendering a dokonce 4× MSAA. Vypnuta je pouze volba Voda odráží oblaka. Podobně jako ET:QW, i World in Conflict podporuje FOV a výsledky v nižším rozlišení s poměrem stran 4:3 mohou být vyšší než ty v 1680 × 1050 px s 16:10.

World of Tanks

V klientu verze 8.0 přehrávám replay v jedné z nejnáročnějších a současně na procesoru nejvíce závislých map: Ensk. S poměrně svižným stíhačem tanků SU-100 projedu velkou část mapy (problematické křoviny, většinu města). Často je používán sniper mód, především na začátku hry pak oddálení kamery a celkový pohled na spoustu objektů. Použit je Rendering Improved, Graphics Quality je nastaveno na Maximum, vše až na položku Enhanced Shadows je na maximálních možných hodnotách.

X-Plane 10

V náročném leteckém simulátoru používám benchmark skript spouštějící hru s parametrem --fps_test=1 (2, 3), ze tří různých testů pak dělám průměr. Ten je prezentován v grafu. V Setting, Rendering Options jsou prakticky všechna nastavení detailů v horních třech oddílech na maximu, počty objektů a cest na hodnotě "tons". Detaily letiště ponechány výchozí, detaily odrazů na vodě jsou vypnuty stejně jako "HDR anti-aliasing". Mraky nastaveny na rovněž výchozích 100 %. Přesná verze hry je 10.05r1.

 

Testy CPU nastavení

 

Nízké rozlišení

Druhá sada herních testů je prováděna v co nejnižším rozlišení, detaily jsou však typicky nastaveny na maximální hodnoty (kdyby náhodou CPU byl účasten na některých z nich).

Nastavení Skyrimu:

Testování CPU EHW 2012 Testování CPU EHW 2012 Testování CPU EHW 2012  

Výsledkem v grafu je průměr z výkonu ve dvou lokacích (Whiterun a Riverwood):

Shrnutí

Všechny herní testy se podílí na výsledném průměrujícím grafu z her, beru jak výsledky z nízkého, tak vysokého rozlišení. Minimální fps měřená ve World in Conflict a World of Tanks do toho samozřejmě nemotám.

Přetaktování (Asrock FM2A88X Extreme6+) , provozní vlastnosti (příkon, zahřívání)

Přetaktování

Dějství první – chceme pořádné Turbo!

Kdo čte naše diskuzní fórum, nebo sleduje vše, co se kolem Kaveri šustne, určitě už narazil na problém se snižováním frekvencí. Můj vzorek tak například po spuštění zátěže v Prime95 běžel chviličku se všemi jádry na 3,9 GHz, potom postupně snižoval frekvenci dvou na 3,8 GHz a po pár minutách už dvě jádra běžela jen na 3,7 GHz a dvě další na pouhých 3,5 GHz. Řešil jsem vše kolem teplot, hlídání TDP (tady je možná zakopaný pes, ale řešení to z pohledu uživatele nemá), ale nevyřešil.

  

HWinfo64 (výše) neukazuje teplotu CPU dobře, procesor byl i v zátěži sotva mírně zahřátý. AMD OverDrive ukazuje vzdálenost (delta) od prahové teploty, kde začne pracovat tepelná ochrana a současně reportuje napětí a skutečnou frekvenci:

     

Nejdříve jsem si myslel, že je to nějaká chyba A88X-Pro, ale výměna za Asrock FM2A88X Extreme6+ s jeho posledním UEFI (automaticky aktualizované přes web Asrocku přímo z UEFI – mimochodem skvělá vychytávka) nepomohla – spíše naopak. Při výchozím nastavení (tedy spíše navzdory nastavení v UEFI) už 7850K běhal zcela bez Turba (na 3,7 GHz):

  

Když už jsem tedy při zkoušení přesedlal na Asrock FM2A88X Extreme6+, tak si trochu pohrajeme s touto deskou.

To, že je vše s Kaveri v plenkách, dokazuje i fakt, že po instalaci A-Tune klesl příkon v idle ze 71 na 64 W (přitom na frekvencích a napětí CPU se alespoň zdánlivě nic neměnilo).

   

Málem bych zapomněl. Při hledání desky, která by snad provozovala A10-7850K opravdu na frekvencích od 3,7 GHz do 4,0 GHz jsem vyzkoušel i lacinou micro-ATX MSI A88XM-E35. Cesta tudy taky nevedla, ale ukáži vám při té příležitosti alespoň UEFI další desky.

  

   

Zpátky k Asrocku Extreme6+. Jeho UEFI sice vypadá dost divoce (nevím, co s tím vesmírem a hvězdičkami Gigabyte a Asrock mají), ale má spoustu vychytávek a je taktéž dost svižné a přehledné. 

                   

Dějství druhé – 4 GHz pořád a pěkně se sníženým napětím

Každopádně poté, co jsem vzdal boj o správnou funkci Turbo Core, jsem nastavil alespoň „natvrdo“ 4 GHz. Tuto frekvenci testovaný CPU zvládl i se snížením napětí na 1,23 V.

  

Celkově jsem si právě s napětím trochu pohrál a sledoval přitom příkon. Původně totiž automatika při zvolení "OC 4 GHz" nastavila zbytečně vysoké napětí 1,35 V. Nejdřív to vypadalo na stabilních 1,20 V, nakonec bylo třeba trochu více (necelých 1,23 V). Při výchozích 1,35 V nastavených automatikou bylo při zátěži Prime95 na wattmetru ošklivých 167 W. Po snížení z 1,35 na 1,30 V už to bylo 159 W, na 1,25 V se příkon zastavil na 149 W pro celou sestavu a 86,17 W pro samotný procesor. Při 1,20 V to bylo pěkných 138, resp. 78,47 W a při nakonec stabilních při 1,23 V pak 144, resp. 81,97 W. Vliv na teplotu CPU byl mnohem menší, 44 C při 1,35 V a 42 C při 1,23 V.

 

Na frekvenci 4 GHz pro všechna jádra i při čtyřvláknové zátěži jsem vyzkoušel testy Cinebench R11, x264 benchmark a Autopano Giga. Také čas kompilace jádra Linuxu se snížil z 21:27,7 na 20:32,177 (min:s).

      

Srovnat můžete s výsledky ve výchozím nastavení (čas v Autopano Giga byl 7:30):

   

Dějství třetí – skutečné přetaktování

Když už jsem nějak vyřešil otazníky kolem chování ve výchozím stavu, jal jsem se přetaktovat. Asrock nabízí několik profilů až po 4,5 GHz, začal jsem optimisticky tímto nejvyšším. Po chvíli zátěže se navzdory vysokým 1,45 V ukázal být nestabilním, teplotní rezerva podle AMD OverDrive přitom ještě byla. Pokračoval jsem tedy s testy na 4,4 GHz, jelikož napětí 1,45 V jsem rozhodně nechtěl překračovat. Frekvence 4,4 GHz pro všechna jádra byla stabilní s ještě rozumným napětím 1,4 V a rovněž chladič Noctua NH-C12P pro takto nastavený procesor dostačoval i při delší zátěži.

    

Když si vzpomenete na to, že v základu běží A10-7850K v zátěži tak kolem těch 3,8 GHz v průměru, není nárůst výkonu po zvýšení frekvence na 4,4 GHz zanedbatelný:

   

Malá perlička na závěr – Extreme6+ nabízí profily TDP 65 a 45 W pro A10-7850K, po vložení A8-7600 tato položka z UEFI zcela zmizí. Občas jsou věci prostě naopak.


 

 

Příkon (spotřeba) změřený izolovaně na EPS12V

V recenzích procesorů na EHW se můžete setkat kromě tradičního měření příkonu celé sestavy zásuvkovým wattmetrem také s izolovaným měřením příkonu na EPS12V.

Bočník měřící procházející proud sestrojil Honza Černý, napětí bylo kontrolováno běžným multimetrem VoltCraft VC-140.

Příkon (spotřeba) celého PC s daným CPU

wattmetr

Spotřeba (ano příkon) celé sestavy s daným procesorem je měřena pomocí zásuvkového měřiče spotřeby elektrické energie FK Technics. A přestože chladič, zdroj a grafická karta zůstávají neměnné a paměti jsou nastaveny také velmi srovnatelně, pořád se jedná o spotřebu celé platformy dané do jisté míry také základní deskou, osazenou čipovou sadou a dalšími čipy právě na desce (i když i v tomto případě jsou podmínky díky použití desek Gigabyte ze stejné třídy v rámci možnosti co nejvíce srovnány).

Teplotní testy berte spíš jako velmi hrubou informaci. Použitým chladičem je sice Noctua NH-C12P a pastou pak Noctua NT-H1, přesto může dojít k ne vždy stejnému rozetření pasty a teplota okolí se může také mezi testy lišit až o tři stupně Celsia.

Důležité je také přímo nesrovnávat teploty CPU napříč různými platformami. Intel i AMD mají teplotní senzor pojat evidentně dost jinak.

Shrnující grafy

Kdo rád přeskakuje kapitoly, nebo prostě nemá tolik času, snad ocení právě tuto kapitolu. Všechny souhrnné (průměrující, zjednodušující, zkreslující – jak chcete) grafy z předchozích stránek pěkně pohromadě.

Shrnutí a verdikt

AMD uvádí první desktopová APU Kaveri

Po všech těch shrnujících grafech jako obvykle ještě jeden pořádně zavádějící (nejsou započítány výsledky z kapitol Teoretické testy, Rychlost pamětí a PCMark 7):

Podělíme-li celkový (průměrný) výkon procesorů jejich cenou, vypadne nám takovýto „index výhodnosti“:

Ten by ale platil jen v případě, že byste kupovali pouze samotné CPU. Jak by tomu bylo, kdybyste naopak kupovali celé PC? Zkusil jsem pro takový případ udělat modelovou sestavu se zhruba podobně vybavenými deskami pro zúčastněné platformy.

 

Monitor, klávesnici, myš a další možné periferie už jsem do modelu nezahrnoval. Samozřejmě je trochu problém v tom, že pokud bude někdo uvažovat o AMD A10, potom nejspíše nebude chtít nic víc než integrovanou grafiku HD 7660D. Do kalkulace by tak bylo lepší započítat levnější Athlon pro FM2, to ale bohužel není dost dobře možné – nejvýkonnější oznámený Athlon nemá tak silné CPU jako A10 (ale jako A8). Levnější Core i3 a Pentia zase budou lidé častěji párovat s deskami s čipsetem B75, nikoli Z77. Jistě chápete, že to nelze udělat pro všechny kombinace a odrážíme se ve zbytku komponent od jakési „střední třídy“.

Už při prvních pokusech o zavedení poměru výkon/cena celé sestavy jsme se v diskuzi dopracovali k tomu, že možná takovým optimem pro počítání výkon/cena by bylo vzít v potaz nikoli cenu celé sestavy, ale toho, co typicky upgradujete a spolu to nejvíce souvisí: tedy kromě procesoru ještě také základní desku a operační paměť.

Verdikt

Verdikt? Žádný ještě nebude. Kdybyste náhodou přeskočili text na začátku – jedná se zatím o izolované testy CPU části a výsledné hodnocení si A10-7850K odnese až po otestování integrované grafiky, případně nějakého spřažení sil v existujících aplikacích GPGPU.

 

U samotné procesorové části testu bych vypíchnul viditelně lepší efektivitu procesoru – poměr výkon/příkon se zlepšil, zahřívání je velmi nízké a někde (wPrime, Y-cruncher) nárůst výkonu na takt vynikající. Přestože v jednovláknovém výkonu kvůli nižší frekvenci tato A10 oproti Richlandu ztratila, nezřídka je to dohnáno lepší efektivitou v mnohavláknových testech. Cinebench obsahující testy pro všechna i jen jediné vlákno je pro to krásným příkladem.

Z hlediska AMD jde tedy bezesporu o pěkný evoluční krok, z pohledu vnímajícího silnou konkurenci Intelu už je to o dost horší. Přece jen A10-7850K už má cenu na úrovni nejlevnějších Core i5 a plná čtyři jádra Ivy Bridge či dokonce Haswellu jsou v čistě CPU testech naprosto někde jinde.

ICTS24

Hodně zajímavý se může jevit souboj tohoto APU a kupříkladu Pentia G3420 v kombinaci s grafikou za cenu kolem 2500 Kč. Obě řešení mají podobnou pořizovací cenu a… to už bude v další části.

 
 
Za zapůjčení základní desky A88X-Pro děkujeme společnosti Asus


Graf ceny produktu AMD A10 X4 7850K poskytuje server Heureka.cz