Současně s tímto článkem a samozřejmě v souladu s datem uvedení Haswellu byste měli na sesterském Cnews/Notebooky vidět už článek Honzy Olšana. V něm se dozvíte nejen o „těch zajímavějších“ Haswellech určených pro mobilní počítače, ale především všechny podstatné inovace v architektuře. Jelikož je tento článek především praktickým testem nových Core i7 a i5, připomeneme si už s předstihem známou architekture jen ve zkratce. A na první herní testy grafiky v Haswellu – pro desktopové Core nejčastější HD Graphics 4600 – si pak počkejte na pondělí. V tento den bude také možné už mluvit o dvoujádrových Haswellech.
Intel se už celé roky drží svého modelu tick/tock, jen tentokrát není tock alespoň co se desktopových procesorů týče tak citelný. Už od prvních procesorů Core (Conroe/Merom) se nemění základní prvek (14stavová instrukční pipeline) i některé další základní prvky prováděcích jednotek. V každém kroku tock však dochází ke spoustě menších či větších změn, ať už se jedná o vyrovnávací paměť, instrukční sady, velikosti bufferů, predikci větvení, správu napájení nebo třeba paměťový řadič, jež vedou k lepšímu výkonu procesorů na takt. V kroku tick pak přechod na pokročilejší výrobní proces s menší velikostí tranzistoru zase umožní dosahovat vyšších frekvencí (nebo stejných frekvencí při nižším příkonu).
Z architektury Ivy Bridge tak byl zachován 22nm výrobní proces s tranzistory Tri-Gate, základní prvky prováděcích jednotek, většina cache i FPU, paměťový řadič, většina instrukční sad i bufferů. Seznam nejdůležitějších změn a vylepšení však není malý:
- nové balení LGA 1150 a k němu příslušná patice
- instruční sady HNI (Haswell New Instructions zastřešuje AVX2 a FMA3)
- instrukce TSX (Intel Transactional Synchronization Extensions)
- přidána čtvrtá ALU
- možnost změny základní frekvence (BCLK) v určitých krocích podobně jako u Sandy Bridge-E v LGA 2011
- nová a silnější grafická jádra s podporou DirectX 11.1 a OpenGL 4.0
- vylepšené předvídání skoků a větvení kódu
- větší velikosti bufferů
- zvětšené části L1 cache (data store/load) a L2 cache (unified TLB)
- nový úsporný stav C7 (jako C6, ale vyprázdní se i L3 cache)
- …
Podrobněji se o nich dozvíte ve zmíněném článku na Cnews/Notebooky, nebo si můžete projít galerii obsahující prezentace Intel (především z jarního IDF).
Nové procesory, nová patice – to alespoň v desktopu znamená také nové čipové sady. Čipsety osmé série rozšiřují nativní podporu portů USB 3.0 i SATA 6 Gb/s. Pokud na nějakých deskách najdete ještě starý dobrý slot PCI, tak pro něj ale musí výrobce základní desky osadit přídavný čip (řadič).
Rozdíly mezi špičkovým Z87, hlavně po využití grafiky určeným H87, „pracovním“ Q85 či levnějším B85 ilustrují následuchící schémata:
Jak už jsem zmínil, v toto sobotní dopoledne jsou uvedeny pouze čtyřjádrové procesory Haswell. Přehled všech v současnosti už jistých modelů pro desktop vidíte v tabulkách pod tímto odstavcem. Všimněte si, že kdybyste náhodou chtěli výkonnější grafiku než HD 4600 (třeba Iris Pro 5200 nebo GT3), nemáte s deskou bez napevno osazeného procesoru šanci:
Tím se pěkně plynule dostáváme k parametrům obou testovaných procesorů. U těch je velmi sympatické, že co do frekvence (i s Turbo Boost 2.0) zcela přesně odpovídají svým předchůdcům. Tedy Core i5-4670K kopíruje nastavení i5-3570K a dražší Core i7-4770K se podobá i7-3770K. Srovnání efektivity Haswellu a Ivy Bridge na stejné frekvenci tak bude v testu zahrnuto automaticky.
Přestože jsem Haswelly testoval v základní desce Gigabyte Z87X-UD3H, nemohl jsem nevyfotit zřejmě poslední „extrémní“ retailovou desku Intelu – DZ87KLT-75K (KinsleyT). Alespoň vidíte kompletní dodaný testovací kit a jste-li příznivci desek Intel, můžete zamáčknout slzu.
Parametry vybraných procesorů ve srovnání
Výrobce | Intel | Intel | Intel | Intel | Intel |
Řada | Core i5 | Core i5 | Core i7 | Core i7 | Core i7 |
Model | 3570K | 4670K | 3770K | 4770K | 3820 |
Frekvence | 3,4 GHz | 3,4 GHz | 3,5 GHz | 3,5 GHz | 3,6 GHz |
Turbo | 3,8 GHz | 3,8 GHz | 3,9 GHz | 3,9 GHz | 3,9 GHz |
Počet jader | 4 | 4 | 4 | 4 | 4 |
Počet vláken | 4 | 4 | 8 | 8 | 8 |
Kódové označení | Ivy Bridge | Haswell | Ivy Bridge | Haswell | Sandy Bridge-E |
L1 cache | 4× 64 kB | 4× 64 kB | 4× 64 kB | 4× 64 kB | 4× 64 kB |
L2 cache | 4× 256 kB | 4× 256 kB | 4× 256 kB | 4× 256 kB | 4× 256 kB |
L3 cache | 6144 kB | 6144 kB | 8192 kB | 8192 kB | 10 240 kB |
Paměti | DDR3-1600 | DDR3-1600 | DDR3-1600 | DDR3-1600 | DDR3-1600 |
Paměťových kanálů | 2 | 2 | 2 | 2 | 4 |
Max. kapacita RAM | 32 GB | 32 GB | 32 GB | 32 GB | 64 GB |
Sběrnice | 5 GT/s (DMI) | 5 GT/s (DMI) | 5 GT/s (DMI) | 5 GT/s (DMI) | 5 GT/s (DMI) |
BCLK | 100 MHz | 100 MHz | 100 MHz | 100 MHz | 100 MHz |
Násobič | 34 | 34 | 35 | 35 | 36 |
Výrobní proces | 22 nm high-k | 22 nm high-k | 22 nm high-k | 22 nm high-k | 32 nm high-k |
Velikost jádra | 160 mm² | 177 mm² | 160 mm² | 177 mm² | 294 mm² |
Počet tranzistorů | 1,4 mld. | 1,4 mld. | 1,4 mld. | 1,4 mld. | 1,27 mld. |
TDP | 77 W | 84 W | 77 W | 84 W | 95 W |
Instrukční sady | SSE4.1/4.2, AES-NI, AVX | SSE4.1/4.2, AES-NI, AVX, AVX2, FMA3 | SSE4.1/4.2, AES-NI, AVX | SSE4.1/4.2, AES-NI, AVX, AVX2, FMA3 | SSE4.1/4.2, AES-NI, AVX |
Virtualizace | VT-x | VT-x | VT-x | VT-x | VT-x, VT-d |
Integrovaná grafika | HD 4000 | HD 4600 | HD 4000 | HD 4600 | – |
PCI Express | 3.0, 16× | 3.0, 16× | 3.0, 16× | 3.0, 16× | 2.0, 40× |
Patice | 1155 | 1150 | 1155 | 1150 | 2011 |
Výrobce | Intel | Intel | Intel | Intel | Intel |
Řada | Celeron | Pentium | Pentium | Core i3 | Core i5 |
Model | G1610 | G860 | G2020 | 3220 | 3350P |
Frekvence | 2,6 GHz | 3,0 GHz | 2,9 GHz | 3,3 GHz | 3,1 GHz |
Turbo | – | – | – | – | 3,3 GHz |
Počet jader | 2 | 2 | 2 | 2 | 4 |
Počet vláken | 2 | 2 | 2 | 4 | 4 |
Kódové označení | Ivy Bridge | Sandy Bridge | Ivy Bridge | Ivy Bridge | Ivy Bridge |
L1 cache | 2× 64 kB | 2× 64 kB | 2× 64 kB | 2× 64 kB | 4× 64 kB |
L2 cache | 2× 256 kB | 2× 256 kB | 2× 256 kB | 2× 256 kB | 4× 256 kB |
L3 cache | 2048 kB | 3072 kB | 3072 kB | 3072 kB | 6144 kB |
Paměti | DDR3-1333 | DDR3-1333 | DDR3-1333 | DDR3-1600 | DDR3-1600 |
Paměťových kanálů | 2 | 2 | 2 | 2 | 2 |
Max. kapacita RAM | 32 GB | 32 GB | 32 GB | 32 GB | 32 GB |
Sběrnice | 5 GT/s (DMI) | 5 GT/s (DMI) | 5 GT/s (DMI) | 5 GT/s (DMI) | 5 GT/s (DMI) |
BCLK | 100 MHz | 100 MHz | 100 MHz | 100 MHz | 100 MHz |
Násobič | 26 | 30 | 29 | 34 | 31 |
Výrobní proces | 22 nm high-k | 32 nm high-k | 22 nm high-k | 22 nm high-k | 22 nm high-k |
Velikost jádra | 160 mm² | 131 mm² | 160 mm² | 160 mm² | 160 mm² |
Počet tranzistorů | 1,4 mld. | 504 milionů | 1,4 mld. | 1,4 mld. | 1,4 mld. |
TDP | 55 W | 65 W | 55 W | 55 W | 69 W |
Instrukční sady | SSE4.1/4.2 | SSE4.1/4.2 | SSE4.1/4.2 | SSE4.1/4.2, AVX | SSE4.1/4.2, AES-NI, AVX |
Virtualizace | VT-x | VT-x | VT-x | VT-x | VT-x, VT-d |
Integrovaná grafika | HD | HD | HD | HD 2500 | – |
PCI Express | 2.0, 16× | 2.0, 16× | 2.0, 16× | 2.0, 16× | 3.0, 16× |
Patice | 1155 | 1155 | 1155 | 1155 | 1155 |
Výrobce | AMD | AMD | AMD | AMD | AMD |
Řada | Athlon X4 | A10 | FX | FX | FX |
Model | 750K | 5800K | 4300 | 6300 | 8350 |
Frekvence | 3,4 GHz | 3,8 GHz | 3,8 GHz | 3,5 GHz | 4,0 GHz |
Turbo | 4,0 GHz | 4,2 GHz | 3,9–4,0 GHz | 3,8–4,1 GHz | 4,1– 4,2 GHz |
Počet jader | 4 | 4 | 4 | 6 | 8 |
Počet vláken | 4 | 4 | 4 | 6 | 8 |
Kódové označení | Trinity | Trinity | Vishera | Vishera | Vishera |
L1 cache | 4× 16 + 2× 64 kB | 4× 16 + 2× 64 kB | 4× 16 + 2× 64 kB | 6× 16 + 3× 64 kB | 8× 16 + 4× 64 kB |
L2 cache | 2× 2048 kB | 2× 2048 kB | 2× 2048 kB | 3× 2048 kB | 4× 2048 kB |
L3 cache | – | – | 8192 kB | 8192 kB | 8192 kB |
Paměti | DDR3-1866 | DDR3-1866 | DDR3-1866 | DDR3-1866 | DDR3-1866 |
Paměťových kanálů | 2 | 2 | 2 | 2 | 2 |
Max. kapacita RAM | 64 GB | 64 GB | 32 GB | 32 GB | 32 GB |
Sběrnice | 5 GT/s (UMI) | 5 GT/s (UMI) | 5,2 GT/s (HT) | 5,2 GT/s (HT) | 5,2 GT/s (HT) |
BCLK | 100 MHz | 100 MHz | 200 MHz | 200 MHz | 200 MHz |
Násobič | 34 | 38 | 19 | 17,5 | 20 |
Výrobní proces | 32 nm | 32 nm | 32 nm | 32 nm | 32 nm |
Velikost jádra | 224 mm² | 224 mm² | 319 mm² | 319 mm² | 319 mm² |
Počet tranzistorů | 1,18 mld. | 1,18 mld. | ~1,6 mld. | ~1,6 mld. | ~1,6 mld. |
TDP | 100 W | 100 W | 95 W | 95 W | 125 W |
Instrukční sady | SSE4.1/4.2, AES-NI, AVX | SSE4.1/4.2, AES-NI, AVX, FMA3 | SSE4.1/4.2, AES-NI, AVX, FMA3 | SSE4.1/4.2, AES-NI, AVX, FMA3 | SSE4.1/4.2, AES-NI, AVX, FMA3 |
Virtualizace | AMD-V | AMD-V | AMD-V | AMD-V | AMD-V |
Integrovaná grafika | – | HD 7660D | – | – | – |
PCI Express | 2.0, 20× | 2.0, 20× | – | – | – |
Patice | FM2 | FM2 | AM3+ | AM3+ | AM3+ |
Výrobce | AMD | AMD | AMD | AMD | |
Řada | A8 | Phenom II X4 | FX | FX | |
Model | A3870K | 965 BE | 6100 | 8120 | |
Frekvence | 3,0 GHz | 3,4 GHz | 3,3 GHz | 3,1 GHz | |
Turbo | – | – | 3,6–3,9 GHz | 3,4–4,0 GHz | |
Počet jader | 4 | 4 | 6 | 8 | |
Počet vláken | 4 | 4 | 6 | 8 | |
Kódové označení | Llano | Deneb | Zambezi | Zambezi | |
L1 cache | 4× 128 kB | 4× 128 kB | 6× 16 + 3× 64 kB | 8× 16 + 4× 64 kB | |
L2 cache | 4× 1024 kB | 4× 512 kB | 3× 2048 kB | 4× 2048 kB | |
L3 cache | – | 6144 kB | 8192 kB | 8192 kB | |
Paměti | DDR3-1866 | DDR3-1333 | DDR3-1866 | DDR3-1866 | |
Paměťových kanálů | 2 | 2 | 2 | 2 | |
Max. kapacita RAM | 64 GB | 32 GB | 32 GB | 32 GB | |
Sběrnice | 5 GT/s (UMI) | 4 GT/s (HT) | 5,2 GT/s (HT) | 5,2 GT/s (HT) | |
BCLK | 100 MHz | 200 MHz | 200 MHz | 200 MHz | |
Násobič | 30 | 17 | 16,5 | 18 | |
Výrobní proces | 32 nm | 45 nm SOI | 32 nm | 32 nm | |
Velikost jádra | 224 mm² | 258 mm² | 319 mm² | 319 mm² | |
Počet tranzistorů | 1,18 mld. | 758 milionů | ~1,6 mld. | ~1,6 mld. | |
TDP | 100 W | 125 W | 95 W | 125 W | |
Instrukční sady | 3DNow!+, SSE4A | 3DNow!+/Pro, SSE4A | SSE4.1/4.2, AES-NI, AVX | SSE4.1/4.2, AES-NI, AVX | |
Virtualizace | AMD-V | AMD-V | AMD-V | AMD-V | |
Integrovaná grafika | HD 6550D | – | – | – | |
PCI Express | 2.0, 20× | – | – | – | |
Patice | FM1 | AM3 | AM3+ | AM3+ |
Testovací konfigurace a návod na interaktivní grafy
Testovací konfigurace
Testovací sestava pro jednotlivé procesory se liší jen v nutném minimu. Změny se kromě procesoru samotného týkají v případě různé platformy samozřejmě také základní desky, ty stejné paměti od Kingstonu jsou potom nastaveny dle schopností procesoru (na nejvyšší oficiálně podporovanou frekvenci).
Operační systémy:
- Microsoft Windows 7 Enterprise x64, SP1
- Ubuntu 12.04.1 LTS, 64-bit
Společné komponenty:
- grafická karta: Gigabyte GeForce GTX 680 OC, 2 GB (GV-N680OC-2GD)
- systémový disk: Intel X25-M, 160 GB
- zdroj: Enermax Modu87+, 800 W
- chladič procesoru: Noctua NH-C12P
- paměti: 2× 4 GB Kingston HyperX T1 DDR3-2400 (KHX24C11T1K2/8X)
Platforma LGA 1150:
- základní deska: Gigabyte Z87X-UD3H
- nastavení pamětí: 1600 MHz, 8-8-8-24-1T @ 1,5 V
Platforma AM3+:
- základní deska: Gigabyte GA-990FXA-UD7
- nastavení pamětí: 1866 MHz, 9-10-10-27-1T @ 1,65 V
Platforma LGA 1155:
- základní deska: Gigabyte Z77X-UD5H
- nastavení pamětí: 1600 MHz, 8-8-8-24-1T @ 1,5 V
Platforma FM2:
- základní deska: Gigabyte GA-F2A85X-UP4
- nastavení pamětí: 1866 MHz, 9-10-10-27-1T @ 1,65 V
Platforma FM1:
- základní deska: ASrock A75 Pro4
- nastavení pamětí: 1866 MHz, 9-10-10-27-1T @ 1,65 V
V ovladačích grafické karty jsem vypnul vertikální synchronizaci a kvůli opakovatelnosti měření také adaptivní správu napájení v 3D režimu.
Za zapůjčení grafické karty děkujeme společnosti Gigabyte |
Za zapůjčení pamětí DDR3 děkujeme společnosti Kingston |
Za zapůjčení zdroje děkujeme společnosti Enermax |
Za poskytnutí chladiče Noctua NH-C12P a teplovodivé pasty Noctua NT-H1 děkujeme společnosti RASCOM Computerdistribution |
Jak na interaktivní grafy 2.0
- Pokud se vám nelíbí písmo se stíny, velmi snadno je vypnete v Nastavení. Máte-li ještě problémy s rychlostí zobrazování, můžete v Nastavení povypínat také animace.
- V základním nastavení jsou pruhy seskupeny dle úhlopříčky monitory a dále seřazeny dle naměřené hodnoty (vzestupně, či sestupně pak podle toho, je-li zrovna vyšší = lepší či naopak). Toto můžete snadno změnit zvolením řazení dle naměřené hodnoty v testu, seskupením třeba podle matrice apod.
- Po najetí myší na některou z položek (třeba na HP ZR24w) se z této stane 100 % (základ) a ostatní položky se spočítají podle ní. Všechny absolutní hodnoty se změní na relativní. Zpět se změní, až kurzor myši opustí oblast s názvy položek (v tomto případě procesorů).
- Budete-li chtít nějakou položku (monitor) v grafech sledovat, můžete si její pruh libovolně obarvit. Stačí klepnout levým tlačítkem myši na barevném pruhu a vybrat si z palety. Máte-li povoleny cookies, mělo by vám nastavení vydržet i pro další grafy v dalších kapitolách.
- Cenu a další základní parametry (například rozlišení či úhlopříčku) můžete zobrazit kdykoliv v každém grafu: stačí u vybraného procesoru najet kurzorem myši nad pruh s hodnotou (měření) a chvíli počkat. Objeví se jako plovoucí nápověda (tooltip).
- Zámek základu (monitor, který se stane těmi 100 % a od něhož se odvíjí další relativní hodnoty) aktivujete pomocí současného stisku klávesy CTRL a levého tlačítka myši nad procesorem (či jeho pruhem v grafu), který chcete uzamknout.
- Před prvním použitím grafů si pro jistotu vyprázdněte cache prohlížeče (zřejmě bude stačit refresh) a v případě problém smažte i příslušné cookies.
- Interaktivní grafy 2.0 jsou kompatibilní s prohlížeči Firefox (testovány verze 4.x), Opera (testováno s 11.x), Internet Explorer 8 a 9 (verze 7 a starší už nejsou podporovány, verze 10 zatím také ne) a Chrome (zde mají tooltipy hranaté rohy namísto kulatých).
- V případě problémů se nejdříve ujistěte, že máte v prohlížeči povoleny skripty i cookies, dále splnění bodů 7 a 8, teprve potom nám chybu prosím co nejpřesněji reportujte. Jedná se o první ostré nasazení grafů, takže i přes delší testování autorem a redakcí při komplexnosti aplikace určitě ještě nějaké mouchy v nějaké kombinaci objevíte.
Video a hudba
Video
x264 benchmark HD v5.0 64-bit
x264 benchmark testuje výkon procesoru při převodu videa v rozlišení 1080p s použitím kodeku x264. Benchmark je ke stažení na TechARP.com, nově používáme výsledky z obou průchodů.
x264 FHD benchmark v1.0.1 64-bit
FHD benchmark také používá bezplatný x264, počítá už s 64bitovými systémy a má příjemnější rozhraní. Benchmark si můžete stáhnout třeba z Guru3D (181 MB), archiv stačí rozbalit a už můžete testovat. Na rozdíl od x264 HD benchmarku nepotřebujete ani instalovat Avisynth. O výsledky se můžete podělit už v připraveném vlákně v našem diskuzním fóru.
Windows Media Encoder 9
1GB full HD video pořízené Frapsem ve hře Empire: Total War je převáděno do WMV9 720p, 5,5 Mb/s.
VirtualDubMod + XviD 1.3.2
VirtualDubMod slouží pouze jako rozhraní pro převod 1GB full HD videa ze hry Empire: Total War do .AVI s kodekem XviD. Profile @ Level je nastaveno na XviD HD 1080, dále jeden průchod a kvalita na 4,00 (1,00 je nejlepší kvalita, 31 nejhorší). Je zapnuta autodetekce a volba použitelných instrukčních sad (podporovány jsou jak SSE až do SSE4, tak 3DNow! 2), z voleb post-processingu nic vybráno není.
XMedia Recode 3.1.2.5 H.264
Oblíbený freewarový převaděč všech možných formátů videí používám v jeho portable verzi. Opět znásilňuji 1GB Full HD video z Empire: Total War, tentokrát je cílem v programu předdefinovaný profil YouTube 1080p s H.264. V nastavení kvality pak volím místo jednoho průchodu průchody dva (2-pass, cílový průměrný bitrate 8000). Zvuková část je převáděna do AAC.
Shrnutí
Hudba
WAV do MP3: LameEnc 3.99
Dva rozměrné stereo WAV (jeden 201MB, 16-bit/44 kHz, druhý 327MB 24-bit/96 kHz (L. v. Beethoven, Sonate 32 z 2L) jsou převáděny do formátu MP3. Použita je poslední stabilní verze LameEnc, VBR a kvalita extreme. LameEnc využívá instrukční sady MMX, SSE a SSE2.
WAV do AAC (Advanced Audio Coding): iTunes přes qaac (CoreAudioTool 7.9.9.7)
Dva rozměrné stereo WAV (jeden 201MB, 16-bit/44 kHz, druhý 327MB 24-bit/96 kHz (L. v. Beethoven, Sonate 32 z 2L) jsou převáděny do formátu AAC.
WAV do ALAC (Apple Lossless Audio Codec) pomocí refalac64 0.51
Dva rozměrné stereo WAV (jeden 201MB, 16-bit/44 kHz, druhý 327MB 24-bit/96 kHz (L. v. Beethoven, Sonate 32 z 2L) jsou převáděny do formátu ALAC.
WAV do FLAC (Free Lossless Audio Codec) pomocí FLAC 1.2.1b
Dva rozměrné stereo WAV (jeden 201MB, 16-bit/44 kHz, druhý 327MB 24-bit/96 kHz (L. v. Beethoven, Sonate 32 z 2L) jsou převáděny do formátu FLAC.
Shrnutí
Bitmapová grafika, fotografie, rendering
Bitmapová grafika, fotografie
Autopano Giga 64-bit 2.6.4
Autopano mám nastaveno na využití maxima jader procesoru i pomoc GPU. Zdrojem je 57 fotografií (JPEG) o rozlišení 2848 × 4288 px, výstupem pak jeden soubor JPEG se slepeným panoramatem. Jako výstupní kvalita je zvolen HDR output (obsahuje anti-ghost).
Oproti minulým letům nechává ve výpočtech pomáhat GPU. Nevím ale, jestli se při finálním renderingu panoramatu nějak významně uplatní. V globálním nastavení Autopano dávám maximum vláken, které je procesor schopen paralelně zpracovávat.
Hugin 2011.4 64-bit
Také zdarma dostupný Hugin pracuje nad 57 fotografiemi panoramatu (fotky je třeba slepovat v ose X i Y) od uživatele Johnyn (děkuji!). Měřím čas od zarovnání obrázků až po kompletní náhled panoramatu v editoru.
Paint.NET 3
Pro testování výkonu ve volně šiřitelném bitmapovém editoru používáme rozhraní TPUbench a benchmark PdnBench.
RawTherapee 64-bit v3.0.1
Zdarma dostupnou alternativu k placeným editorům RAW (Adobe Lightroom, Apple Aperture) trápím celkem 100 soubory RAW ze tří fotoaparátů (TIFF, CR2, DNG). Ty převádím na JPEG v nejvyšší kvalitě s uchováním EXIFu
3.0.1 byla poslední stabilní verzí v době sestavování metodiky. Vyzkoušel jsem také vývojovou 4.0.9.50, ale na Core i5 se mi podařila konverze stovky souborů dokončit jen někdy, na platformě s AMD FX ani jednou. Vyzkoušel jsem také několik o trochu starších sestavení 4.0.8.x a 4.0.7.x, bohužel s podobným výsledkem. Výkonnostní optimalizace ve verzi 4.x jsou přitom slibné, stejná úloha, co ve verzi 3.0.1 trvala procesoru Core i5-3570K 5:19 (min:s), zabrala ve 4.0.9 už jen 4:29,4 (min:s).
Zoner Photo Studio 15 x64
V jednom sub-testu jsou prováděny dávkové operace nad 56 fotografiemi ve formátu JPEG, v dalším je převáděno 100 fotek ve formátu RAW (TIFF a CR2 z přístrojů Canon a Adobe DNG z DSLR Pentax) do JPEG.
Shrnutí
Rendering
Cinebench R11.5 64-bit
Poslední verze benchmarku výkonu v Cinema 4D. Výsledek při renderingu na jediném jádru uvádíme spíše jako teoretickou zajímavost.
Frybench 64-bit
Postup měření v programu Frybench je popsán v tomto článku. Vaše výsledky můžete ukázat a s dalšími konfiguracemi srovnávat zde: Frybench – výsledky.
POV-Ray v3.7 beta RC6 64-bit
Beta verze freeware raytraceru POV-Ray umožňuje využít vícejádrové procesory. Pro testy používáme jednu ze scén mezi příklady dodanými s programem: chess2.pov a rozlišení 1600 × 1200 px s AA 0.3 (800 × 600 px bez anti-aliasingu měřím už jen pro srovnání s minulými generacemi procesorů/testů).
Blender 2.63 64-bit
Pro testování v 3D modeláři Blender používám demo-projekt Helicopter (demonstrace Cycles, stažitelné v balíku dem pro 2.61 z blender.org).
Bez změny nastavení (mimo snížení rozlišení na 800 × 600 px, abych nečekal na výsledek věčnost) spustím rendering (F12) a měřím čas.
LuxMark 2.0 64-bit
LuxMark 2.0 vám v jednoduchém rozhraní otestovat výkon vašeho procesoru (CPU) nebo grafické karty (GPU) na několika scénách vykreslovaných právě pomocí LuxRenderu. U grafické karty budete samozřejmě potřebovat mít dostatečně moderní (včetně ovladačů) – podpora OpenCL (potažmo GPGPU) je minimálním požadavkem. LuxRender je možné využít ve spojení se spoustou modelářů Blenderem či 3Ds Max počínaje a Poserem nebo SketchUpem konče. Více informací ve starší aktualitě o LuxMarku. V systému je nainstalován balík Intel SDK for OpenCL 2012 64-bit a AMD APP SDK v2.7 x64. Do shrnujících grafů započítávám výsledky v komplexní scéně „Room“.
Shrnutí
Do shrnutí z předešlého nepočítám jen Cinebench Single core a LuxMark medium.
Komprese a šifrování
WinRAR 4.20 64-bit
Používám zabudovaný benchmark (ALT + B) se zapnutou volbou multithreading.
Pokud byste se na to náhodou chtěli zeptat, tak namátkou jsem u procesoru Core i5-3570K vyzkoušel v registru Windows vypnout i Core parking. Výsledkem bylo mírné zhoršení výsledku (což se možná vešlo do běžné chyby měření). U procesorů bez HyperThreadingu dokonce ani kvůli WinRARu nemusíte Core parking nijak řešit.
7-zip 9.20 x64
I v 7-zipu využívám integrovaného benchmarku, v grafu je celkový výsledek počítaný z výkonu při kompresi i dekompresi.
WinZIP 16.5 + AES
Extrakce 3,5GB zaheslovaného archivu ZIP (šifrování AES, zkomprimovaná celá složky hry World of Tanks). Zatím se bohužel zdá, že výsledky jsou dost podle toho, jak se zrovna SSD vyspí. Dost nesedí hlavně výsledek Core i3-3220 (byť je to nejlepší ze tří měření).
TrueCrypt 7.1a
Testy pochází z integrovaného benchmarku (Tools, Benchmark), velikost bufferu nastavena na 500 MB. Výsledek je průměrem šifrování a dešifrování.
V prvním grafu je spočtena průměrná rychlost ze všech dílčích testů TrueCryptu (tento jediný graf je taková počítán do dalších souhrnů):
Dílčí testy TrueCrypt 7.1a:
Shrnutí
Virtualizace (VirtualBox)
VirtualBox 4.1.20 + Ubuntu 12.04.01 x64
Ve VirtualBoxu přiděluji maximum dostupných fyzických jader a 2048 MB RAM.
Shrnutí
PCMark 7 a multi-tasking
Poslední verzi PCMarku jsem do metodiky zařadil především díky snadnějšímu srovnání s vašimi případně naměřenými výsledky a také proto, že nabízí ještě vcelku přesnou možnost změření výkonu při dvou paralelně prováděných úlohách (multi-tasking).
Následující dva testy jsou spouštěny současně:
Následující dva testy jsou spouštěny současně:
Následující dva testy jsou spouštěny současně:
Linux (Ubuntu 12.04.1 LTS 64-bit)
Ubuntu 12.04.1 LTS 64-bit
Po určitém rozvažování jsem se rozhodl testování v linuxové distribuci nakonec zařadit. Zvolil jsem asi tu „nejlidovější“ a musím říct, že návrat k mému kdysi primárnímu OS se mi docela líbil (přece jen kompletní start docela pěkně vypadajícího prostředí na testovacím HW za šest sekund má něco do sebe).
S vámi bych se chtěl pro začátek poradit, jestli byste uvítali výsledky z Linuxu zařazené mezi ostatní (například C-Ray v renderingu, RAMspeed v kapitole s rychlostí pamětí atd.), nebo takto vyseparovány do své kapitoly?
Phoronix Test Suite
Kompilace jádra
Vždy s parametrem -j počet_vláken (max. podporovaných procesorem).
7-zip 9.20 x64
Stejně jako ve Windows je uváděn jen celkový výsledek (komprese i dekomprese).
GtkPerf
Pro vyšší přesnost navyšuji výchozích 100 kol testů na 1000.
Shrnutí
Tento shrnující graf je sice velkou směskou, ale je zároveň mezivýsledkem účastnícím se na hlavním shrnujícím grafu, tak vám jej pro zajímavost předkládám také.
Teoretické testy, PI, prvočísla, Zlib, AES, Hash, VP8, fraktály
Deep Fritz 12 Chess benchmark
Benchmark simulující počítání šachových kombinací skutečného šachového programu Fritz má svoji zdarma dostupnou verzi. Já jsem ale použil benchmark přímo v programu Deep Fritz 12, který by měl být stejný až na jednu drobnost – umožňuje nastavit více než osm vláken (za tip děkuji Flank3rovi).
SuperPI mod XS 1.5
Výpočet Ludolfova čísla na milion desetinných míst.
wPrime 2.0
Vícevláknová obdoba jednoduchého benchmarku SuperPI (samozřejmě se nepočítá Ludolfovo číslo, ale prvočísla).
Y-cruncher 0.5.5
Údajně nejrychlejší program pro výpočet Ludolfova čísla je vícevláknový a autor se chlubí tím, že předčí nejen SuperPi na jednojádru, ale také PiFast na dvoujádru či QuickPi na čtyřjádru.
AIDA64 v2.60
Následující sada testů v AIDA64 (dříve Everest, předtím jen AIDA32) jsou do jisté míry low-level benchmarky. Většina zatíží hlavně ALU, ty od VP8 níže pak FPU. AES je v podstatě testem přítomnosti instrukční sady AES-NI (+ velkou roli hraje propustnost paměti – v single channelu je výsledek sotva 60%).
Shrnutí
Rychlost pamětí
AMD FX i Ax podporují frekvenci až 1866 MHz, čehož jsem využil. Ani tak bohužel pro AMD není dosaženo na propustnost a latence níže taktovaných pamětí ve společnosti Ivy Bridge. RAMspeed v OS Ubuntu x64 potvrzuje to samé. Tento linuxový paměťový test však na rozdíl od AIDA64 dokáže těžit i ze čtyřkanálového přístupu procesorů LGA 2011.
Haswell (Core i5-4670K):
Haswell (Core i7-4770K):
Trinity (Athlon X4 750K):
Ivy Bridge (Celeron G1610):
Ivy Bridge (Pentium G2020):
Ivy Bridge (Core i5-3350P):
Vishera (FX-6300):
Ivy Bridge (Core i7-3770K):
Sandy Bridge (Pentium G860):
Deneb:
Piledriver:
Trinity:
Bulldozer:
Sandy Bridge-E:
Shrnutí
Hry
Není-li řečeno jinak, jedná se o průměrné snímkové frekvence (avg. fps). Téměř vždy jde o nejvyšší možné nastavitelné detaily, jen anti-aliasing zůstává vypnut.
Vysoké rozlišení
Jestli mi někdo bude brečet v diskuzi, že nemám „ful hádé“, tak mu už raději dopředu sděluji, že rozdíl (v Mpx) mezi 1680 × 1050 px a 1920 × 1080 px je malý a ještě více v optice testu CPU. Stejně uvidíte, že i při nastavení max. detailů (jen bez anti-aliasingu, který je opravdu čistě záležitostí GPU) je vliv rozlišení i třeba proti 800 × 600 px vcelku malý – vybrané testy jsou v případě použití GeForce GTX 680 opravdu hodně závislé na procesoru.
Call of Duty 4: Modern Warfare
Stále nejspíše nejhranější díl CoD (možná společně s dvojkou) testuji pomocí timedema obsaženého v již dále nevyvíjeném automatizovaném nástroji TpuBench. Detaily jsou nastaveny na maximum, anti-aliasing vypnut.
Enemy Territory: Quake Wars
V OpenGL ET:QW používám osvědčené timedemo a v nastavení dávám předvolbu Quality: High. Ta nastaví skoro vše na maximální hodnoty, jen osvětlení je na hodnotě Normal a anti-aliasing vypnut. Vypnuty jsou i soft particles, anizotropní filtrování je na hodnotě 8×. Přes konzoli hru zbavuji omezení snímkové frekvence. Jiný poměr stran může způsobit, že v rozlišení 640 × 480 px bude výsledek nižší než v 1680 × 1050 px.
Left 4 Dead
Zástupce enginu Source je otestován pomocí vlastního timedema, kvůli kterému musím opatrně konzervovat verzi hry (Steam má neustálé tendendce všechno navzdory předvolbám aktualizovat). Nastavuji maximální detaily, trilineární filtraci textur a jen anti-aliasing zůstává vypnut. Důležité je zapnutí multicore renderingu a vypnutí vertikální synchronizace.
The Elder Scrolls V: Skyrim
Pro testování jsem vybral dvě uložené pozice v lokacích Whiterun (pohled na velkou část měst a ještě i za hradby) a Riverwood (stromy, voda, vesnice - v ZIPu je ještě třetí pozice Ragged Flagon (podzemí Riftenu), kterou jsem pro testy CPU nevyužil). Po nahrání uložené pozice počkám, až se uklidní ukazatel se snímky za sekundu (načítání z disku, obyčejně je to ale tak dvě až tři sekundy po zmizení nahrávací obrazovky) a poté měřím deset sekund (nastaveno ve FRAPSu). Nahraji další pozici a postup opakuji. V grafu je hodnota průměrných fps spočtena jako průměr dvou desetisekundových měření. Použitá verze hry je 1.7.7.0.6, nejsou přidány žádné balíčky textur ani jiná rozšíření.
Unreal Tournament 3
Letitý UT3, jehož engine je stále základem obrovského množství her, testuji pomocí průletu na VCTF-Suspense. Detaily jsou nastaveny na maximum (ve hře číslo 5, což obnáší i 16× AF), fyzika softwarová. Beru lepší výsledek ze dvou opakování.
World in Conflict
Oproti minulé metodice mohu díky dostatečně výkonné grafické kartě nastavit celkové grafické detaily na hodnotu Nejvyšší. To obnáší DX10 rendering a dokonce 4× MSAA. Vypnuta je pouze volba Voda odráží oblaka. Podobně jako ET:QW, i World in Conflict podporuje FOV a výsledky v nižším rozlišení s poměrem stran 4:3 mohou být vyšší než ty v 1680 × 1050 px s 16:10.
World of Tanks
V klientu verze 8.0 přehrávám replay v jedné z nejnáročnějších a současně na procesoru nejvíce závislých map: Ensk. S poměrně svižným stíhačem tanků SU-100 projedu velkou část mapy (problematické křoviny, většinu města). Často je používán sniper mód, především na začátku hry pak oddálení kamery a celkový pohled na spoustu objektů. Použit je Rendering Improved, Graphics Quality je nastaveno na Maximum, vše až na položku Enhanced Shadows je na maximálních možných hodnotách.
X-Plane 10
V náročném leteckém simulátoru používám benchmark skript spouštějící hru s parametrem --fps_test=1 (2, 3), ze tří různých testů pak dělám průměr. Ten je prezentován v grafu. V Setting, Rendering Options jsou prakticky všechna nastavení detailů v horních třech oddílech na maximu, počty objektů a cest na hodnotě "tons". Detaily letiště ponechány výchozí, detaily odrazů na vodě jsou vypnuty stejně jako "HDR anti-aliasing". Mraky nastaveny na rovněž výchozích 100 %. Přesná verze hry je 10.05r1.
Nízké rozlišení
Druhá sada herních testů je prováděna v co nejnižším rozlišení, detaily jsou však typicky nastaveny na maximální hodnoty (kdyby náhodou CPU byl účasten na některých z nich).
Nastavení Skyrimu:
Výsledkem v grafu je průměr z výkonu ve dvou lokacích (Whiterun a Riverwood):
Shrnutí
Všechny herní testy se podílí na výsledném průměrujícím grafu z her, beru jak výsledky z nízkého, tak vysokého rozlišení. Minimální fps měřená ve World in Conflict a World of Tanks do toho samozřejmě nemotám.
Přetaktování a provozní vlastnosti (příkon, zahřívání)
Přetaktování
Na přetaktování mi jako obvykle nezbyl pořádně čas. Než jsem se k němu dostal, tak jsem kit s i7-4770K musel poslat dál, potrápil jsem tak jen rychle před odletem na Computex i5-4670K v Z87X-UD3H. Vyzkoušení možnosti změn BCLK podobně jako na LGA 2011 si nechám pro test některého z procesorů bez směrem nahoru otevřeného násobiče, v tomto případě stačilo jen v UEFI zvedat násobič frekvence procesoru, vypnout Turbo Boost a případně ladit napětí. S tím základním nebylo problém stabilně provozovat 4,2 GHz:
To ale není nijak zajímavé navýšení frekvence, takže jsem odzkoušel 4,5 GHz. K jeho zcela stabilnímu běhu bylo třeba zvýšit napětí na 1,4 V. Už to napovídalo, že se zřejmě nejedná o bůhvíjak dobrý kus pro přetaktování:
Problém byl však jinde. Ačkoli heatpipe chladiče Noctua zůstávaly vlažné, procesor v zátěži snadno přesahoval 90 stupňů Celsia a throttloval:
Abych tento kus tedy nějak slušně přetaktoval, musel bych sejmout jeho rozvaděč tepla. A opakuje se situace z Ivy Bridge – můžete si sice koupit bůhvíjak výkonný chladič, limitovat vás ale stejně bude teplovodivost kontaktu mezi procesor a jeho IHS.
Příkon (spotřeba) změřený izolovaně na EPS12V
V recenzích procesorů na EHW se můžete setkat kromě tradičního měření příkonu celé sestavy zásuvkovým wattmetrem také s izolovaným měřením příkonu na EPS12V.
Bočník měřící procházející proud sestrojil Honza Černý, napětí bylo kontrolováno běžným multimetrem VoltCraft VC-140.
Příkon (spotřeba) celého PC s daným CPU
Spotřeba (ano příkon) celé sestavy s daným procesorem je měřena pomocí zásuvkového měřiče spotřeby elektrické energie FK Technics. A přestože chladič, zdroj a grafická karta zůstávají neměnné a paměti jsou nastaveny také velmi srovnatelně, pořád se jedná o spotřebu celé platformy dané do jisté míry také základní deskou, osazenou čipovou sadou a dalšími čipy právě na desce (i když i v tomto případě jsou podmínky díky použití desek Gigabyte ze stejné třídy v rámci možnosti co nejvíce srovnány).
Teplotní testy berte spíš jako velmi hrubou informaci. Použitým chladičem je sice Noctua NH-C12P a pastou pak Noctua NT-H1, přesto může dojít k ne vždy stejnému rozetření pasty a teplota okolí se může také mezi testy lišit až o tři stupně Celsia.
Důležité je také přímo nesrovnávat teploty CPU napříč různými platformami. Intel i AMD mají teplotní senzor pojat evidentně dost jinak.
Shrnující grafy
Kdo rád přeskakuje kapitoly, nebo prostě nemá tolik času, snad ocení právě tuto kapitolu. Všechny souhrnné (průměrující, zjednodušující, zkreslující – jak chcete) grafy z předchozích stránek pěkně pohromadě.
Shrnutí a verdikt
Po všech těch shrnujících grafech jako obvykle ještě jeden pořádně zavádějící (nejsou započítány výsledky z kapitol Teoretické testy, Rychlost pamětí a PCMark 7):
Podělíme-li celkový (průměrný) výkon procesorů jejich cenou, vypadne nám takovýto „index výhodnosti“:
Ten by ale platil jen v případě, že byste kupovali pouze samotné CPU. Jak by tomu bylo, kdybyste naopak kupovali celé PC? Zkusil jsem pro takový případ udělat modelovou sestavu se zhruba podobně vybavenými deskami pro zúčastněné platformy.
Monitor, klávesnici, myš a další možné periferie už jsem do modelu nezahrnoval. Samozřejmě je trochu problém v tom, že pokud bude někdo uvažovat o AMD A10, potom nejspíše nebude chtít nic víc než integrovanou grafiku HD 7660D. Do kalkulace by tak bylo lepší započítat levnější Athlon pro FM2, to ale bohužel není dost dobře možné – nejvýkonnější oznámený Athlon nemá tak silné CPU jako A10 (ale jako A8). Levnější Core i3 a Pentia zase budou lidé častěji párovat s deskami s čipsetem B75, nikoli Z77. Jistě chápete, že to nelze udělat pro všechny kombinace a odrážíme se ve zbytku komponent od jakési „střední třídy“.
Už při prvních pokusech o zavedení poměru výkon/cena celé sestavy jsme se v diskuzi dopracovali k tomu, že možná takovým optimem pro počítání výkon/cena by bylo vzít v potaz nikoli cenu celé sestavy, ale toho, co typicky upgradujete a spolu to nejvíce souvisí: tedy kromě procesoru ještě také základní desku a operační paměť.
Verdikt
Procesory Intel Haswell pro desktop (Core i7-4770K a i5-4670K)
špičkový výkon napříč všemi testy | |
vysoký výkon na jádro, ještě zlepšený proti IB/SB | |
dobrý poměr výkon/příkon | |
zlepšení výkonu ve vícevláknových aplikacích, lepší propustnost pamětí | |
silnější a schopnější integrovaná grafika | |
snadné přetaktování s otevřeným násobičem | |
dobrý poměr cena/výkon u i5-4670K | |
pro hry takřka optimální procesor (platí hlavně pro Core i5-4670K) | |
nová patice, nutnost kupovat novou desku | |
zlepšení nejsou pro majitele SB/IB dostatečně znatelná | |
výše přetaktování limitována rozvaděčem tepla (zahřívání procesoru) | |
nejsilnější integrované grafiky nejsou u žádného procesoru do patice 1150 | |
cena Core i7 není tradičně moc výhodná | |
Cena | 8090 (i7-4770K) a 5590 (i5-4670K) Kč (vč. DPH) |