Tikání trochu pomaleji a Tri-Gate
Nepřehlédněte: Test grafiky v Ivy Bridge: Intel HD Graphics 4000
Od Intelu jsme byli v posledních letech zvyklí vídat uvedení nové generace procesorů vždy hned po začátku nového roku. Tentokrát se čekání protáhlo „až“ do května, přesto jste díky všelijakým uniklým zprávám nebo třeba povoleném preview na jednom věhlasném hardwarovém webu věděli v případě zájmu takřka vše podstatné dopřadu. Já vám mohu nabídnou stručné shrnutí novinek v češtině a především tradiční srovnání se spoustou třeba i starších procesorů.
Uvedení Ivy Bridge pro Intel znamená krok jménem Tick. Ten se vyznačuje vylepšením už existující architektury a přechodem na novější výrobní proces. Nové funkce se takřka nepřidávájí, v tomto případě jde tedy o jakýsi vypilovaný Sandy Bridge.
Přechod z 32- na 22nm výrobní proces znamenal nejen možnost dostat na menší plochu ještě více tranzistorů, ale také snížení TDP. Dramatické zmenšení plochy čipu však nemá na svědomí jen jemnější výrobní technologie, ale také nové uspořádání tranzistorů. Více se o něm můžete dočíst v přejatých materiálech od Intelu (Technologický průlom Intelu: první 22nm 3D tranzistory s označením Tri-Gate), zde si jej připomeneme jen stručně.
Vlevo vidíte běžné uspořádání, vpravo pak Tri-Gate. Zdroj: Intel
Nové uspořádání tranzistoru trochu připomíná přechod ke kolmém zápisu u pevných disků, obrázek nad tímto odstavcem to dobře ilustruje. Snadno si už asi dokážete představit řetězení ploutví a z toho vyplývající mnohem vyšší efektivitu takovéhoto designu. Intel tvrdí, že vývoj Tri-Gate u něj začal někdy v roce 2002, já si vzpomínám na trochu nověji datovaný (2007) objev jisté japonské společnosti (Tranzistory pro 20 až 50 GHz). O tranzistorech Tri-Gate vám hezky popovídá přímo pán z Intelu, video je českým zastoupením této společnosti otitulkováno naší mateřštinou.
" width="560" height="315" frameborder="0">
Ivy Bridge přináší i několik dalších vylepšení konceptu Sandy Bridge, o některých se ale dočtete v předposlední kapitole s výzkumem rozdílu výkonu těchto generací při stejné frekvenci, o dalších pak v samostatném článku věnovaném GPU části Ivy Bridge.
Intel bude opět škatulkovat procesory do několika tříd, Celerony na bázi Ivy Bridge zatím oznámeny nejsou.
- Core i7 bude mít 8MB L3 cache (znaménko > v tabulce tedy tak docela neplatí) a bude vždy mít grafiku HD 4000.
- Core i5 na rozdíl od i7 nepodporuje HyperThreading (v tomto případě tedy nezpracuje osm, ale čtyři vlákna současně) a vystačí si s 6 MB L3 cache. Zda v procesoru budete mít HD 4000 nebo 2500, to už bude záležet na modelu.
- Core i3 a Pentia jsou ještě trochu obestřeny záhadou, výčet všech konkrétních modelů myslím nikde zveřejněn ještě nebyl.
Sedm běžných modelů pro desktop se liší nejen rozdělením mezi i7 a i5, ale také přízviskem K. To stále značí procesory vhodné k přetaktování, tedy se směrem nahoru otevřeným násobičem. Modely „bez K“ potom zase stejně jako u Sandy Bridge pro změnu podporují virtualizační a korporátní technologie. Intel jednoduše stále předpokládá, že uživatel, který bude na PC provozovat nějakou takovou „serióznější“ činnost, nebude současně prahnout po vyšším overclocku umožněném otevřeným násobičem.
Hned při uvedení můžete vybírat také z procesorů se sníženým TDP. Modely s písmenem T mají na čtyřjádrové procesory tuto hodnotu opravdu obdivuhodně nízko, konkrétně na 45 W. Core s označením S za čtyřčíslím potom na stále sympatických 65 W. Dejte pozor na i5-3470T – ačkoli nese hrdé označení Core i5, je to „jen“ dvoujádro s HyperThreadingem. Kompenzací za nižší výkon v mnohavláknových aplikacích pro vás bude spotřeba pod 35 W.
Zajímáte-li se také o parametry některých Ivy Bridge určených pro notebooky, nalistujte znovu aktualitu Sám Intel potvrdil parametry procesorů Ivy Bridge.
Parametry a tabulkové srovnání s dalšími procesory
Výrobce | Intel | Intel | Intel | Intel | Intel | Intel |
Řada | Core i7 | Core i7 | Core i7 | Core i7 | Core i7 | Core i7 |
Model | 3960X | 3820 | 3770K | 2600K | 980X | 870 |
Frekvence | 3,3 GHz | 3,6 GHz | 3,5 GHz | 3,4 GHz | 3,33 GHz | 2,93 GHz |
Turbo | 3,9 GHz | 3,9 GHz | 3,9 GHz | 3,8 GHz | 3,6 GHz | 3,6 GHz |
Počet jader | 6 (12) | 4 (8) | 4 (8) | 4 (8) | 6 (12) | 4 (8) |
Kódové označení | Sandy Bridge-E | Sandy Bridge-E | Ivy Bridge | Sandy Bridge | Gulftown | Lynnfield |
L1 cache | 6× 64 kB | 4× 64 kB | 4× 64 kB | 4× 64 kB | 6× 64 kB | 4× 64 kB |
L2 cache | 6× 256 kB | 4× 256 kB | 4× 256 kB | 4× 256 kB | 6× 256 kB | 4× 256 kB |
L3 cache | 15 360 kB | 10 240 kB | 8192 kB | 8192 kB | 12 288 kB | 8192 kB |
FSB/HT/QPI | 20 Gb/s | 20 Gb/s | 20 Gb/s | 20 Gb/s | 6,4 GT/s | 2,5 GT/s |
Násobič | 33 | 36 | 35 | 34 | 25 | 22 |
Výrobní proces | 32 nm high-k | 32 nm high-k | 22 nm high-k | 32 nm high-k | 32 nm high-k | 45 nm high-k |
Velikost jádra | 435 mm² | 294 mm² | 160 mm² | 216 mm² | 248 mm² | 296 mm² |
Počet tranzistorů | 2,27 mld. | 1,27 mld. | 1,4 mld. | 995 milionů | 1180 milionů | 774 milionů |
TDP | 130 W | 95 W | 77 W | 95 W | 130 W | 95 W |
Patice | 2011 | 2011 | 1155 | 1155 | 1366 | 1156 |
Výrobce | AMD | AMD | AMD | AMD | AMD | AMD |
Řada | FX | FX | Phenom II X6 | Phenom II X4 | A8 | Athlon II X4 |
Model | 8150 | 6100 | 1090T | 980 BE | 3850 | 645 |
Frekvence | 3,6 GHz | 3,3 GHz | 3,2 GHz | 3,7 GHz | 2,9 GHz | 3,1 GHz |
Turbo | 3,9–4,3 GHz | 3,6–3,9 GHz | 3,6 GHz | – | – | – |
Počet jader | 8 | 6 | 6 | 4 | 4 | 4 |
Kódové označení | Zambezi | Zambezi | Thuban | Deneb | Llano | Propus |
L1 cache | 8× 16 + 4× 64 kB | 6× 16 + 3× 64 kB | 6× 128 kB | 4× 128 kB | 4× 128 kB | 4× 128 kB |
L2 cache | 4× 2048 kB | 3× 2048 kB | 6× 512 kB | 4× 512 kB | 4× 1024 kB | 4× 512 kB |
L3 cache | 8192 kB | 8192 kB | 6144 kB | 6144 kB | – | – |
FSB/HT/QPI | 5,2 GT/s (HT) | 5,2 GT/s (HT) | 4 GHz (DDR, HT) | 4 GHz (DDR, HT) | 2 GB/s (UMI) | 4 GHz (DDR, HT) |
Násobič | 18 | 16,5 | 16 | 18,5 | 29 | 15,5 |
Výrobní proces | 32 nm | 32 nm | 45 nm SOI | 45 nm SOI | 32 nm | 45 nm SOI |
Velikost jádra | 315 mm² | 315 mm² | 346 mm² | 258 mm² | 224 mm² | 169 mm² |
Počet tranzistorů | ~1,2 miliardy | ~1,2 miliardy | 904 milionů | 758 milionů | ~1 mld. | ~300 milionů |
TDP | 125 W | 95 W | 125 W | 125 W | 100 W | 95 W |
Patice | AM3+ | AM3+ | AM3 | AM3 | FM1 | AM3 |
Fotky CPU, podvozek pro testy Ivy Bridge: Gigabyte Z77X-UD5H
Core i7-3770K má klasické provedení jako všechny další CPU LGA 1155, rozdíly jsou vždy jen v nápisech na rozvaděči tepla a potom až na spodní straně.
V rychlosti si můžete prohlédnout mnou při testech nakonec nepoužitou základní desku od Intelu: DZ77K-70K. Jen potvrzuje, že Intel už je se svými deskami i co do výbavy a příslušenství plně konkurenceschopný. U DZ77K mě trochu mrzel pouze jediný grafický výstup – počítá se už asi s diskrétní grafikou.
Gigabyte Z77X-UD5H také není v podstatě potřeba ani popisovat. To za mě udělal už Gigabyte na krabici. Informační hutnost její zadní strany by záviděly leckteré noviny.
U Z77 se Gigabyte vytasil přechodem na UEFI, rovnou přišel ale se svou „3D“ verzí. V praxi máte k dispozici model základní desky, na němž si myší volíte k dané části desky patřící submenu. Celkem snadno se dostanete do běžně uspořádaného „BIOSu“. Ačkoli to nevypadá, „3D“ BIOS se v případě UD5H hýbe docela svižně. Vytkl bych asi jen ukrytí funkcí CPU jako HyperThreading, Turbo Boost apod. až pod M.I.T. a následně Frequency settings. Na konci galerie obrázků z BIOSu vidíte možnosti přetaktování a také bezproblémové zachycení nestabilního nastavení a start v bezpečném (pro následnou změnu na nějakou tu stabilní konfiguraci).
Přímo ve Windows pak starý dobrý EasyTune nahradila ryze overclockerská utilita. Ta je 3D asi svou nepříliš šikovnou krychlovou nabídkou:
Další nabídky: 1, 2, 3, 4, 5, 6, 7
Testovací konfigurace, CPU-Z, návod pro interaktivní grafy
Pokud jste zvyklí spíše na CPU-Z než na HWiNFO, nezklamu vás. Následující screenshot ukazuje informace o procesoru v klasickém uspořádání CPU-Z, procesor byl právě v klidu (idle, desktop Windows 7). Následující screenshot patří detailům u uspořádání vyrovnávací paměti.
Testovací sestavy a konfigurace
22nm CPU Ivy Bridge v LGA 1155 budeme testovat na této konfiguraci:
- základní
deska: Gigabyte Z77X-UD5H, BIOS F5g - paměti: 2× 2 GB Kingston DDR3-2000, 1,65 V (nastaveny na 1333-8-8-8-24-1T)
Pro procesory patice FM1 máme tuto sestavu:
- základní
deska: MSI A75MA-G55, BIOS 1.3 - paměti: 2× 2 GB Exceleram DDR3-1333, 1,5 V (nastaveny na 1333-8-8-8-24-1T)
Platforma LGA 2011 byla testována s těmito komponentami:
- základní
deska: Asus P9X79 Deluxe, BIOS 0650 - paměti: 2× 2 GB Kingston DDR3-2000, 1,65 V (nastaveny na 1333-8-8-8-24-1T)
AMD FX (AM3+) byly otestovány s konfigurací:
- základní
deska: Gigabyte 990FXA-UD7, BIOS F6e - paměti: 2× 2 GB Exceleram DDR3-1333, 1,5 V (nastaveny na 1333-8-8-8-24-1T)
Platforma LGA 1155 byla zastoupena konfigurací:
- základní
deska: Intel DP67BG (Burrage) - paměti: 2× 2 GB Exceleram DDR3-1333, 1,5 V (nastaveny na 1333-8-8-8-24-1T)
Pro
procesory AMD AM3 (Phenom II a Athlon II) byla
použita:
- základní
deska: Gigabyte GA-MA790FXT-UD5P (AMD 790FX), BIOS F7 (F8c pro 1090T, F8k pro 1055T, F8m pro Athlon II X4 645) - paměti:
4× 1 GB Kingston DDR3-1866, 1,5 V (nastaveny na
1600-8-8-8-24-2T, 1,75 V)
Jádro
testovací sestavy pro platformu Intel LGA 1156 bylo
tvořeno těmito komponentami:
- základní
deska: Gigabyte GA-P55A-UD4 (Intel P55), BIOS F11 - paměti: 4× 1 GB
Kingston DDR3-1866, 1,5 V (nastaveny na 1333-8-8-8-24-1T,
pro Pentium G6950 potom na 1066-7-7-7-20-1T, 1,64 V)
Kvůli LGA 775 jsem oprášil tyto komponenty:
- základní deska: Asus Rampage Extreme (Intel X48), BIOS 0501
- paměti: 4× 1 GB Kingston DDR3-1800, 1,9 V (nastaveny na 1333-8-8-8-24-1T, u Pentia DC na 1066-7-7-7-1T)
U
Bloomfieldu a Gulftownu pak
takto:
- základní deska: Gigabyte GA-EX58-UD5 (Intel X58), BIOS
F11 - paměti: 3× 1 GB Kingston DDR3-1866, 1,5 V (nastaveny na
1333-8-8-8-24-1T, 1,5 V u Extreme a 1066-7-7-7-20-1T u Core i7-920)
A
všechny platformy měly společné tyto komponenty:
- grafická
karta: Nvidia GeForce GTX 280, 1024 MB - pevný disk: Intel X25-M Gen2, 160 GB (SSD)
- zdroj: Corsair CMPSU-650TX
- mechanika: Toshiba SD-H802A, HD DVD, DVD-ROM
- chladič procesoru: Noctua NH-C12P, 1350 rpm
- operační systém: Windows 7 Enterprise, 64-bit
- ovladače
GPU: Nvidia ForceWare 196.21, GeForce PhysX: off
Za poskytnutí testovacích pamětí DDR3 děkujeme společnosti Kingston
Za poskytnutí chladiče Noctua NH-C12P a teplovodivé pasty Noctua
NT-H1 děkujeme
společnosti RASCOM Computerdistribution
Jak na interaktivní grafy 2.0
- Pokud se vám nelíbí písmo se stíny, velmi snadno je vypnete v
Nastavení. Máte-li ještě problémy s rychlostí zobrazování, můžete v
Nastavení povypínat také animace. - V základním nastavení jsou pruhy
seskupeny dle úhlopříčky monitory a dále seřazeny dle naměřené hodnoty
(vzestupně, či sestupně
pak podle toho, je-li zrovna vyšší = lepší či naopak). Toto můžete
snadno změnit zvolením řazení dle naměřené hodnoty v testu, seskupením
třeba podle matrice apod.
-
Po najetí myší na některou z
položek (třeba na HP ZR24w) se z této stane 100 %
(základ) a ostatní položky se spočítají podle ní. Všechny absolutní
hodnoty se změní na relativní. Zpět se změní, až kurzor myši opustí
oblast s názvy položek (v tomto případě procesorů).
-
Budete-li chtít nějakou
položku (monitor) v grafech sledovat, můžete si její pruh libovolně
obarvit. Stačí klepnout levým tlačítkem myši na barevném pruhu a vybrat
si z palety. Máte-li povoleny cookies, mělo by vám nastavení vydržet i
pro další grafy v dalších kapitolách.
-
Cenu a další základní parametry (například rozlišení či úhlopříčku) můžete zobrazit kdykoliv v
každém grafu: stačí u vybraného procesoru najet kurzorem myši nad pruh s
hodnotou (měření) a chvíli počkat. Objeví se jako plovoucí nápověda (tooltip).
-
Zámek základu (monitor, který
se stane těmi 100 % a od něhož se odvíjí další relativní hodnoty)
aktivujete pomocí současného stisku klávesy CTRL a levého tlačítka myši
nad procesorem (či jeho pruhem v grafu), který chcete uzamknout.
-
Před prvním použitím grafů si
pro jistotu vyprázdněte cache prohlížeče (zřejmě bude stačit refresh) a v případě problém smažte i příslušné cookies. -
Interaktivní grafy 2.0 jsou
kompatibilní s prohlížeči Firefox (testovány verze 4.x), Opera
(testováno s 11.x), Internet Explorer 8 a 9 (verze 7 a starší už nejsou
podporovány) a Chrome (zde mají tooltipy hranaté rohy namísto kulatých). - V případě problémů se nejdříve
ujistěte, že máte v prohlížeči povoleny skripty i cookies, dále splnění
bodů 7 a 8, teprve potom nám chybu prosím co nejpřesněji reportujte.
Jedná se o první ostré nasazení grafů, takže i přes delší testování
autorem a redakcí při komplexnosti aplikace určitě ještě nějaké mouchy v
nějaké kombinaci objevíte.
Video
x264 benchmark
x264 benchmark testuje výkon procesoru při převodu videa v
rozlišení 720p s použitím kodeku H.264. Benchmark je ke stažení na TechARP.com,
používáme výsledky z náročnějšího druhého průchodu.
VirtualDubMod + DivX 6.8.4
VirtualDubMod slouží pouze jako rozhraní pro převod 400MB
souboru MPEG-2 (.VOB) ve standardním DVD rozlišení do .AVI s kodekem
DivX. Experimentální podporu SSE4 necháváme vypnutou, volba Enhanced
multi-threading je naopak zapnuta. Předvolen je profil Home Theater a
kvalita Balanced.
VirtualDubMod + XviD 1.2.2
I XviD už v novějších verzích podporuje práci na více jádrech procesoru.
Windows Media Encoder 9
1TB full HD video pořízené Frapsem ve hře Empire: Total War je převáděno do WMV9 720p, 5,5 Mb/s.
PCMark Vantage
Následující
dva testy jsou spouštěny současně (multi-tasking):
Následující dva testy jsou spouštěny současně
(multi-tasking):
Průměrný výkon v testech převodu videa
Hudba
WAV do MP3: LameEnc 3.97 a 4.0a
Jeden rozměrný soubor ve formátu WAV je pomocí kodeku LameEnc
převáděn do souboru formátu MP3.
Nero AAC
Ten samý WAV je pomocí prostřednictvím volně stažitelného kodeku Nero AAC převáděn do MP4 (AAC).
FLAC
Převod několika větších WAV do bezztrátového FLAC je rychlou záležitostí, zvláště na vícejádrových procesorech. Jako frontend pro převod používám Foobar 1.0.
PCMark Vantage
Následující
tři testy jsou spouštěny současně (multi-tasking):
Průměrný výkon
Do průměrného výkonu v testech práce se zvukem (či hudbou, chcete-li) je počítán pouze jeden test LameEnc.
Bitmapová grafika, fotografie
Paint.NET
Pro testování výkonu ve volně šiřitelném bitmapovém editoru
používáme rozhraní TPUbench a benchmark PdnBench.
Zoner Photo Studio 13 x64
ZPS 13 je oproti verzi 12 důslednější ve využití více procesových vláken. V jednom sub-testu jsou prováděny
dávkové operace nad 56 fotografiemi ve formátu JPEG, v dalším je
převáděno 96 fotek ve formátu RAW (CR2 z přístroje Canon a Adobe DNG z
DSLR Pentax) do JPEG.
RawTherapee 3.0a
Volně stažitelný program pro práci s fotografiemi ve formátu RAW toho umí překvapivě hodně, s výkonnostními optimalizacemi je už na tom hůře.
Autopano Giga 2.0.6
Fantastický program pro automatizovanou tvorbu panoramat umí využít až 16 procesových vláken a je schopen zapojit i GPU (k testování procesorů této možnosti nevyužívám). Pro tříjádrový Athlon je rychlejší zvolit čtyři procesy (namísto dvou), pro šestijádrový Phenom pak osm. Naopak šestijádrový Core i7-980X s HyperThreadingem běží rychleji s osmi vlákny a nikoli s šestnácti (mezistupně, jako třeba tři, šest anebo dvanáct vláken program nenabízí).
AutoStitch
AutoStitch sice není tak dokonalý jako Autopano Giga, ale také nestojí 260 EUR (demo bylo svého času zcela zadarmo) a popravdě je na automatickou tvorbu panoramat schopnější než třeba Zoner Photo Studio.
Everest PhotoWorxx
Jakýsi dílčí test výkonu procesoru při práci s fotografiemi nabízí i Everest. Už dříve jsem si všiml, že nemá rád tříjádrové procesory (u starší verze test snad ani nedoběhl), dnes na tří- a šesti- jádrech běží pomaleji než na dvou- a čtyřjádrech (poměrně).
Průměrný výkon
Kapitolu zakončí opět sumarizační graf, do něhož není počítán jen PhotoWorxx z Everestu.
Rendering
Frybench
Postup měření v programu Frybench je popsán v tomto článku. Vaše výsledky můžete ukázat a s dalšími konfiguracemi srovnávat zde: Frybench – výsledky.
Cinebench R11.5
Poslední verze benchmarku výkonu v Cinema 4D.
Cinebench R10
Cinebench je benchmark snažící se nastínit výkon procesorů při
renderingu v CAx programu Cinema 4D společnosti Maxon. Používáme x CPU
benchmark (vícevláknový).
POV-Ray v3.7
Beta verze freeware raytraceru POV-Ray umožňuje využít vícejádrové
procesory. Pro testy používáme jednu ze scén mezi příklady dodanými s
programem: chess2.pov a rozlišení 800 × 600 px bez anti-aliasingu.
Blender 2.48
Pro testování v 3D modeláři Blender používáme standardní nastavení
a model flyingsquirrel.blend.
Průměrný výkon
Shrnující graf je spočten z obou testů Cinebench, Blenderu, POV-Ray i Frybench.
Aplikační výkon v testech PCMark Vantage, multi-tasking
PCMark Vantage
PCMark Vantage prověří celý počítač a je to tzv. polosyntetický
benchmark. Obsahuje fragmenty skutečných aplikací, renderuje například
webové stránky v prohlížeči s více záložkami, pracuje hromadně s fotkami
a občas některé činnosti dělá současně. Zejména u nejsilnějších procesorů současnosti už nejsou jeho výsledky zcela spolehlivé a kolikrát nepomůže ani trojité opakování (a buď průměrování, či braní nejlepšího výsledku). Celkové skóre PCMarku Vantage je hodně ovlivněno tím, jak se „pevný disk“ zrovna vyspí, mnoho jeho dílčích (a hlavně multi-taskingových) testů však považuji stále za dobré.
Následující dva testy jsou spouštěny současně (multi-tasking):
Následující dva testy jsou spouštěny současně (multi-tasking):
Následující tři testy jsou spouštěny současně (multi-tasking):
Následující tři testy jsou spouštěny současně (multi-tasking):
Následující tři testy jsou spouštěny současně (multi-tasking):
Komprese souborů a šifrování
WinRAR
7-zip
WinZIP 14.5 + AES
Extrakce 200MB zaheslovaného archivu ZIP (šifrování AES).
Zlib (Everest)
Jeden dílčí test komprese souborů nabízí i Everest:
SiSoft Sandra – AES a SHA
PCMark Vantage
TrueCrypt 7
Testy pochází z integrovaného benchmarku (Tools, Benchmark), nastaveno 100 MB.
Při zprůměrování osmi dílčích testů TrueCrypt dostaneme tento shrnující graf:
Průměrný výkon
Do celkového výkonu v této části je TrueCrypt započítán jen jednou (jeho celkový průměr, viz graf nad tímto odstavcem).
Prvočísla, PI, šachové úlohy, fraktály, MIPS, FLOPS, MMX/SSE, .NET
Fritz Chess
Benchmark simulující počítání šachových kombinací skutečného
šachového programu Fritz.
Everest 5.3, CPU Queen
Především diagnostický nástroj Everest obsahuje i několik
syntetických benchmarků, čistě procesorový CPU Queen či výpočty
fraktálů.
SiSoftware Sandra
Sandra obsahuje několik modernizovaných verzí základních benchmarků procesorů (Dhrystone, Whetstone apod.) i .NET verze těchto prověrek ALU i FPU.
wPrime 2.0
Vícevláknová obdoba jednoduchého benchmarku SuperPI (samozřejmě se
nepočítá Ludolfovo číslo, ale prvočísla).
SuperPI mod XS 1.5
Výpočet Ludolfova čísla na milion desetinných míst.
MaxxPI2
Opět počítání pí, ale modernějším vícevláknovým kódem.
Průměrný výkon
Webové prohlížeče, HTML, Java, JavaScript, Flash
Následující tři testy jsou spouštěny současně
(multi-tasking):
Průměrný výkon
Propustnost a latence pamětí, cache, mezijádrová komunikace
U všech platforem (AMD AM3, Intel LGA 1366 i LGA 1156) jsem se pokusil o nějaké typické bezproblémové nastavení pamětí DDR3, přesněji to bylo takto (LGA 1156 a AM3 4 GB v dual, LGA 1366 3 GB v triple channel):
- 4× DDR3-1600, 8-8-8-24-2T: Phenom II X6 1090T (Thuban, 3,2 GHz) a 1055T (2,8 GHz), Phenom
II X4 980 BE (Deneb, 3,7 GHz) a 965 BE (Deneb, 3,4 GHz), Athlon II X3 435 (Rana, 2,9 GHz), Athlon
II X2 250 (Regor, 3,0 GHz) - 2× DDR3-1333, 8-8-8-24-1T:
- 3× DDR3-1333, 8-8-8-24-1T: Core i7-980X (Gulftown, 3,33 GHz), Core i7-975 XE (Bloomfield, 3,33 GHz)
- 3× DDR3-1066, 7-7-7-20-1T: Core i7-920 (Bloomfield, 2,66 GHz)
- 2× DDR3-1333, 8-8-8-24-1T: Core i5-750 (Lynnfield, 2,66 GHz), Core i5-661 (Clarkdale, 3,33 GHz), Core 2 Quad QX9650 (Yorkfield, 3 GHz) a Core 2 Duo E8500 (Wolfdale-6M, 3,16 GHz), Core i7-2600K (Sandy Bridge, 3,4 GHz), Core i5-2500K (Sandy Bridge, 3,3 GHz), Core i5-2300 (Sandy Bridge, 2,8 GHz), Core i3-2100 (Sandy Bridge, 3,1 GHz), Pentium G620 (Sandy Bridge, 2,6 GHz), Celeron G530 (Sandy Bridge,
2,4 GHz), Athlon II X4 645 (Propus, 3,1 GHz), A8-3850 (Llano, 2,9 GHz), A6-3650
(Llano, 2,6 GHz), A6-3500 (Llano, 2,1 GHz), A4-3400 (Llano, 2,7 GHz), FX-8150 (Zambezi, 3,6 GHz),
FX-6100 (Zambezi, 3,3 GHz), FX-4100 (Zambezi, 3,6 GHz), Core i7-3690X a Core i7-3820 - 4× DDR3-1066, 7-7-7-20-1T: Pentium Dual-Core E6500 (Wolfdale-2M, 2,93 GHz)
Poznámka: Propustnost v nástupci Everestu, programu AIDA64 je u Llana podstatně vyšší. Viz tento test A6-3650. Jak dokáže Llano škálovat s vyšší frekvencí DDR3 jsem potom vyzkoušel a zveřejnil například v článcích Vliv frekvence RAM na CPU výkon Llana + oprava grafů a Ladíme výkon AMD Llano na MSI A75MA-G55 (herní výkon). Také Ivy Bridge má v novější verzi testu jiné výsledky:
Herní výkon a 3DMark (CPU PhysX)
Call of Duty 4
1680 × 1050 px, maximální detaily, bez anti-aliasingu, režim
timedemo.
Crysis
800 × 600 px, DirectX 10, CPUbenchmark.bat, celkové detaily: low, physics: very high,
bez anti-aliasingu
Enemy Territory: Quake Wars
Far Cry 2
Left 4 Dead
Trackmania Nations Forever
Unreal Tournament 3
1280 × 720 px, VCTF-Suspense, maximální detaily, bez
anti-aliasingu
World in Conflict
1280 × 720 px, střední detaily, DirectX 10, fyzika zapnuta, bez
anti-aliasingu
X3: Terran Conflict
3DMark Vantage
Základní nastavení (performance), pouze CPU score.
3DMark06
Implicitní nastavení, opět pouze CPU score.
Průměrný výkon
Zatím do průměrného herního výkonu počítám i výsledky z 3DMarku, jelikož ve Vantage jde o test výpočtu PhysX na CPU (GeForce PhysX je v ovladačích vypnuta) a v 06 potom zase o zajímavý softwarový rendering. Většina současných her ale s více než čtyřmi jádry takto dobře neškáluje a třeba PhysX pro dvanáct vláken CPU je výsadou CPU testů v 3DMark Vantage.
Pro zajímavost můžete srovnat náš průměr s jakýmsi shrnutím herního výkonu z PCMark Vantage:
Mnou zjištěný herní výkon (z Call of Duty 4, Far Cry 2, Crysis, TMNF apod., nikoli z 3DMarku či PCMarku) jsem podělil cenou a můžete se tak podívat na graf obsahující poměr herního výkonu k ceně:
Příkon („spotřeba“, včetně izolovaného měření na EPS12V) a teploty
Příkon (spotřeba) změřený izolovaně na EPS12V
Poprvé se v recenzi na EHW můžete setkat kromě tradičního měření
příkonu celé sestavy zásuvkovým wattmetrem také izolovaným měřením
příkonu na EPS12V.
Bočník měřící procházející proud sestrojil Honza Černý, napětí bylo kontrolováno běžným multimetrem VoltCraft VC-140. Musím vás upozornit ještě na jednu důležitou skutečnost ovlivňující měření. A tím je míra toho, co procesor integruje. Zatímco případná zabudovaná grafika je zpravidla vypnutá, ne tak už třeba řadič PCI Express pro grafické karty.
Příkon (spotřeba) celého PC s daným CPU
Spotřeba (ano příkon) celé sestavy s daným procesorem je měřena pomocí
zásuvkového měřiče spotřeby elektrické energie FK Technics. A přestože chladič, zdroj a grafická karta zůstávají neměnné a paměti jsou nastaveny také velmi srovnatelně, pořád se jedná o spotřebu celé platformy dané do jisté míry také základní deskou, osazenou čipovou sadou a dalšími čipy právě na desce (i když i v tomto případě jsou podmínky díky použití desek Gigabyte ze stejné třídy v rámci možnosti co nejvíce srovnány).
Teplotní testy berte spíš jako velmi hrubou informaci. Použitým
chladičem je sice Noctua NH-C12P a pastou pak Noctua NT-H1, přesto může dojít k ne vždy stejnému rozetření pasty a teplota okolí se může také mezi testy lišit až o tři stupně Celsia. Pro patici AM3 má také starší revize C12P trochu jiné uchycení než kolem patic pro procesory Intel. U mnoha procesorů ukazuje čidlo v klidu teploty nižší než jsou teploty v místnosti. U Intel Core i7-3960X bylo zatím měřeno s chlazením Intel RTS2011LC.
Ivy Bridge vs. Sandy Bridge – srovnání výkonu při stejné frekvenci
Nárůst výkonu stejně taktovaného Ivy Bridge (třeba i7-3770K) a Sandy Bridge (i7-2700K) byl už námětem aktuality Honzy Olšana – Jak vzroste výkon na takt v procesorech Ivy Bridge. Z tohoto malého článku si vypůjčím seznam změn, které by měly vést k o něco lepšímu výkonu Ivy Bridge při stejném nastavení:
- Jednou z optimalizací je vylepšený HyperThreading, tedy technologie
zpracování dvou vláken na jednom fyzickém jádře za účelem zužitkování
jinak neplodných výpočetních prostředků. V předchozích procesorech byly
při zapnutém HT určité zdroje napevno rozděleny mezi obě vlákna – určitý
buffer se například rozdělil na dvě stejné poloviny. Pokud jedno vlákno
neumělo svůj příděl využít, nemohla být nadbytečná kapacita přidělena
druhému vláknu, byť by ji i dokázalo uplatnit.
Pro výkon je tedy lepší, když jsou prostředky dynamicky rozdělovány podle
potřeby. Což je právě vylepšení, které v Ivy Bridge na určitých místech
Intel zavedl. Zdroje jako konkrétní příklad uvádějí DSB Queue, což je
fronta, ze které jsou dekódované microOPs ukládány do L0 cache.
Jen pro pořádek připomeňme, že tento bonus si užijí pouze procesory Core i3
a i7 (případně Xeony a některé i5), neboť ostatní modelové řady neumožňují HT zapnout. - Ivy Bridge dokáže (podobně jako konkurence u architektury Bulldozer)
využít přejmenování registrů pro eliminaci instrukcí MOV (kopírování
hodnot mezi registry). Tyto instrukce díky tomu vůbec nezatěžují výpočetní
jednotky, jsou totiž eliminovány již ve fázi dekódování. - Značně vylepšena byla dělička, a to jak celočíselná, tak pro práci s
pohyblivou řádovou čárkou. Průměrná propustnost jednotky je u Ivy Bridge
dvakrát větší. Ačkoliv v ručně optimalizovaném kódu by dělení pro svou
pomalost nemělo být příliš častou operací, mnohé programy mohou toto
zrychlení přesto poznat. - Intel v prezentaci z IDF 2011 rovněž zmiňuje výkonnostní zlepšení
paměťového řadiče a L3 cache, k těmto bodům ale (zatím) nejsou k dispozici
podrobnosti. - Na serveru Anandtech se však objevila informace, že došlo k vylepšení
prefetchingu. Zatímco dříve se načítání zastavovalo na hranicích
paměťových stránek, nyní je toto omezení odstraněno.
Intel ve svých prezentacích sám jakési srovnání nabízí. Dá se ale čekat, že vybere testy svědčící nové generaci:
Do podobného srovnání jsem se pustil i já. Jelikož jsem neměl i7-2700K, použil jsem i7-2600K a u i7-3770K pak snížil násobič o jeden celý stupeň. Pro jistotu jsem vypnul i Turbo Boost, i když právě jeho vyšší agresivita mohla být jedním z důvodů zlepšení IPC u IB.
Všimněte si také, že deska nastavila trošku vyšší BCLK (základní frekvenci) u novějšího procesoru (i7-3770K). I to samozřejmě ve hře na desetiny procent hraje roli.
Test/CPU | Core i7-3770K (Ivy Bridge, 3,5 GHz) |
Core i7-3770K (Ivy Bridge, 3,4 GHz, Turbo Off) |
Core i7-2600K (Sandy Bridge, 3,4 GHz, Turbo Off) |
Zlepšení u Ivy Bridge |
Cinebench R11.5 (64-bit) [body] |
7,49 | 7,02 | 6,74 | 4,2% |
Cinebench R10 (64-bit) [body] | 26 146 | 1 | 1 | 5,8% |
POV-Ray v3.7 (64-bit) [s] (menší je lepší) |
16,9 | 18,4 | 19,4 | 5,4% |
Blender 2.48 (64-bit) [s] (menší je lepší) | 32,4 | 35,2 | 36,3 | 3,0% |
Rendering – průměrné zlepšení | 4,6% | |||
Windows Media Encoder 9 [s] (menší je lepší) |
60 | 66 | 66 | 0,0% |
x264 benchmark HD 3.15 [fps] (vyšší je lepší) |
41,2 | 38,0 | 35,2 | 7,9% |
Video – průměrné zlepšení | 4,0% | |||
TrueCrypt 7 – AES [MB/s] | 2700 | 2600 | 2500 | 4,0% |
TrueCrypt 7 – Twofish [MB/s] | 669 | 615 | 561 | 9,6% |
TrueCrypt 7 – AES-Twofish [MB/s] |
569 | 523 | 481 | 8,7% |
TrueCrypt 7 – Serpent [MB/s] | 370 | 340 | 299 | 13,7% |
TrueCrypt 7 – Serpent-AES [MB/s] |
354 | 326 | 290 | 12,4% |
TrueCrypt 7 – Twofish-Serpent [MB/s] |
246 | 226 | 202 | 11,9% |
TrueCrypt 7 – Serpent-Twofish-AES [MB/s] |
232 | 213 | 191 | 11,5% |
TrueCrypt 7 – průměrné zlepšení |
10,3% | |||
LameEnc 4.0a WAV do MP3 – index (vyšší je lepší) | 45,9 | 40,5 | 38,8 | 4,4% |
Paint.NET 3.5.4 [s] (menší je lepší) |
11,0 | 12,1 | 12,7 | 4,4% |
7-zip 4.65 64-bit [MIPS] | 22832 | 21298 | 19764 | 7,8% |
wPrime 2.02, 32M [s] (menší je lepší) |
7,253 | 7,833 | 8,145 | 3,8% |
Super PI 1M [s] (menší je lepší) |
9,282 | 10,592 | 10,935 | 3,1% |
Fritz Chess [knodes/s] | 14 145 | 13 078 | 12 868 | 1,6% |
Everest 5.3 (Memory Read) [kB/s] |
20 913 | 19 951 | 16 370 | 21,9% |
Everest 5.3 (Memory Write) [kB/s] |
24 630 | 24 460 | 24 294 | 0,7% |
Everest 5.3 (Memory Copy) [kB/s] |
23 237 | 22 425 | 16 998 | 31,9% |
Everest 5.3 (Memory Latency) [ns] (menší je lepší) |
23,8 | 24,2 | 33,9 | 28,6% |
Everest 5.3 (CPU Queen) [kB/s] | 47 287 | 18 061 | 17 972 | 0,5% |
Everest 5.3 (PhotoWorxx) [kB/s] |
51 408 | 50 014 | 47 520 | 5,2% |
Everest 5.3 (Zlib) [kB/s] | 156 127 | 143 299 | 138 740 | 3,3% |
Everest 5.3 (Julia) [kB/s] | 19 695 | 3 725 | 3 648 | 2,1% |
Everest 5.3 (Mandel) [kB/s] | 10 435 | 3 410 | 3 360 | 1,5% |
Everest 5.3 (SinJulia) [kB/s] | 5 029 | 4 611 | 4 489 | 2,7% |
Synt., pam. testy a multimédia – průměrné zlepšení |
7,7% | |||
Call of Duty 4, 480p [fps] | 256,0 | 252,2 | 247,5 | 1,9% |
Call of Duty 4, 16×10 [fps] | 141,0 | 141,8 | 140,6 | 0,9% |
Crysis, CPU, 8×6 [fps] | 135,2 | 132,0 | 120,3 | 9,7% |
Unreal Tournament 3, 720p [fps] |
258,6 | 257,4 | 252,6 | 1,9% |
World in Conflict, 720p [fps] | 156 | 153 | 147 | 4,1% |
Hry – průměrné zlepšení | 3,7% | |||
Spotřeba PC v idle [W] | 82 | 82 | 80 | -2,5% |
Spotřeba PC v Prime95 25.9 [W] | 158 | 142 | 162 | 12,3% |
Teplota RealTemp/CoreTemp v idle [˚C] |
31 | 30 | 34 | 11,8% |
Teplota RealTemp/CoreTemp v Prime95 25.9 [˚C] |
66 | 54 | 56 | 3,6% |
Zdá se, že pokud Intel na něčem opravdu zapracoval, byl to už tak (zdánlivě) vynikající paměťový řadič. U co nejpodobněji nastavených procesorů jsem pak vyzkoušel i izolované měření příkonu (spotřeby):
Zde už Ivy Bridge jasně ukazuje přínos nové výrobní technologie. I při trochu vyšším výkonu si řekne v zátěži o pořádný kus méně než Sandy Bridge. Opět se tedy jedná o zlepšení už tak dobrého.
Shrnutí výkonu, přetaktování a verdikt
Shrnutí výkonu
V grafu celkového výkonu nejsou započítány syntetické testy
(Everest apod.) a jednotlivá skóre z PCMark Vantage. Pokud tento výkon podělíme aktuální cenou procesorů vč. DPH, dostaneme
následující index výhodnosti jednotlivých CPU. Platí, že vyšší číslo
znamená výhodnější procesor. Ceny jsem zjišťoval v e-shopu Alfa.cz. V případě, že zde procesor nebyl zalistován, použil jsem nejnižší cenu z vyhledávače Heureka.cz a to z e-shopu, kde byl CPU skladem a pokud měl obchod status Ověřeno zákazníky. U již neprodávaných procesorů jsem nechal poslední prodejní cenu.
V diskuzi pod jedním z testů procesorů padla správná připomínka, že graf poměru výkon/cena platí pouze pokud jen vyměňujete ve stávající sestavě procesor. Kupujete-li celou sestavu, potom tvoří cena procesoru menší díl celkové sumy a procesory s vyšším výkonem a řekněme alespoň středně vysokou cenou na tom budou oproti těm nejlevnějším v počítaném poměru výkon/cena lépe. Bohužel nebylo nijak lehké udělat modely typických sestav pro vytvoření dalšího grafu toto beroucí v potaz. Někdy měníte v sestavě třeba jen desku s procesorem, jindy celou sestavu, do toho je otázkou, zda k i7-3960X bude někdo brát něco jiného než špičkové komponenty, to samé naopak neudělá u Celeronu G530, dále je tu otázka zabudované vs. diskrétní grafické karty atd.
Přetaktování
Přetaktování se věnuji většinou okrajově a ani tentokrát jsem neudělal výjimku. Úplně jsem ho ale samozřejmě nevynechal, vždyť Intel na tomto poli slibuje zlepšení:
Shora dolů: nově můžete zvedat násobič až na hodnotu 63×, máte k dispozici plnou podporu změny frekvence v reálném čase, u pamětí DDR v BIOSu najdete i děličku umožňující nastavit při základní frekvenci takt pamětí až 2667 MHz a pro LGA 1155 je tu nově podpora profilů XMP 1.3. Přetaktování základní frekvenci by opět mělo být omezeno maximálně 7 %. Nepočítejte tedy s tím, že si počkáte na 1,6GHz Celeron a ten přetaktujete na 4 GHz. Bez otevřeného násobiče si v podstatě zase neškrtnete.
Nad odstavcem je obrázek ze zátěže nepřetaktovaného procesoru. Jestli CPUID HWmonitor (inzerována podpora IB) a třeba HWiNFO64 Sensors nelžou, potom bylo v zátěži pod vcelku slušným chladičem dosaženo teplot jádra kolem 66 stupňů Celsia. Přitom heatpipe chladiče zůstávaly vlažné. To samé i po kontrole nanesení pasty. Při přetaktování jsem dosahoval nehezkých teplot kolem 90 stupňů Celsia a začal jsem mít pocit, že na zvěsti o špatném předávání tepla malého jádra rozvaděči (heatspreader) opravdu něco bude. Není bez zajímavosti, že HWmonitorem reportovaný příkon CPU je docela blízký mému izolovanému měření.
Do přetaktování jsem se navzdory teplotám pustil, vždyť je to jen zvedání násobiče. Na 4,5 GHz jsem se ještě dostal bez zvyšování napětí, na 4,8 GHz už jsem musel přidat. Byl jsem opatrný, nemám ještě dost praxe s 22nm procesory a navíc jsem nevěděl, co je pravdy na těch teplotách. Frekvenci 4,8 GHz se mi podařilo jakžtakž ustabilnit, musel jsem ale změnit nastavení Load-Line Calibration na hodnotu Extreme.
Test/CPU | Core i7-3960X (Sandy Bridge-E, 3,30 GHz) |
Core i7-3770K (Ivy Bridge, 3,5 GHz) |
Core i7-3770K (Ivy Bridge, 4,8 GHz) |
Zlepšení po přetaktování |
TrueCrypt 7 – AES [MB/s] | 4100 | 2700 | 4200 | 0,56 |
TrueCrypt 7 – Twofish [MB/s] | 866 | 669 | 861 | 0,29 |
TrueCrypt 7 – AES-Twofish [MB/s] |
749 | 569 | 732 | 0,29 |
TrueCrypt 7 – Serpent [MB/s] | 432 | 370 | 502 | 0,36 |
TrueCrypt 7 – Serpent-AES [MB/s] |
459 | 354 | 456 | 0,29 |
TrueCrypt 7 – Twofish-Serpent [MB/s] |
317 | 246 | 317 | 0,29 |
TrueCrypt 7 – Serpent-Twofish-AES [MB/s] |
300 | 232 | 298 | 0,28 |
LameEnc 3.97 WAV do MP3 Play/CPU Ratio (vyšší je lepší) |
44,0 | 46,1 | 56,6 | 0,23 |
LameEnc 4.0a WAV do MP3 Play/CPU Ratio (vyšší je lepší) |
43,5 | 45,9 | 56,6 | 0,23 |
Paint.NET 3.5.4 [s] (menší je lepší) |
8,5 | 11,0 | 8,7 | 0,21 |
WinRAR 3.92 64-bit [kB/s] | 4109 | 3465 | 3841 | 0,11 |
wPrime 2.02, 32M [s] (menší je lepší) |
5,537 | 7,253 | 5,600 | 0,23 |
Super PI 1M [s] (menší je lepší) |
9,656 | 9,282 | 7,582 | 0,18 |
Everest 5.3 (Memory Read) [kB/s] |
15 071 | 20 913 | 21 752 | 0,04 |
Everest 5.3 (Memory Write) [kB/s] |
17 927 | 24 630 | 24 301 | -0,01 |
Everest 5.3 (Memory Copy) [kB/s] |
16 046 | 23 237 | 24 254 | 0,04 |
Everest 5.3 (Memory Latency) [ns] (menší je lepší) |
26,8 | 23,8 | 23,6 | 0,01 |
Everest 5.3 (PhotoWorxx) [kB/s] |
53 453 | 51 408 | 55 104 | 0,07 |
Everest 5.3 (Zlib) [kB/s] | 213 655 | 156 127 | 200 482 | 0,28 |
Everest 5.3 (SinJulia) [kB/s] | 7 223 | 5 029 | 6 456 | 0,28 |
Call of Duty 4, 480p [fps] | 248,4 | 256,0 | 263,1 | 0,03 |
Call of Duty 4, 16×10 [fps] | 140,3 | 141,0 | 145,0 | 0,03 |
Unreal Tournament 3, 720p [fps] |
257,5 | 258,6 | 262,9 | 0,02 |
World in Conflict, 720p [fps] | 154 | 156 | 171 | 0,10 |
Spotřeba PC v idle [W] | 105 | 82 | 85 | -0,04 |
Spotřeba PC v Prime95 25.9 [W] | 262 | 158 | 247 | -0,56 |
Teplota RealTemp/CoreTemp v idle [˚C] |
33 | 31 | 33 | -0,06 |
Teplota RealTemp/CoreTemp v Prime95 25.9 [˚C] |
60 | 66 | 93 | -0,41 |
Přetaktování daného kusu Core i7-3770K tedy dvěma slovy nic moc. Důležitější asi bude statistika z vícero recenzí a především první výsledky uživatelů s prodejními kusy. A kdybyste se ptali: podezřelý výsledek v TrueCrypt 7 (AES) jsem přeměřoval celkem třikrát, opravdu nevím, jak mohlo přetaktování najednou vybudit CPU k takovému výkonu.
Verdikt
Při globálnějším přemítání o Ivy Bridge jsem si ještě silnějši uvědomil ten kontrast světa CPU (desktopových) a GPU (diskrétních, herních). Zatímco u grafických karet se výkon s další a další generací pořád ještě docela citelně zvedá, u procesorů jsme v podstatě od prvního Nehalemu (Bloomfield) tak nějak na tom samém. Jen to dnešní Ivy Bridge umí při dvakrát až třikrát nižším příkonu. Nemluvíme tedy o skocích v nárůstech výkonu, ale efektivity. U GPU se zase nedějí takové orgie v efektivitě, alespoň ne z pohledu uživatele. Ten vidí už jen dva osmipinové napájecí konektory jako standard výkonných grafik a TDP 300 W už není pro výrobce nic, za co by se veřejně styděli.
Ivy Bridge se dá hodnotit ze dvou pohledů. Buď jste v loňské mánii přešli na Sandy Bridge (řekněme Core i5 a výše) a ani zatím nejvýkonnější Ivy Bridge by vás neměl nijak rozrušit, nebo jste s technickým vybavením o několik generací procesorů pozadu, případně pořízení desktopového počítače teprve plánujete. Pak asi nebude moc důvodů přemýšlet o čemkoli jiném. Intel jednoduše zase trochu vylepšil již tak dobré procesory.
Core i7-3770K (Ivy Bridge, 3,5–3,9 GHz)
+ vynikající hodnoty příkonu (spotřeby) v zátěži, výkon/watt
+ pro většinu úloh na výkonnostním vrcholu desktopových CPU
+ cena zřejmě výhodnější než u Sandy Bridge
+ další odskok konkurenci
- podprůměrný výkon/cena (u tohoto nejvyššího modelu)
- nejspíše horší předávání tepla rozvaděči (heatspreader)
- slabší přetaktování
Za poskytnutí základní desky Z77-UD5 pro testy na platformě LGA 1155 děkujeme společnosti Gigabyte