Premiéra Nehalemu
Intel si od přechodu na novou architekturu nemálo slibuje a popravdě řečeno ve svých materiálech není nijak skromný. Tak například pozicování procesorů z řady Core i7 je nazváno „nejlepší procesory planety“ a procesor Core i7 Extreme Edition pak musí být jednoduše „nejvýkonnější procesor planety“. O tom, zda se polovodičový král nenaparuje neprávem, se můžete přesvědčit v dalších kapitolách článku, zatím se však podívejme na procesory trochu z jiných úhlů.
Kdo už někdy viděl nějakou tu fotografii procesoru, určitě si dobře uvědomuje, že tolik pinů či kontaktních plošek jen tak nějaký procesor nemá. Na Core i7 jich napočítáte 1366, pouzdro procesoru se tak nazývá LGA 1366 (Land Grid Array). Je oproti pouzdrům procesorů řad Pentium 4 až Core 2 (LGA 775) větší, a Core i7 vyžaduje (nejen) proto novou základní desku s novou paticí.
Vlevo Core 2 Duo (LGA 775), uprostřed Core i7 (LGA 1366), vpravo Athlon 64 (AM2, 940 pinů, stejné pouzdro má i Phenom).
Novinek není v Core i7 málo, shrňme si alespoň jako pozvánku k dalšímu rozboru architektury základní inovace a klíčové vlastnosti:
- 4 jádra nativně, nejedná se tedy o spojení dvou jader pomocí FSB
- HyperThreading umožňuje spustit až 8 vláken na 4 jádrech
- Intel Turbo Boost dokáže „přetaktovat“ vytížená jádra a nebo naopak vypnout nevytížená
- 8 MB sdílená L3 cache (Intel Smart Cache)
- integrovaný tříkanálový řadič pamětí DDR3 až do 1066 MHz
- Intel QuickPath Interconnect – výkonná sběrnice pro komunikaci s čipovou sadou
Nehalem není žádné místo v Izraeli, ale sympatická vesnice v Oregonu u v těch místech opravdu nádherného pobřeží Pacifiku. V Oregonu sídlí velká část firmy a na jeho mapě tak najdete zřejmě ještě víc kódových jmen procesorů než v severní Kalifornii
Parametrová tabulka shrnuje základní statistiky v tomto testu testovaných procesorů a přidává nejvýkonnější desktopový procesoru od AMD – Phenom X4 9950 Black Edition:
Výrobce
|
Intel
|
Intel
|
Intel
|
Intel
|
Intel
|
AMD
|
Řada
|
Core 2 Duo
|
Core 2 Extreme
|
Core i7
|
Core i7
|
Core i7
|
Phenom X4
|
Model
|
E8600
|
QX9770
|
920
|
940
|
965 XE
|
9950 BE
|
Frekvence
|
3,33 GHz
|
3,2 GHz
|
2,66 GHz
|
2,93 GHz
|
3,2 GHz
|
2,6 GHz
|
Počet jader |
2
|
4
|
4 (8)
|
4 (8)
|
4 (8)
|
4
|
Jádro
|
Wolfdale
|
Yorkfield
|
Bloomfield
|
Bloomfield
|
Bloomfield
|
Agena
|
L1 cache |
2× 64 kB
|
4× 64 kB
|
4× 64 kB
|
4× 64 kB
|
4× 64 kB
|
4× 128 kB
|
L2 cache |
6 144 kB
|
2× 6 144 kB
|
4× 256 kB
|
4× 256 kB
|
4× 256 kB
|
4× 512 kB
|
L3 cache |
–
|
–
|
8192 kB
|
8192 kB
|
8192 kB
|
2048 kB
|
FSB/HT/QPI
|
1333 MHz (QDR)
|
1600 MHz (QDR)
|
4,8 GT/s
|
4,8 GT/s
|
6,4 GT/s
|
4 GHz (DDR, HT)
|
Násobič
|
10
|
8
|
20
|
22
|
24
|
13
|
Výrobní proces |
45 nm high-k
|
45 nm high-k
|
45 nm high-k
|
45 nm high-k
|
45 nm high-k
|
65 nm SOI
|
Velikost jádra |
104 mm²
|
214 mm²
|
263 mm²
|
263 mm²
|
263 mm²
|
285 mm²
|
Počet tranzistorů |
410 milionů
|
820 milionů
|
731 milionů
|
731 milionů
|
731 milionů
|
450 milionů
|
TDP
|
65 W
|
136 W
|
130 W
|
130 W
|
130 W
|
125 W
|
Patice
|
775
|
775
|
1366
|
1366
|
1366
|
AM2+
|
Cena
|
6 000 Kč
|
32 000 Kč
|
6 650 Kč
|
12 900 Kč
|
22 850 Kč
|
3 950 Kč
|
Rozdíly mezi třemi uvedenými procesory řady Core i7 (kódové označení Bloomfield: 4 jádra, 8 vláken) ilustruje stručná tabulka od Intelu:
Novinky v architektuře
V posledních letech zavedl Intel chytrý způsob modernizace svých procesorů. Zatímco Pentium 4 (architektura NetBurst) bylo svého času možno označit za zcela nový procesor, o žádném jeho následovníku už to tak úplně neplatí. Core Duo (jádro Yonah) z počátku roku 2006 si vypůjčilo výpočetní jednotky z Pentia M, quad-pumped FSB pochází z architektury NetBurst, novinkou byla L2 cache sdílená (přesněji řečeno dynamicky rozdělovaná) mezi dvěma jádry. O půl roku později představené Core 2 Duo (Conroe), první člen nové architektury Core, pouze vyměnila výpočetní jádra za nově navržená, výkonnější.
Architektura Nehalem přejímá s minimálními změnami výpočetní jednotky Core. Zbavuje se ale zastaralé sběrnice FSB, přesouvá paměťový řadič do procesoru a radikálně mění systém vyrovnávacích pamětí (cache).
Změny v jádrech
Samotná výpočetní jádra přeci jen doznala drobných změn. Byla přidána podpora instrukcí SSE4.2, byl vylepšen alogirtmus predikce větvení kódu a také funkce „macro fusion“, což byla jedna z novinek v architektuře Core. Macro fusion umožňuje sloučit některé dvojice instrukcí do jedné, takže jsou obě vykonány v jednom taktu. Nehalem přidává podporu několika nových fúzí, v první řadě ale řeší nedostatek Core, které neumělo používat macro fusion v 64bitovém prostředí. Další změnou je návrat HyperThreadingu, tedy schopnosti počítat na jednom jádře dvě vlákna zároveň.
Integrovaný paměťový řadič
AMD jej používá už několik let, Intel tvrdí, že s implementací vyčkával, až toto řešení nabyde smyslu. Pravda je taková, že koncepce použitá u architektury AMD K8 v segmentu serverů nabyla smyslu už dávno, v desktopu naopak ani dnes není propustnost a latence pamětí limitujícím faktorem výkonu.
Jádro Bloomfield dostalo do vínku tříkanálový řadič podporující výhradně moduly DDR3. Budoucí čistě desktopové deriváty Nehalemu, které budou používat platformu LGA1156, budou mít řadič klasický dvoukanálový. Jeho integrace do procesoru zde nebude mít ani tak význam pro výkon, jako pro nízkou cenu, neboť do CPU se přesune i řadič PCI Express a severní můstek čipsetu tak vůbec nebude potřeba.
QuickPath Interconnect
Starý quad-pumped Front Side Bus nahradila sběrnice jménem QuickPath Interconnect (QPI). U první generace se budou používat dvě rychlosti: 4,8 GT/s a 6,4 GT/s. GT znamená GigaTransfer a číslo tedy udává počet přenosů za sekundu, jinými slovy je to takt sběrnice a můžeme GT/s nahradit za GHz. QPI má šířku 20 bitů, jeho propustnost je tedy 12, respektive 16 GB/s. FSB (šířka 64 bitů) na 1600 MHz může teoreticky přenést až 12,8 gigabajtů za sekundu, QPI je ale full duplex linka, čili může zároveň přenášet stejný objem dat opačným směrem, a samozřejmě není zatěžována komunikací procesoru s jeho operační pamětí. Pro názornost srovnejme blokový diagram čipsetu Intel X48…
…s diagramem nové platformy s procesorem Core i7 a čipsetem Intel X58:
Úloha severního můstku, který už neobsahuje paměťový řadič, byla redukována na zprostředkování komunikace mezi procesorem (QPI), jižním můstkem (DMI) a grafickými akcelerátory a ostatními zařízeními (PCI Express).
Zpátky ke QuickPath. V desktopovém prostředí není možné tak rychlou sběrnici smysluplně využít. QPI ovšem bude mít význam pro servery, kde jej budou procesory používat také ke komunikaci mezi sebou a budou si přes něj vyměňovat obsahy svých operačních pamětí. K tomuto účelu budou mít serverové Nehalemy čtyři nezávislé QPI řadiče. Jak asi z tohoto povídání vyplývá, jedna QPI linka vždy spojuje jen dvě zařízení. Narozdíl od FSB jej tedy nelze sdílet mezi dvěma čipy v jednom balení. Nemusí to nutně znamenat, že už nikdy neuvidíme žádný „slepenec“, leč implementace tohoto řešení by narážela na nové překážky.
V podstatě stejným způsobem funguje sběrnice HyperTransport, kterou AMD používá už od dob prvních Athlonů 64. HyperTransport je oproti QPI širší, 32bitový. Současné procesory AMD řady Phenom používají HyperTransport 3.0 na 3,6 GHz, což jim poskytuje 14,4 GB/s propustnosti jedním směrem (HyperTransport je taktéž full duplex).
Cache
Jak už jsem zmínil, přepracován byl subsystém cache. První modely Core i7 kódově označené Bloomfield se chlubí osmimegabajtovou sdílenou L3 cache, každé jádro pak má 256 kB vlastní cache L2. Že by opět inspirace u AMD? Ne tak docela. AMD totiž používá takzvané exkluzivní cache, zatímco Intel vsadil na cache inkluzivní. Co tyto pojmy znamenají?
Zdroj obrázku: Anandtech
V inkluzivním systému cache platí, že data v L1 a L2 jsou (duplicitně) uloženy také v L3. Nevýhoda je tedy zřejmá: celková kapacita je omezena velikostí cache nejvyšší úrovně – konkrétně zde je to 8 MB. Tento přístup má ale i své výhody. Pokud výpočetní jádro hledá data, která jsou kdesi v cache uložena, při postupném prohledání vlastní L1, vlastní L2 a sdílené L3 na ně dříve či později narazí.
Naopak v exkluzivní cache jsou data uložena právě jednou, což umožňuje optimálnější využití její fyzické kapacity. To ale znamená, že data mohou být uložena ve vlastní cache jednoho jádra, ke kterému ostatní jádra nemají přímý přístup a je-li najednou potřeba data přesunout (třeba proto, že operační systém přemístí vlákno z jednoho jádra na druhé), vznikají nepříjemné latence.
Tolik ke srovnání s konkurencí, neméně zajímavé je ale i srovnání s předchozí generací, tedy Core 2 Quad (Yorkfield). Yorkfield se skládá ze dvou čipů Penryn, které každé obsahuje 6 MB L2 cache sdílené mezi jádra. Celkem je tedy vyrovnávací paměti dokonce o polovinu více, než u Bloomfieldu. Každé výpočetní jádro má L1 cache (32 kB pro data, 32 kB pro instrukce) s latencí tří cyklů. L2 je vzhledem ke své velikosti velmi rychlá, její latence je 14 cyklů.
Nehalem zachovává kapacitu L1 cache, ale zvyšuje její latenci na čtyři cykly. L2 má latenci 10 cyklů (ovšem její kapacita je pouze 256 kB). A konečně, L3 má velmi vysokou latenci 40 cyklů (a k tomu 16cestnou asociativitu oproti 24cestné u L2 architektury Core). Na Beyond3D fóru se rozhořela diskuze, zdali je nový systém cache zodpovědný za to, že Core i7 je v některých případech (konkrétně ve hrách) pomalejší, než stejně taktované Core 2 Quad. Ať už to tak je nebo ne, faktem zůstává, že architektura Nehalem je optimalizována pro počítání více vláken naráz, tedy pro typicky serverové úlohy a práci s multimédii, zatímco náročné jednovláknové aplikace mu tolik nesvědčí – jak ostatně uvidíte v následujících kapitolách s testy výkonu. Výkon v jednovláknových úlohách ale kompenzuje nová funkce pojmenovaná…
Turbo Mode
Je-li Turbo Mode aktivní, v případě potřeby se vytížená jádra přetaktují, zatímco ta nevytížená jsou vypnuta. Přetaktování se děje změnou násobiče. Jak je vidět na schématu platformy v bloku věnovaném sběrnici QPI, procesor (a také northbridge i southbridge) odvozuje svůj takt od jednoho generátoru, který poskytuje frekvenci 133,33 MHz, proto se takt jednotlivých jader v Turbo Mode mění v těchto krocích.
Každé jádro má vlastní násobič, může tedy dojít k případu, kdy dvě jádra budou vypnutá a zbylá dvě poběží každé na jiné frekvenci.
Testovací sestava a základní deska Asus P6T Deluxe (Intel X58)
Testovací sestava
Poznámka: u procesorů Intel Core 2 byly paměti DDR3 nastaveny dle implicitní frekvence FSB, v případě Core 2 Duo E8600 tedy na 1333 MHz efektivně (časování stále 8-8-8-24, 2T), u Core 2 Extreme QX9770 pak na 1600 MHz s identickým časováním.
Asus P6T Deluxe OC Palm Edition
Recenze povedené základní desky Asus P6T Deluxe, se kterou jsme Bloomfieldy testovali a s níž jsme dosáhli vynikajících výsledků v přetaktování, vám přineseme do konce týdne. Zatím se s ní můžete trochu seznámit na prvních fotografiiích.
Procesory obrazem a parametry detekované Cpu-Z
Intel Core i7 965 Extreme Edition v zátěži (bez Turbo Mode):
Core i7 965 XE v idle:
Detaily o cache:
Nastavení pamětí:
SPD informace modulů Qimonda DDR3-1066 z kitu Intelu:
Nástroj Asusu, TurboV, umožňuje nejen změny napětí a základní frekvence z prostředí Windows, ale u Extreme Edition procesoru můžete měnit i násobič směrem nahoru (rovněž za běhu Windows):
Procesor Core i7 940 jsme fyzicky neměli. Zato jsme měli návod, jak jej nasimulovat. A to přímo od Intelu. Máte-li v počítači Core i7 965 XE, objeví se v BIOSu možnost změnit rychlost QPI, pro i7 940 musí být nastavena na 4,8 GT/s namísto 6,4 GT/s. Násobič je třeba snížit z 24 na 22.
Core i7 920 jsme zase pro změnu měli a to hned ve dvou kusech. Takto vypadá jeho frekvence v zátěži (ale bez Turba):
V idle režimu:
Nastavení paměti bylo pro všechny tři Core i7 stejné:
Multimédia: video, fotky, hudba
x264 benchmark
x264 benchmark testuje výkon procesoru při převodu videa v rozlišení 720p s použitím kodeku H.264. Benchmark je ke stažení na TechARP.com, používáme výsledky z náročnějšího druhého průchodu.
VirtualDubMod + DivX 6.8.3
VirtualDubMod slouží pouze jako rozhraní pro převod souboru 400MB souboru MPEG-2 (.VOB) ve standardním DVD rozlišení do .AVI s kodekem DivX. Experimentální podporu SSE4 necháváme vypnutou, volba Enhanced multi-threading je naopak zapnuta. Předvolej je profil Home Theater a kvalita Balanced.
Paint.NET
Pro testování výkonu ve volně šiřitelném bitmapovém editoru používáme rozhraní TPUbench.
Zoner Photo Studio 11
Poslední verze Photo Studia společnosti Zoner má za úkol hromadnou úpravu třiceti 6Mpx fotografií ve formátu JPEG: automatický kontrast, vyvážení bílé, zmenšení, doostření, saturace, uložení jako JPEG pro web, vložení obrázku do obrázku a pár dalších.
WAV do MP3: LameEnc 3.97
Jeden rozměrný soubor ve formátu WAV je pomocí kodeku LameEnc převáděn do souboru formátu MP3.
Rendering a raytracing
Cinebench R10
Cinebench je benchmark snažící se nastínit výkon procesorů při renderingu v CAx programu Cinema 4D společnosti Maxon. Používáme x CPU benchmark (vícevláknový).
POV-Ray v3.7
Beta verze freeware raytraceru POV-Ray umožňuje využít vícejádrové procesory. Pro testy používáme jednu ze scén mezi příklady dodanými s programem: chess2.pov a rozlišení 800 × 600 px bez anti-aliasingu.
Blender 2.47
Pro testování v 3D modeláři Blender používáme standardní nastavení a model flyingsquirrel.blend.
Aplikační výkon v testech PCMark Vantage
PCMark Vantage
PCMark Vantage prověří celý počítač a je to tzv. polosyntetický benchmark. Obsahuje fragmenty skutečných aplikací, renderuje například webové stránky v prohlížeči s více záložkami, pracuje hromadně s fotkami a občas některé činnosti dělá současně.
Další dílčí výsledky jsou už jen z 64bitové verze benchmarku:
Komprese souborů a syntetické testy
WinRAR 3.71
Pro příklad výkonu při kompresi souborů jsme vybrali rozšířený formát RAR, zkušenosti s programem 7-zip (a dalšími ZIP archivátory) zatím ukazují na využití maximálně jednoho jádra.
wPrime 2.0
Vícevláknová obdoba jednoduchého benchmarku SuperPI (samozřejmě se nepočítá Ludolfovo číslo, ale prvočísla).
Fritz Chess
Benchmark simulující počítání šachových kombinací skutečného šachového programu Fritz.
Everest 4
Především diagnostický nástroj Everest obsahuje i několik syntetických benchmarků, čistě procesorový CPU Queen či svými výsledky trochu zvláštní PhotoWorxx.
Propustnost a latence paměťového subsystému
Everest 4 – propustnost a latence paměťového subsystému
Jen připomenu konfiguraci jednotlivých testovaných systémů:
- Core i7: 3× DDR3-1066, 7-7-7-20, 1T (triple channel)
- Core 2 Extreme: DDR3-1600, 8-8-8-24, 2T (dual channel)
- Core 2 Duo: DDR3-1333, 8-8-8-24, 2T (dual channel)
Herní výkon a skóre v 3DMarku
Call of Duty 4
1680 × 1050 px, maximální detaily, bez anti-aliasingu, režim timedemo.
Crysis
1680 × 1050 px, DirectX 10, island demo, celkové detaily: high, bez anti-aliasingu
Unreal Tournament 3
1680 × 1050 px, MCTF-Suspense, maximální detaily, bez anti-aliasingu
World in Conflict
1680 × 1050 px, střední detaily, DirectX 10, fyzika zapnuta, bez anti-aliasingu
3DMark Vantage
Základní nastavení (performance), pouze CPU score.
3DMark06
Implicitní nastavení, opět pouze CPU score.
Vliv funkce Intel Turbo Boost na výkon
O tom, co to je funkce Intel Turbo jste se mohli něco dozvědět v úvodním obecném pojednání. Aby mohla být tato funkce aktivní, musíte ponechat zapnout funkci Enhanced Intel SpeedStep (EIST).
Co se výkonnostní části týče, jedná se především o zvyšování násobiče jádra v případě nevytíženosti všech, místo frekvence 3,2 GHz tak může například první jádro procesoru Core i7 965 XE pracovat i na frekvenci přes 3,4 GHz. Bez přetaktování, jen s Auto hodnotami v BIOSu:
Koho tedy mrzelo, že jsme procesor Core i7 965 Extreme Edition testovali s touto funkcí zapnutou, dočká se i výsledků bez ní. Současně tak lze vidět i výkon Core i7 XE proti Core 2 Extreme (Quad) na stejné frekvenci.
Tytéž výsledky shrnuté v kompaktní tabulce:
|
Core 2 Extreme QX9770 (3,2 GHz)
|
Core i7 965 XE (3,2 GHz)
|
Core i7 965 XE (3,2 GHz + Turbo)
|
Cinebench R10 (64-bit) [body]
|
12 560
|
18 125
|
19 267
|
H.264/AVC [fps] (vyšší je lepší)
|
21,3
|
30,6
|
31,7
|
WAV do MP3 [s] (menší je lepší)
|
40
|
41
|
37
|
WAV do MP3 Play/CPU Ratio (vyšší je lepší)
|
30,0
|
29,3
|
32,7
|
Paint.NET 3.22 [s] (menší je lepší)
|
19,5
|
14,8
|
13,8
|
WinRAR 3.71 [s] (menší je lepší)
|
34,1
|
31,3
|
29,6
|
Everest 4 (Memory Read) [kB/s]
|
10 001
|
14 935
|
15 116
|
Everest 4 (Memory Write) [kB/s]
|
8 451
|
15 407
|
15 334
|
Everest 4 (Memory Copy) [kB/s]
|
9 048
|
16 413
|
16 330
|
Everest 4 (Memory Latency) [ns] (menší je lepší)
|
58,6
|
39,1
|
39,0
|
Everest 4 (CPU Queen) [kB/s]
|
10 553
|
9 871
|
10 339
|
Everest 4 (PhotoWorxx) [kB/s]
|
37 390
|
86 936
|
89 116
|
Call of Duty 4 [fps]
|
125,8
|
110,6
|
118,3
|
Crysis [fps]
|
47,7
|
47,7
|
47,7
|
Unreal Tournament 3 [fps]
|
240,7
|
246,3
|
259,8
|
Spotřeba PC v Prime95 25.6 [W]
|
226
|
244
|
262
|
Teplota CoreTemp v Prime95 25.6 [˚C]
|
37
|
57
|
63
|
Teplota RealTemp v Prime95 25.6 [˚C]
|
47
|
52
|
59
|
Propustnost a latence paměti: triple vs. dual vs. single channel
V prvních testech, jež na internetu spatřily světlo světa dlouho před vypršením NDA na procesory Core i7, nebyly testy novinky v podobě trojkanálového zapojení paměťových modulů zrovna přesvědčivé, resp. trojkanálový režim nefungoval a nevykazoval proti dvoukanálovému žádný přínos. V případě základní desky Asus P6T Deluxe a BIOSu 0310 už bylo vše v pořádku a trojkanálový přístup znamenal určitý benefit nad už tradičním dvoukanálovým. Podle všeho je ale propustnost v triple channel trošku na úkor latence.
Další dva syntetické testy už jen prokazují, že v testu závislém čistě na výkonu procesoru (CPU Queen, zřejmě se vejde do cache procesoru) není na rozdíl od testu simulujícího práci procesoru s multimédii (PhotoWorxx) přínos vyšší propustnosti patrný.
Pokud byste místo grafů preferovali kompaktnější tabulku, nezklameme vás:
Core i7 920, DDR3-1066, 7-7-7, Vista 32-bit
|
Triple channel
|
Dual channel
|
Single channel
|
Everest 4 (Memory Read) [kB/s]
|
12 106
|
11 281
|
8 417
|
Everest 4 (Memory Write) [kB/s]
|
9 674
|
9 648
|
8 264
|
Everest 4 (Memory Copy) [kB/s]
|
13 333
|
12 892
|
9 656
|
Everest 4 (Memory Latency) [ns] (menší je lepší)
|
42,0
|
36,6
|
35,9
|
Everest 4 (CPU Queen) [kB/s]
|
8 238
|
8 203
|
8 241
|
Everest 4 (PhotoWorxx) [kB/s]
|
82 688
|
69 109
|
41 370
|
Takto se změní výsledky po zapnutí funkce Intel Turbo:
Core i7 920 + Turbo, DDR3-1066, 7-7-7, Vista 32-bit
|
Triple channel
|
Dual channel
|
Single channel
|
Everest 4 (Memory Read) [kB/s]
|
12 014
|
11 321
|
8 398
|
Everest 4 (Memory Write) [kB/s]
|
9 657
|
9 675
|
8 266
|
Everest 4 (Memory Copy) [kB/s]
|
14 217
|
13 153
|
9 701
|
Everest 4 (Memory Latency) [ns] (menší je lepší)
|
42,2
|
36,1
|
35,5
|
Everest 4 (CPU Queen) [kB/s]
|
8 707
|
8 653
|
8 657
|
Everest 4 (PhotoWorxx) [kB/s]
|
87 947
|
62 835
|
43 534
|
A nakonec porovnání s propustností a latencemi všech dalších procesorů (Core i7 jsou v tříkanálovém a Core 2 ve dvoukanálovém režimu). Všimněte si vyšších výsledků Core i7 pod 64bitovou verzí Windows Vista:
Vista 64-bit
|
Core 2 Duo E8600 (3,33 GHz)
|
Core 2 Extreme QX9770 (3,2 GHz)
|
Core i7 920 (2,66 GHz)
|
Core i7 940 (2,93 GHz)
|
Core i7 965 XE (3,2 GHz + Turbo)
|
Everest 4 (Memory Read) [kB/s]
|
8 875
|
10 001
|
13 405
|
14 585
|
15 116
|
Everest 4 (Memory Write) [kB/s]
|
7 093
|
8 451
|
12 175
|
14 892
|
15 334
|
Everest 4 (Memory Copy) [kB/s]
|
7 774
|
9 048
|
13 847
|
16 077
|
16 330
|
Everest 4 (Memory Latency) [ns] (menší je lepší)
|
65,0
|
58,6
|
43,3
|
39,3
|
39,0
|
Everest 4 (CPU Queen) [kB/s]
|
6 454
|
10 553
|
8 189
|
9 018
|
10 339
|
Everest 4 (PhotoWorxx) [kB/s]
|
43 477
|
37 390
|
78 473
|
83 696
|
89 116
|
Přetaktování
Přetaktování jsme začali s procesorem k tomu takřka určeným: Core i7 965 Extreme Edition. Ten má násobič otevřený směrem nahoru a odstraněny veškeré zábrany v přetaktování. Bohužel, náš konkrétní kousek nebyl příliš dobrý a maximum, na které jsme si troufli se vzduchovým chladičem, vidíte na screenshotu z Cpu-Z:
Zato jeden z procesorů Core i7 920, které jsme zkusili, nám dělal jen radost. S napětím 1,35 V a vypnutým Turbo bylo na desce Asus P6T Deluxe zvednou základní frekvenci až na 190 MHz a mít tak místo 2,66 rovnou 3,8 GHz. Díky funkci Turbo jsme se napětím 1,43 V postupně dostali do Windows s frekvencí až 4168 MHz (validace programem Cpu-Z).
Validovaný screenshot z programu Cpu-Z prokazující nejvyšší dosaženou frekvenci
Čtenáře, které zajímá, s jakým nastavením BIOSu (především hodnoty napětí QPI, IOH, ICH, DRAM, vypnuté některé vlastnosti procesoru apod.) jsme dobrého přetaktování dosáhli, máme následující sled fotografií z BIOSu desky Asus P6T Deluxe:
Náročný test stability prime95 počítající prvočísla v osmi vláknech současně bylo možné na procesoru Core i7 920 stabilně provozovat při frekvenci 3,9 GHz s napětím 1,41 V. Na obrázku vidíte ještě cennější důkaz stability na sice nižší frekvenci (3,8 GHz), ale s vypnutou frekvencí Intel Turbo a s napětím pouhých 1,35 V. Základní frekvence 190 MHz (před přetaktováním to bylo jen 133 MHz) dokazuje kvality základní desky Asus P6T Deluxe.
Obrázky potvrzující dosažené skóre v Cinebench R10 a neuvěřitelnou rychlost v počítání prvočísel v programu wPrime. Oba programy jsou zdarma, zkuste si je spustit na svém počítači a pochopíte obrovskou rychlost přetaktovaného procesoru Core i7
Screenshot z oficiální databáze ripping.org, kde redakce EHW (přezdívka Ulf náleží Radku Bábíčkovi) ovládla čelní příčky pro procesor Core i7 920. Výsledek redakce se vzduchovým chlazením je pak dokonce druhý absolutně nejlepší výsledek s procesory architektury Nehalem, překonávající i výkony s drahým Core i7 965 Extreme Edition, který začíná nikoli na 2,66 ale na 3,2 GHz a má otevřený násobič směrem nahoru.
Výkon po přetaktování
Procesor Core i7 920 byl pro testy ilustrující nárůst výkonu po přetaktování nastaven pomocí základní frekvence na zhruba 3,75 GHz (186 × 20, základní frekvence byla ve skutečnosti o chlup vyšší, proto lépe sedí zaokrouhlení na 3,75 GHz), zapnuta byla i funkce Turbo, takže jedno jádro pracovalo velmi často s násobičem 21, ve výsledku asi na 3903 MHz. Frekvence pamětí se zvedla adekvátně se základní frekvencí (1143 MHz), bylo ale zvýšeno i časování (8-8-8-20 namísto 7-7-7-20, a 3N namísto 1N).
Napětí bylo kvůli přetaktování zvýšeno na 1,41 V. Spotřeba a zahřívání takto přetaktovaného procesoru jsou extrémní. Jen pro srovnání, spotřeba PC v zátěži na téměř stejně výkonném nastavení 3800 MHz (190 × 20, bez Turba), na které stačilo jen 1,35 V, byla mnohem příznivějších 346 wattů.
|
Core 2 Extreme QX9770 (3,2 GHz)
|
Core i7 920 (2,66 GHz)
|
Core i7 940 (2,93 GHz)
|
Core i7 965 XE (3,2 GHz + Turbo)
|
Core i7 920 (@3,75 GHz + Turbo)
|
Cinebench R10 (64-bit) [body]
|
12 560
|
15 431
|
17 024
|
19 267
|
22 273
|
POV-Ray v3.7 (64-bit) [s] (menší je lepší)
|
32,4
|
28,1
|
25,6
|
22,5
|
19,4
|
Blender 2.47 (32-bit) [s] (menší je lepší) |
61,3
|
66,6
|
57,9
|
53,9
|
45,1
|
H.264/AVC [fps] (vyšší je lepší)
|
21,3
|
25,4
|
28,0
|
31,7
|
36,7
|
WAV do MP3 [s] (menší je lepší)
|
40
|
47
|
43
|
37
|
32
|
WAV do MP3 Play/CPU Ratio (vyšší je lepší)
|
30,0
|
24,4
|
28,1
|
32,7
|
37,3
|
Paint.NET 3.22 [s] (menší je lepší)
|
19,5
|
17,2
|
15,5
|
13,8
|
11,8
|
WinRAR 3.71 [s] (menší je lepší)
|
34,1
|
35,3
|
33,0
|
29,6
|
28,5
|
wPrime 2.0, 32M [s] (menší je lepší)
|
12,09
|
9,47
|
8,60
|
7,72
|
6,59
|
wPrime 2.0, 1024M [s] (menší je lepší)
|
381
|
289
|
263
|
233
|
199
|
Fritz Chess [relativně k PIII, 1 GHz]
|
18,6
|
20,4
|
22,5
|
25,4
|
29,4
|
Fritz Chess [knodes/s]
|
8 939
|
9 781
|
10 787
|
12 199
|
14 091
|
Everest 4 (Memory Read) [kB/s]
|
10 001
|
13 405
|
14 585
|
15 116
|
14 962
|
Everest 4 (Memory Write) [kB/s]
|
8 451
|
12 175
|
14 892
|
15 334
|
17 124
|
Everest 4 (Memory Copy) [kB/s]
|
9 048
|
13 847
|
16 077
|
16 330
|
17 883
|
Everest 4 (Memory Latency) [ns] (menší je lepší)
|
58,6
|
43,3
|
39,3
|
39,0
|
43,3
|
Everest 4 (CPU Queen) [kB/s]
|
10 553
|
8 189
|
9 018
|
10 339
|
11 994
|
Everest 4 (PhotoWorxx) [kB/s]
|
37 390
|
78 473
|
83 696
|
89 116
|
76 708
|
Call of Duty 4 [fps]
|
125,8
|
107,6
|
111,6
|
118,3
|
119,5
|
Crysis [fps]
|
47,7
|
43,5
|
46,5
|
47,7
|
48,1
|
Spotřeba PC v idle [W]
|
127
|
133
|
135
|
138
|
197
|
Spotřeba PC v Prime95 25.6 [W]
|
226
|
221
|
245
|
262
|
398
|
Teplota CoreTemp v idle [˚C]
|
15
|
31
|
32
|
33
|
38
|
Teplota RealTemp v idle [˚C]
|
25
|
26
|
27
|
28
|
33
|
Teplota CoreTemp v Prime95 25.6 [˚C]
|
37
|
52
|
59
|
63
|
93
|
Teplota RealTemp v Prime95 25.6 [˚C]
|
47
|
47
|
54
|
59
|
88
|
Verdikt
Core i7 nepřináší revoluci pro běžné uživatele nebo hráče. Přináší však významný pokrok pro oblasti jako rendering, převod videa, práci s obrazovými daty anebo prostě všude tam, kde aplikace (či více aplikací) požadují vysoký výkon pro více procesových vláken.
Tam, kde jde skutečně o mnoho současně spuštěných vláken, je výkon „základního Nehalemu“ – Core i7 920 na 2,66 GHz – srovnatelný s nejvyšším Core 2: Extreme QX9770 na 3,2 GHz. Naopak ve chvílích, kdy současně využijete s bídou dvě jádra procesory, tedy například ve většině současných her, nemůžete od Core i7 čekat zázraky a při stejné frekvenci čekejte podobný výkon jako u Core 2. Koneckonců něco podobného platí i v případě Core 2 Duo a Core 2 Quad.
Graf aplikačního výkonu byl získán jako průměr ze 32 a 64bitové verze PCMark Vantage.
Průměrný výkon v konverzi videa do H.264, DivX, audio do MP3 (LameEnc) a při práci s fotografiemi (Zoner Photo Studio 11 a Paint.NET)
Průměrný výkon v Call of Duty 4, Crysis, Unreal Tournament 3 a World in Conflict
Průměrný výkon v Cinebench R10 (32 i 64-bit), Blender a POV-Ray 3.7
Přechod na novou platformu nebude bezbolestný, kvůli velkým změnám v architektuře potřebujete kromě procesoru i novou základní desku, nový chladič (či dodatečné příslušenství pro váš stávající), ideálně pak ještě kit DDR3 pamětí o třech kusech. Pro domácí počítače je takový drahý upgrade zatím zbytečný, pro profesionální nasazení se někde může vyplatit, do nových počítačů je především nejlevnější z Core i7 – 920 – zajímavou volbou. Uvidíme, jak brzy se začnou objevovat další základní desky s rozumnějšími cenami. V tématice základních desek není nezajímavá ani možnost zakoupit desky podporující CrossFire i SLI současně.
Pohled na výkon v grafech, přetaktování a především ceny tří prvních Core i7 jasně vyzdvihuje nejníže taktovaný a výrazně nejlevnější model 920. Ten stojí přibližně tolik, co podobně taktovaní předchůdci Core 2 Quad a i přestože je Extreme Edition 965 levnější než předchozí Extreme procesor QX9770, je jeho cena zcela nevýhodná. I Core i7 940 stojí dvojnásobek ceny i7 920. A to je za 266 MHz navíc opravdu moc.
Za výborný aplikační výkon, fantastický celkový výkon po přetaktování a dostupnou cenu udělujeme procesoru Intel Core i7 920 ocenění We want it!
Intel Core i7 (Bloomfield)
+ výkon ve vícevláknových aplikacích
+ propustnost a latence paměťového subsystému
+ rezervy pro přetaktování
+ cenově dostupný model Core i7 920
+ dobrý poměr výkon/spotřeba
- upgrade na platformu Core i7 není levný (a pro domácí PC potřebný)
- zahřívání
Za zapůjčení procesorů, chladičů a pamětí Qimonda děkujeme společnosti Intel.
Za zapůjčení základní desky Asus P6T Deluxe děkujeme společnosti Asus
U této uvítací cedule na příjezdu k Nehalemu jsou silná mračna komárů. Jednoho člověka jich dokáže bodat až osm současně
Zítra pokračujeme v průzkumu nové platformy recenzí velmi netradiční základní desky Intel DX58SO a plynule navážeme i představením Asus P6T Deluxe (obě samozřejmě s čipovou sadou Intel X58 Express)