Intel Core 2 Extreme QX9650 (Penryn)

23. 11. 2007

Sdílet

 Autor: Redakce

Co přináší 45nm technologie a co znamená Penryn

Co přináší 45nm technologie

12. listopadu 2007 byla na trh uvedena nová rodina procesorů na 45nm technologii. Po ne až tak dávném prosazení 65nm technologie tedy Intel udělal další velký krok vpřed, a zasadil tak AMD tvrdou ránu. 65nm čtyřjádrových procesorů už Intel prodal 3 miliony kusů, uvidíme, zda 45nm budou ještě úspěšnější.


Intel Core 2 Extreme QX9650

Při přechodu z 65nm na 45nm technologii bylo třeba překonat řadu zásadních problémů. Polysilikonová elektroda, která byla používána v 65nm procesorech už nedokázala plně regulovat protékající proud. Byla tedy nahrazena kovovou elektrodou, která je v redukci proudu efektivnější.

Stálým zmenšováním tranzistorů se vrstva dielektrika neustále zužovala až se v současných 65nm procesorech dostala na hranici. Dalším ztenčováním by již přestala plnit svou funkci, a proto byla nahrazena novým materiálem, hafniem. Dielektrium se označuje jako High-k.

Těmito zásadními změnami bylo dosaženo větší hustoty tranzistorů a menších ztrát energie (tím poté i nižší spotřeby procesoru). Vyšší hustota tranzistorů umožňuje vytvářet menší čipy se stejným výkonem nebo na stávající plochu čipu umístit mnohem více prvků. Druhá možnost je i případ nově uvedených procesorů rodiny Penryn.

Základní myšlenka Penrynu stojí na menší ploše jádra. Menší tranzistory znamenají menší odběr proudu, takže menší produkci tepla. To umožňuje dosáhnout vyšších frekvencí a tím pádem i vyššího výkonu. Intel oznámil až o 30% nižší spotřebu oproti procesorům postaveným na 65nm technologii.

Intel Core 2 Extreme QX9650 je první ze série Penrynů, který byl oficiálně vypuštěn na trh. Vydání ostatních procesorů této série můžeme čekat někdy kolem ledna roku 2008.

Další vylepšení architektury:

  • Virtualizační technologie Enhanced Intel Virtualization – přechody mezi virtuálními stroji (vstupní a výstupní časy) byly pomocí hardwarových změn zrychleny v průměru o 25 až 75 procent bez potřeby měnit software.
  • Rychlé dělení čísel – díky technice Radix 16 stoupla rychlost dělení ve srovnání s předchozí generací zhruba na dvojnásobek. Rychlejší dělení instrukcí a příkazů zvyšuje výpočetní výkon.
  • Unikátní dočasný zásobník (Unique Super Shuffle Engine) – díky širšímu, 128bitovému zásobníku se výrazně zvyšuje výkon SSE instrukcí, které vyžadují přesuny dat. Tato funkce zvýší výkon tvorby obsahu, úpravy obrazu, videa a technických výpočtů.

V cenících žádný procesor Penryn ale není?

Jako Penryn je označována celá série procesorů na 45nm technologii. Intel Core 2 Extreme QX9650 je první vydaný procesor z této série. Vydání ostatních můžeme čekat někdy v lednu až březnu roku 2008. Pro pořádek bychom měli uvést jejich kódová označení, v kterých se člověk lehce zaplete.

Čtyřjádrový procesor Xeon nese kódové označení Harpertown. Desktopové procesory Penryn o čtyřech jádrech se označují Yorkfield. Wolfdale je označení pro 45nm dvoujádra.

Kromě toho bylo přidáno několik menších změn. Nejdůležitější z nich je zvětšení kapacity L2 cache. U dvoujádrových procesorů se ze 4 MB zvýšila na 6 MB, čtyřjádra dostali namísto 8 MB hezkých 12 MB L2 cache. Byly také přidány nové instrukce ze sady SSE4, které dodávají ještě lepší výkon pro zpracování videa ve formátu HD (jsou-li kodekem použity). Sada SSE4 není v procesoru ještě kompletní (to až v dalších procesorech Intel), proto je ve výčtu parametrů Yorkfieldu uváděna jako SSE4.1.

Větší cache a nový set instrukcí vyžadují nějaké ty tranzistory navíc. Současná generace čtyřjádrových procesorů má 582 milionů tranzistorů, procesory série Penryn jich obsahují zhruba 820 milionů. To je o více než 40% navíc při velikosti 214 mm2. Tranzistory na současných čtyřjádrech (Kentsfield) zabírají 286 mm2 prostoru. Procesory tak (co se týče celkového počtu tranzistorů pro jádra) po delší době předehnaly zase grafické karty, nejkomplexnější GPU zatím nepřesáhly 750 milionů tranzistorů. GPU jsou však zatím jedním kusem křemíku, kdežto procesor spojuje více jader.

Představení Core 2 Extreme QX9650, testovací sestava

Představení QX9650, testovací sestava

Zatím nejvýkonnější desktopový procesor na trhu se základní frekvencí 3GHz (9 × 333 MHz) na každé jádro, dohromady tedy 12GHz (V praxi se samozřejmě výkonu jaký by mělo 12GHz jednojádro nedosahuje) v procesoru klasických rozměrů. Intel Core 2 Extreme QX9650 s 12MB L2 cache funguje na patici LGA 775 a jeho standardní napětí činí 1,25 V (program Cpu-Z napětí nereportoval správně).

Nový QX9650 jsme srovnávali se dvěma procesory. Prvním byl cenově dostupný, dvoujádrový Core 2 Duo E6750. Uvidíte tak jaký výkon navíc dostanete za cca 24 tisíc korun rozdílu. Druhým srovnávaným byl přímý předchůdce QX9650 z řady Core 2 Extreme, který funguje na stejné FSB a stejném taktu, QX6850. Liší se tedy jen použitou technologií, což nám v testu elegantně ukáže výhody rodiny Penryn (a především větší cache) v praxi.

Testovací sestava:

Procesor Intel Core 2 Duo E6750 – 2,66 GHz
Intel Core 2 Extreme QX6850 – 3,0 GHz
Intel Core 2 Extreme QX9650 – 3,0 GHz
Základní deska Asus P5K-E WiFi AP
Čipová sada Intel P35
Grafická karta ATI Radeon HD 2900 XT 512 MB, 742/1 625 MHz
Chlazení Cooler Master GeminII s 2× Noctua S12-1200
Pevný disk WD Caviar SE16 250 GB
Paměť 2× 1 GB A-Data Vitesta Extreme DDR2-800, 4-4-4-15
Zdroj Silverstone Decathlon DA750
Operační systém Windows Vista Ultimate, 32-bit

Herní testy

Testy výkonu

Syntetické benchmarky jsou sice nejjednodušší cestou k otestování jakéhokoliv hardwaru, nevypovídají však o výkonu v reálných aplikacích. Proto jsme procesory testovali i při reálném použití, pro lepší představu o jejich reálném výkonu. Procesory jsme důkladně prozkoumali jak herními tak softwarovými testy a nevynechali jsme ani klasické benchmarky.

Herní testy výkonu

Všechny hry mají poslední verze patchů a byly testovány s vypnutým anti-aliasingem a vertikální synchronizací.

Enemy Territory: Quake Wars 1.01: 1280 × 1024, vysoké detaily

Quake Wars používají značně upravený Doom 3 engine, obohacený především o technologii MegaTexture. Pro účely testování jsme použili vlastní demo, které měří výkon v rozsáhlé lokaci se stromy. Rozdíly mezi jednotlivými procesory jsou minimální, čtyřjádra drží spolu, lepší výsledek však přisuzujeme jejich vyššímu taktu.

F.E.A.R. 1.008: 1280 × 1024, vysoké detaily

Ještě starší herní titul se ukázal jako totálně závislý na výkonu grafické karty. Výsledky všech procesorů jsou téměř totožné navzdory vyššímu taktu čtyřjader.

Lost Planet 1.004: 640 × 480, nízké detaily

Tato hlavně díky konzolím populární hra postavená na Unreal 3 enginu nás překvapila, údajná podpora čtyřjádrových procesorů očividně nefunguje – stačí se podívat na výsledky. Používali jsme vestavěný benchmark a výsledky z části snow.

World in Conflict 1.001: 1024 × 768, nízké detaily, vysoké pro fyziku a výbuchy

World in Conflict je asi nejlépe vypadající strategie, zástupce nové vlny DirectX 10 a dobrý benchmark procesoru. Jako jediná dokázala tato hra využívat výhod čtyřjádra, rozdíly už jsou viditelnější. Zejména scéna s atomovým výbuchem pro opravdu plynulý běh potřebovala QX9650, vyšší výkon 45nm čtyřjádra na ní byl opravdu znát.

Nová 45nm technologie se v benchmarku 3DMark06, projevila minimálním rozdílem 189 bodů. Samotný CPU test 3DMark06 je optimalizován pro více jader a tak jsou čtyřjádra téměř 2× rychlejší.

Ve stařičkém benchmarku od společnosti Futuremark se QX9650 projevilo velmi výrazně a dosáhlo rozdílu téměř 10 000 bodů oproti QX6850. 3Mark2001 SE je totiž pro dnešní grafické karty v implicitním rozlišení 1 024 × 768 px lahůdkou a výkon je v případě použití Radeonu HD 2900 XT limitován téměř jen procesorem. Každý kousek výkonu procesoru se tak hodí a zřejmě se kladně projevují i optimalizace v jádře nových Core 2 z rodiny Penryn (mluvíme především o cache).

Shrnutí herních testů

Z předchozích testů je jasné, že v současných hrách nepřináší čtyřjádrový procesor žadný patrný přínos oproti předchozí generaci. Počkejme si tedy na nové hry, které budou lépe využívat výhod čtyřjádra, v té době by měli být také ceny čtyřjádrových procesorů snesitelnější.

Zatím si při hraní her bez problémů vystačíte s několikanásobně levnějším E6750 nebo jeho ekvivalenty. Donedávna nejrychlejší procesor na trhu, který sesadil až QX9650, byl Q6600. Cena okolo 6 000 Kč (s DPH) posunuje tento procesor, jako první čtyřjádro, směrem k mainstreamu.

Aplikační testy

Aplikační testy

Skóre QX9650 v PCMarku je o něco málo nižší, než jakého dosáhl jeho starší bratříček QX6850. Můžeme však říct, že dopadli totožně, při opakování testu by výsledky byly posazeny zase o trochu jinak, rozdíl se tedy vejde do běžné chyby měření.

Komprimovali jsme asi 700MB složku s různorodým obsahem, tak abychom simulovali běžnou komprimaci. Rozdíl mezi nejnovějším čtyřjádrem a dvoujádrem E6750 byl 40 sekund.

K upřesnění jsme také přidali výsledky z testování interním testem WinRARu.

Komprimace v programu 7-zip probíhala stejně jako u WinRARu. Je tady vidět horší podpora vícejádrových procesorů - rozdíly byly minimální.

Převáděli jsme asi 400MB soubor z MPEG-2 do DivX. Nové čtyřjádro si s převodem poradilo o 30 sekund rychleji, pravděpodobně vlivem 12MB L2 cache.

V Zoneru jsme nastavili několik náročných automatických úprav a poté jsme je dávkově aplikovali na sadu obrázků, ve vysokém rozlišení.

Komprimovali jsme jedno album z WAV do MP3 se zapnutým variable bitrate (proměnný datový tok) na nejvyšší kvalitu. Čtyřjádra se držela pospolu a předběhla E6750 o necelých 30 sekund.

Program Super PI jsme nechali počítat číslo pí na 8 miliónů desetiných míst, E6750 to vládl o 35 sekund pomaleji než Penryn. Počítání na 8 miliónů desetinných míst jsme zvolili úmyslně, aby se ani QX9650 nevešel výpočet do cache.

Kdyby všechny aplikace byly napsány pro čtyřjádra tak jako Cinebench, vypadal by tento test úplně jinak. E6750 zůstalo se svými dvěma jádry daleko za ostatními. Tento benchmark je postavený na základě reálné aplikace Cinema 4D, podle výsledků testů je jasné, že rendering je silná stránka vícejader.

Shrnutí aplikačních testů

V aplikačních testech se projevila jedna z důležitých změn, která přišla s 45nm technologií. Díky zmenšení se do procesoru vměstnalo celých 12 MB L2 cache, což je dost pravděpodobně důvodem nárůstu i v těch programech, které nejsou přímo pro čtyřjádra napsány.

Spotřeba

Spotřeba

Vedle výkonu je již dnes velice důležitým údajem spotřeba, díky 45nm technologii si nový Penryn bere opravdu málo „šťávy“. Při plném zatížení všech čtyř procesorů přes Stress Prime 2004 (bylo třeba pustit 4 instance) se teplota procesoru ustálila na 40­ °C a počítač odebíral 225 W.

Energetická náročnost QX9650 je v průměru srovnatelná s Core 2 Duo E6750, které je o dvě jádra chudší a o 400 MHz pomalejší. Tohle je hodně silný argument pro 45nm technologii, přestože nesmíme zapomínat, že procesor ES (Engineering Sample) na tom může být trochu lépe než průměrné produkční kusy. Hlavně si musíte uvědomit, že jediným testem spotřeby z výše uvedených, který dobře využije čtyři jádra, je stress test z Everestu, zbývající testy ilustrují právě ten fakt, že s procesorem při většině činností nebudete dosahovat ani spotřeby E6750.

Přetaktování

Přetaktování

45 nm a jen 3 GHz? To jsme rozhodně nemohli tak nechat, zvlášť když GeminII se dvěma 12cm větráky uchladil procesor na hodnoty kolem třiceti stupňů Celsia. Díky otevřenému násobiči jsme procesor nemuseli taktovat zvyšováním frekvence FSB (jediný způsob, jak mohou taktovat prodejní kusy Intel Core 2 běžní uživatelé), přesto jsme taktování pomocí FSB vyzkoušeli. Celkově jsme se dostali až na 4,3 GHz při napětí 1,6 V a vzhledem k ceně testovaného procesoru (24 800 Kč s DPH) jsme už raději napětí dále nezvyšovali (hodnot napětí v Cpu-Z si nevšímejte, v základu je 1,250 V):

3,66 GHz (9 × 400)
Nejprve jsme vyzkoušeli ponechat násobič na standardní hodnotě a zvýšit FSB na 400 MHz, napětí jsme zvýšili na 1,325 V. Už toto mírné zvýšení taktu jádra se v některých testech projevilo na výkonu.

3,66 GHz (11 × 333)
Dalším krokem bylo taktování opět na 3,6 GHz, ale pomocí násobiče na standardní FSB 333 MHz. Mohli jsme se tak podívat, který způsob taktování bude ve výsledku lepší. Ve většině testů se zvýšení frekvence pomocí FSB ukázalo jako o něco málo výkonnější řešení, přestože při nastavení 11 × 333 byla frekvence ještě o něco vyšší (3,66 GHz) než u 9× 400 (3,6 GHz). Stabilní napětí bylo 1,350 V.

4,3 GHz (13 × 333)
Na tomto taktu už jsme museli nastavit napětí 1,600 V, to se projevilo výrazně zvýšenou teplotou jádra. Ta dosahovala při zátěži čtyřvláknovými Prime95 stress testem až k osmdesáti stupňům (v testech, jež jsme provedli, jsou přesto výsledky relevantní, protože při nich takové teploty procesor zdaleka nedosahoval), s lepším chlazením by se však procesor dal i na tomto taktu provozovat stabilně.

Zvyšování frekvence nejlépe odrazil nárůst výkonu v Cinebench R10 a World in Conflict. V ostatních testech po přetaktování přeměřených testech už rozdíl nebyl tak patrný. Za zmínku ještě stojí test počítání pí na 8 miliónů desetiných míst, kde byl QX9650 na 4,3 GHz o 45 sekund rychlejší než na základních třech gigahertzích.

Na grafu spotřeby se můžete podívat jak moc se zvýšil odběr proudu při napětí 1,6 V a frekvenci procesoru 4,3 GHz. Průměrně je po přetaktování odběr o 30 % vyšší.

Zhodnocení

Zhodnocení

Nejvýkonnější procesor na trhu ukázal ve velké majoritě testů viditelný nárůst výkonu i proti stejně taktovanému a podobně drahému předchůdci (QX6850). Bohužel pro nás ještě nejsou všechny aplikace a hry připravovány pro čtyřjádrové procesory – v takovém případě by QX9650 by bylo srovnání s 4 500 Kč stojícím Core 2 Duo E6750 mnohem impresivnější.

V tomto testu jsme se tedy mohli přesvědčit o výhodách 45nm technologie, která ukazuje novou cestu ve vývoji procesorů. Nižší spotřeba a menší výdej tepla budou znamenat vyšší možnosti přetaktování oproti 65nm technologii. 

Klady a zápory „extrémního“ QX9650:

+ nízká spotřeba
+ vyšší výkon
+ nižší pracovní teplota
+ 12 MB L2 cache
+ kompatibilita s mnoha základními deskami

- cena a zase cena

Jak v herních, tak v aplikačních testech jsme zjistili, že zatím mají čtyřjádra čas. Současné aplikace nedokáží jejich potenciál využít v dostatečné míře, a tak s procesorem o zhruba 20 tisíc dražším než E6750, dostáváme o pár procent lepší výkon. Další vývoj procesorů však bude zaručeně směřovat k vícejádrům, takže se snad už brzy dočkáme široké softwarové podpory.

Zatím se na budoucnost můžete připravit třeba s procesorem Core 2 Quad Q6600, který stojí jen o 2 000 Kč více než dvoujádrový hit v podobě E6750 a zřejmě vám déle vydrží. Málokdo jej z původních 2,40 GHz na alespoň 3 GHz nepřetaktuje, a tak vlastně výkon takového procesoru vidíte v uvedených grafech. S novější revizí už Q6600 je procesorem s rozumnou spotřebou a první testy navíc ukazují, že horká novinka v podobě čtyřjádrové AMD Phenom není nijak lepší ani v celkovém výkonu, ani v efektivitě.

Na co se ale skutečně těšíme a trochu nás v tomto směru mrzí fakt, že je na Intel vyvíjen ze strany konkurence malý tlak, to jsou 45nm pro běžné lidi – níže taktované procesory Yorkfield a hlavně dvoujádrové Penryny: Wolfdale. Snad se 45nm Core 2 Duo a Core 2 Quad dočkáme už v lednu a ve stejnou dobu už bude pomáhat tlačit ceny dolů konkurence v podobě AMD Phenomu.

ICTS24

Za zapůjčení procesorů do testu děkujeme společnosti Intel.