Core i7-920 D0, X58A-UD5, HyperThreading a OC

18. 2. 2010

Sdílet

 Autor: Redakce

Při aktualizaci testovací sestavy jsem vystřídal celkem čtyři základní desky s čipovou sadou X58, tři různé procesory Core i7-920 i čtyři rozdílné sady pamětí DDR3. Tento článek tak vznikl trochu jako vedlejší produkt mého zkoušení všemožných možností, přesto věřím, že mé podělení se o zkušenosti pomůže dalším uživatelům Nehalemů ušetřit hodiny laborování a ověřování si možností a kombinací na vlastní pěst.

Hlavními hrdiny článečku jsou

  • procesor Intel Core i7-920 (Bloomfield, D0, 2,66 GHz)
  • základní deska Gigabyte GA-X58A-UD5, F3
  • chladič procesoru Scythe Mugen 2

Ve vedlejších rolích potom vystupují

  • paměti Kingston DDR3-1866 (1 GB, 1,5 V), DDR3-1600 (2 GB, 1,7–1,9 V), DDR3-2000 (1 GB, 2,0 V)
  • operační systémy Windows Vista a 7 Ultimate, 64-bit
  • zdroje Corsair CMPSU-650TX a Gigabyte Odin GT 800W
  • grafické karty Nvidia GeForce GTX 280 a Sapphire Radeon HD 5870
  • pevné disky WD5000KS a WD3000GLFS
  • zásuvkový wattmetr FK Technics
  • prográmky CPU-Z 1.53.1, RealTemp 3.00, CPUID Hardware Monitor, Prime95 25.9

Platforma LGA 1366 nejdříve ze svého lesku po nástupu Lynnfieldu (především Core i5-750, ale i i7-860) hodně ztratila, nyní však znovu získává na atraktivitě. Blíží se uvedení Gulftownu, šestijádrového Nehalemu, od něhož nikdo nečeká nic jiného než pozici nejvýkonnějšího desktopového procesoru a platforma LGA 1156 ukázala s nástupem rozhraní USB 3.0 a SATA 6 Gb/s svá úzká hrdla.

Pro LGA 1366 má stále monopol jediná čipová sada a tou je X58 Express (Tylersburg). Díky tomu, že na deskách s X58 je typicky přítomna podpora jak CrossFireX, tak SLI, jedná se v souladu s vysokým výkonem procesorů Core i7-900 a celkem 40 PCI Express 2.0 linkami o ideální platformu pro testování grafických karet. Jižním můstkem je osvědčený ICH10R, určitě se dá tedy využít i pro vcelku obecně platné testy HDD a SSD. Pouze ten, kdo by prahnul po 3-way SLI, v němž by každá grafická karta měla svých plných šestnáct PCIe 2.0 spojů, musí hledat desku obohacenou o nForce 200. Standardní X58 v 3-way Multi-GPU režimu nabídne 16+16+8.

D0 je lepší než C0, ale není C0 jako C0

Vraťmě se ale k cíli článku: snadnému přetaktování, se vzduchem a s rozumem. Práci cvičené opičky zkoušející všemožná nastavení a následně stabilitu jsem v minulých dnech odvedl za vás, budete se moci odrazit od těchto zkušeností. Kromě základní desky samozřejmě hodně záleží na procesoru. U LGA 1366 zřejmě drtivá většina uživatelů přemýšlí snad o jediném procesoru, který by se dal považovat ještě za cenově dostupný: Core i7-920.

Bloomfield na frekvenci 2,66 GHz (s Turbem může do určité zátěže mít o 133 až 266 MHz více) můžete potkat ve dvou revizích: C0, která tu byla od uvedení Nehalemů, a novější D0. Nová revize přinesla povětšinou běh s nižším napětím a ruku v ruce s tím i nižší spotřebu, zahřívání a samozřejmě rezervu pro přetaktování. Procesor se liší kus od kusu však i v rámci revize. Takto nastavují automaticky napětí desky Gigabyte X58 pro tři zkoušené Core i7-920:

  • C0, ES, 1,20 V
  • C0, produkční, 1,325 V
  • D0, ES, 1,25 V

Když jsme v listopadu 2008 poprvé testovali prvně zmíněnou revizi C0 v desce Asus P6T Deluxe, bylo jí dokonce nastaveno napětí 1,15 V. Je zajímavé, že ačkoli třeba i Gigabyte GA-X58A-UD7 nastaví této revizi C0 klidně 1,200 V pro zátěži, v režimu idle napětí i s veškerými zapnutými funkcemi (C1E, i další možné C-state až po 6) klesá jen zhruba na 1,136 V. Jediná vyzkoušená revize D0 běžela v zátěži sice s napětím skoro 1,25 V, zato v idle hlásil CPU-Z už jen 0,912 V.

Přetaktování zmíněné povedené C0 a nové (mezi svými zřejmě průměrné) D0 ale už na stejné úrovni tak docela není. Druhá,  C0 získaná už jako běžný prodejní kus potřebovala pro stabilní běh na 20× 166 MHz (+ Turbo) zvýšit napětí už na 1,4 V a uchladit takový procesor s vyšším přetaktováním přestává být úloha pro vzduchový chladič. Pamětníci si možná vzpomenou, že náš první Core i7-920 (C0, ES) chvíli okupoval první příčky overclockerské databáze Ripping.org. Do doby, než přišly lepší výsledky s kapaným dusíkem a lepší kusy těchto procesorů. Tehdy jsme díky Turbo Boost (+ dva kroky při zátěži jediného jádra) byli schopni dosáhnout této validace:

Co bylo ale horší, oněch 20–22 × 190 MHz BCLK bylo dosaženo s dost složitým nastavením v BIOSu:

Mezitím ale doba pokročila, objevila se nejen revize D0, zjistil jsem, co všechno v BIOSu můžu klidně nechat být a i desky prodělaly nějaký vývoj. Vždyť jen mnou dosud používaná Gigabyte EX58-UD5 má už BIOS s označením F10 a po několika testech musím jednoznačně říci, že co do stability a chování se při přetaktování není ani s BIOSem F10 na úrovni nové X58A-UD5.

Oproti zavedeným pravidlům nemusíte v nastavení vlastností procesoru vypínat takřka žádné úsporné funkce: deska je při určitém přetaktování BCLK vypne (pro zkušené uživatele bohužel) v podstatě sama. Vypnul jsem jen mnou nevyužívanou virtualizaci (VT-x). A pro zjednodušení popisování, na jakých frekvencích vlastně jsme a také pro omezení dalšího trochu náhodného prvku při pozdějších recenzích grafik na sestavě i Turbo Boost. Ten u Bloomfieldu stejně není tak podstatný jako u Lynnfieldu nebo mobilního Arrandale.

Tři, čtyři nastavení a je to

Následující série screenshotů vám sice ukazuje všechna možná nastavení, ale pro to, abyste v případě tak Core i7-920 (D0) dosáhli myslím velmi slušného přetaktování z 2,66 GHz (20× 133 MHz) na 4,00 GHz (20 × 200 MHz) vám konkrétně u Gigabyte stačí změnit několik málo položek v první části BIOSu (M.I.T.):

Screenshot neukazuje jen změnu BCLK ze 133 na 200 MHz, tady je pro jistotu souhrn změn:

  • CPU Vcore navýšeno z 1,25 na 1,35 V
  • IOH Core z 1,100 na 1,200 V
  • Load-Line Calibration na Level 2

Poslední položka, tedy Load-Line Calibration (zmírnění Vdroop) má u nových desek Gigabyte s X58 tři polohy a její nastavení na Level 2 (nejsilnější kalibrace) je pro stabilitu kritická. Pokud necháte na Standard (= práce dle předpisů Intelu), nedostanete se se zmíněnou kombinací desky a nastaveného Vcore na 4 GHz ani zdaleka.

Navyšovat Vcore je už od nějakých 3,6 GHz (dosažených bez Turba) s takto průměrným kusem D0 pro stabilitu všech čtyř jader potřeba a navýšení napětí IOH o 0,1 V je na rozdíl od zvyšování napětí QPI opravdu potřeba. Quickpath Interconnect na 7,2 GHz (nejnižší násobič 36×, vůči BCLK) není nic, co by bylo třeba podpořit zvyšováním napětí. U Core i7-920 je sice základem 4,8 GHz, ale v Bloomfieldech Extreme Edition běhá QPI už v základu na 6,4 GHz.

A to je vše? Jen BCLK a tři další položky, z nichž jedna je pro mírně pokročilé uživatele takřka samozřejmá? Ano. Množství dalších napětí, pikosekundy u skew, vypínání C-state, síťovek a já nevím čeho ještě můžete pustit z hlavy a nechat to pro extrémní overclocking s kapalným dusíkem či héliem.

Paměti u Nehalemu moc neřešte

Nemluvil jsem ještě o dvou položkách nastavení M.I.T. a CPU Features. Jsou to paměti a HyperThreading. Zatímco u pamětí jsem nejdříve laboroval s přímo pro Nehalemy stvořenými DDR3-1866 (1,5 V, čtyři 1GB moduly) od Kingstonu, po zjištění stabilních nastavení procesoru jsem je vyměnil za 2× 2GB DDR-1600 (1,7 až 1,9 V) a 2× 1 GB DDR3-2000.

Chtěl jsem totiž v testovací sestavě mít nízké moduly nekolidující nijak s chladičem (ani neomezujícím jeho nasávání) a tyto už nepotřebujeme pro testy CPU a základních desek. Mohou se tedy uklidit do sestavy pro grafiky, kde ocením spíše 6 GB (snad, zatím má OS plus jedna spuštěná hra málokdy přes 2,5 GB zabrané RAM), než nějaké frekvence. A to nemluvím o tom, že Bloomfield pro vysokou propustnost nijak vysoké frekvence pamětí nepotřebuje a propustnost triple channelu potom stěží v desktopovém nasazení využijete.

Proč vám to píši: jelikož stačilo nechat multiplikátor pamětí na 6× namísto 8× a výsledných 1200 MHz efektivně s časováním 7-7-7-20 zvládnou s napětím pod 1,65 V i DDR3 moduly dělané pro vyšší napětí (ale vyšší frekvence) a navíc vůbec nevadí, že mám 6 GB v dual channelu (pro naprosto drtivou většinu úloh).

HyperThreading = dvě vlákna na jádro

A teď už k HyperThreadingu. Jak víte, tato technologie Intelu umožňuje efektivnější využití procesoru zpracováním dvou procesových vláken jedním jádrem, nebo chcete-li vytvořením dvojnásobku logických jader (než je jader fyzických). Operační systém tak například se čtyřjádrovým procesorem komunikuje jako s osmijádrovým, tuto technologii ale Intel zavedl už u Pentia 4 a setkáte se s ní třeba i procesoru Intel Atom. Zapnutí a vypnutí má v na svědomí červeně označená položka na screenshotu vpravo (ten vlevo ukazuje šikovně udělaný systém profilů BIOSu u Gigabytu):

HyperThreading z principu funkce pomáhá tam, kde dochází k vytížení procesoru více procesovými vlákny než je jeho počet fyzických jader, naopak se dá předpokládat, že nebude pomáhat anebo dokonce bude mít nějakou zbytečnou režii tam, kde kupříkladu jediná spuštěná aplikace na čtyřjádrovém procesoru má jediné vlákno.

Nejdříve se podíváme na HyperThreading z hlediska spotřeb a chlazení. U přetaktovaného i nepřetaktovaného procesoru (Turbo Boost vždy vypnut) jsem zkoušel pouze zapínat a vypínat HyperThreading a následně odečíst teploty z RealTemp po třech minutách v idle a po deseti minutách v Prime95 25.9 (In-place Large FFTs, čtyři vlákna pro procesor bez HT, osm vláken pro CPU s HT). Chladičem byl kilový Mugen 2 s pěti heatpipe a 12cm větrákem nastaveným na maximální otáčky:

Dvanáct stupňů u přetaktovaného procesoru v zátěži je poměrně dost, nyní ty stejné situace měřené tentokrát zásuvkovým wattmetrem (spotřeba celé sestavy):

HyperThreading by podle spotřeby a teploty mohl vypadat jako největší zlo na světě. I Mugen 2 má co dělat, aby procesor přetaktovaný na 4 GHz se zapnutým HT uchladil. Ale HyperThreading a jeho vliv na provozní vlastnosti je potřeba dávat do kontextu výkon, který přináší (či případně nepřináší):

Testované hry Crysis a Call of Duty 4 mají aktivní dvě až tři procesová vlákna, proto HyperThreading u čtyřjádrového Core i7-920 nemá žádný přínos (ale ani se příliš nemění spotřeba). Naopak výkonnostní nárůst v mnohavláknových testech jako třeba x264 benchmark anebo Paint.NET je díky HT velmi významný a samozřejmě se efektivnější využití CPU projeví i na spotřebě.

Až na výjimky, kdy si nějaká aplikace s HT vyloženě nerozumí (nějaké reporty negativního vlivu HT na některé hry na internetu najdete), se dá obecně konstatovat, že HyperThreading je věc užitečná. Jelikož budu tuto testovací sestavu používat pro grafické karty a SSD/HDD, nechám však HT zřejmě vypnut.

Offtopic: korektnost FurMarku a 2D takty GeForce GTX 280

Úplně poslední zastávku bych rád udělal u mého zjištění ohledně programu FurMark. V poslední recenzi grafické karty jsem po přečtení si stati na AnandTechu (viz odstavec pod grafy) dal už přednost raději měření spotřeby a zahřívání z BioShocku, ale nyní jsem zjistil, že AnandTechu možná v jeho odsouzení něco uniklo. Alespoň u karet Nvidia, která prý kód FurMarku detekují softwarově a výrazně v něm zpomalí (skoro na polovinu) a v teplotních testech (i testech spotřeby elektrické energie) jsou pak zvýhodňovány.

Co vám chci screenshotem ze zatěžované (Xtreme Burning Test, 1280 × 1024 px, Full Screen, bez post processingu, 4× MSAA) GeForce GTX 280 sdělit? První žlutá šipka ukazuje na snímkovou frekvenci. Ta je po spuštění FurMarku ale chvíli jen 23 fps. Po pár desítkách sekund (viz zlom v teplotách vyznačený druhou šipkou) se ale karta jakoby přepne na vyšší výkon a po celý zbytek zatěžování běží už na 37 fps. Oněch 87 stupňů Celsia na desce mimo skříň potom už v žádné hře nedosáhne a stejně tak spotřeba vychází oproti třeba BioShocku vůči Radeonům od ATI hůře. Vyvstávají tedy otázky: je detekce kódu a zpomalování u GeForce po nějaké chvíli vypnuto? Je to chování benchmarku? Pokud GeForce potom jedou opravdu naplno a Radeony HD 5000 mají hardwarovou ochranu (zpomalení při určitém zahřátí), je FurMark nekorektní pro srovnávání spotřeby a teploty grafik? Co si myslíte vy?

A o úplně posledním objevu ohledně přepínání GT200 do 2D taktů (tedy mnohými uživateli GeForce hodně proklínané věci) jsem se už podělil s uživateli diskuzního fóra EHW:

Když na GeForce GTX 280 připojené k CRT monitoru ponechám základních
1280 × 1024 px, 85 Hz, grafika se podtaktuje na 300/600/100 MHz
(core/SP/mem), ale jakmile vynutím 1280 × 960 px @ 100 Hz (monitor je
umí, ale Windows je v rámci Plug and Play ovladače stand. nenabízí), je
podtaktování už jen na 400/800/300 MHz a spotřeba samozřejmě o něco
vyšší (rozdíl je cca 12 W).

Při jakémkoli rozlišení (až do 2560 × 1600 px) LCD monitoru a 60 Hz jsou takty rovněž v pořádku. Možná by stačilo ale vynutit nějaké nestandardní rozlišení pro LCD TV či připojit další monitor a úspornost by podobně jako třeba u Radeonů HD 5800 byla také tatam.

Už ale opravdu zcela mimo téma bych vás chtěl upozornit na neustále se rozvíjející prográmek CPUID Hardware Monitor (HWmonitor), který existuje ve free i placené verzi. Největší zásluhu na podrobném reportování má zdroj Gigabyte Odin GT, který o sobě skrze USB prozradí opravdu hodně. Snad jen označení napěťových větví program z čipu ITE nečte úplně správně.

Za poskytnutí procesoru Intel Core i7-920 děkujeme společnosti Intel

Intel

Za poskytnutí testovacích pamětí DDR3 děkuji společnosti Kingston

Kingston

ICTS24

Za poskytnutí základní desky GA-X58A-UD5 a zdroje Odin GT děkujeme společnosti Gigabyte