Computex 2008: Nehalem poprvé otestován

6. 6. 2008

První test Nehalemu

Na úvod si osvěžme paměť a zopakujme si základní specifikace o prvních procesorech architektury Nehalem, pojmenovaných Bloomfield. Jedná se o čtyřjádro, jehož výpočetní jednotky vycházejí z architektury Core, ale nově je v procesoru integrovaný paměťový řadič (tříkanálový pro DDR3) a starou sběrnici FSB nahradil modernější QuickPath. Pokroky jsou to tedy velmi podobné, jako učinilo AMD u K8 oproti K7. Nehalem má ještě jednu perličku navíc, a sice podporu HyperThreadingu.

Anandtech a první nezávislý test

Redaktorům serveru Anandtech se podařilo na Computexu ukořistit vzorky Bloomfieldu na dostatečně dlouhou dobu, aby na nich mohli provést zběžné testy. Mluvím v množném čísle, protože skutečně měli procesory dva.

Nejdéle měli k dispozici model běžící na 2,66 GHz a tento kousek byl tedy podroben testům.

CPU-Z detekuje, že Bloomfield má čtyři jádra a dokáže zpracovávat osm vláken zároveň. Taktéž Windows vidí osm procesorů. Ačkoliv podle kolonek o sběrnici by se mohlo zdát, že Nehalem používá starou FSB na předpotopních 533 MHz, ve skutečnosti je 133 MHz pouze základní takt, ze kterého se přes násobič vypočítává výsledná frekvence procesoru. Všechny modely Nehalemu tedy poběží na násobcích 133 MHz.

Všimněte si také údajů, které CPU-Z zjistil o cache. Každé jádro má k dispozici 64kB L1 cache (z toho 32 kB pro data a 32 kB pro instrukce) a 32kB cache L2, podle oficiálních prezentací Intelu je to ale 256 kB a uznejme, že to dává větší smysl a zde se tedy CPU-Z s největší pravděpodobností mýlí. L3 cache je pak sdílená mezi všechna jádra a má kapacitu celých 8 MB. Uspořádání vyrovnávacích pamětí je tedy velmi podobné, jako u architektury AMD K10 (Phenom).

Bohužel, nikdo nebyl ochoten redaktorům půjčit použitelnou základní desku a museli použít raný vzorek, který měl problémy s PCI Express (takže nebylo možné provést testy ve 3D) a s vysokou latencí pamětí, takže se vůbec neprojevil rozdíl mezi jedním a třemi kanály. Nicméně, i tak se podařilo něco naměřit a rozdíl oproti minulé generaci byl více než znatelný.

Při kompilování map v testu od Valve je Bloomfield značně rychlejší, než stejně taktovaný Yorkfield (Core 2 Quad).

Tento graf má znázorňovat přínos HyperThreadingu u Nehalemu. Byly spuštěny dvě instance testu a měřilo se, kolik času navíc to procesorům zabere oproti jedné instanci. I když už víme, že Bloomfield je výkonnější, zde je vidět, že HyperThreading vylepšuje i škálování ve vícevláknových úlohách.

Vraťme se nyní ke cache pamětem, o kterých jsme mluvili již u screenshotu z CPU-Z. Následující tabulka srovnává latence Bloomfieldu a Core 2 Quad Q9450:

L1 cache je o něco pomalejší, L2 cache naopak rychlejší (také je daleko menší). L3 cache má zdánlivě vysokou latenci 39 cyklů. Jelikož starší procesory Intelu L3 cache nemají, pro srovnání musíme jít ke konkurenci. Anandtech píše, že K10 na 2 GHz má latenci L3 cache 43 cyklů. Přepočteno na skutečný čas v nanosekundách pak zpracování požadavku u K10 trvá téměř o polovinu déle.

Druhou testovací platformu s Bloomfieldem běžícím na 2,93 GHz a deskou, která netrpěla problémy s přístupem do operační paměti, měli redaktoři k dispozici jen velmi krátce, ale dost dlouho na to, aby provedli test paměťové propustnosti v Everestu. Jak vidíte v tabulce, třetí kanál má na výkon paměťového subsystému blahodárný vliv a díky integraci řadiče pamětí do procesoru klesly i latence.

Další testy výkonu si můžete projít přímo na Anandtechu. Já už se zastavím pouze u spotřeby. Ta oproti systému s Core 2 Quad narostla pouze o 10 %, což je v kontrastu s nárůstem výkonu o 20-50 % velmi dobré číslo. Subjektivním měřením je prý Bloomfield dokonce chladnější, než Core 2 Quad (což není vůbec nelogické, když má vlastně méně tranzistorů), hodně se ale zahříval severní můstek X58.

Co se šušká

Jak jsem už napsal v úvodu, také Fudzilla nás obdařila několika informacemi o procesorech architektury Nehalem.

Sbohem, nForce!

První je asi nejvíce šokující. Intel prý nenechá Nvidii nabízet čipsety pro Nehalem a Fudzille tuto informaci prý potrvdil sám Derek Perez, ředitel marketingového oddělení Nvidie, a několik dalších zdrojů u Intelu i jinde.

Intel a Nvidia na poli čipsetů jsou jako dva kohouti na jednom smetišti. Nvidia trvá na tom, aby podpora SLI zůstala proprietární pro její vlastní čipsety. Intel by ale moc rád podporoval SLI také – poté by mohl konkurovat Nvidii v jejích dosud výsostných vodách a zároveň by se mohl pyšnit titulem nejuniverzálnějšího řešení, neboť by na jeho čipsetech fungovalo jak SLI, tak CrossFire.

Podle starších zpráv (taktéž od Fudzilly) Intel Nvidii vydíral a požadoval licenci na SLI za licenci na QuickPath, Nvidia prý poté Intelu hrozila žalobou, někteří ale tvrdili, že to všechno jsou jen fámy a že Nvidia už licenci na QPI dávno má a zprávám z Fudzilly se jen směje. Fudzilla nyní tvrdí, že Nvidia licenci má, ale to Intelu nebrání v tom, aby jí v prodeji čipsetů zamezil.

Jak? Stačí, aby Intel dal Nvidii ochutnat trochu vlastní medicíny. Před několika lety, kdy ještě Athlony 64 vévodily všem testům a nForce byly nejlepší čipsety pro platformu AMD, přišla VIA s nadějným severní můstek K8T900. Nvidia ale pohrozila výrobcům desek, že pokud budou odebírat nové řešení od VIA, mohou na nForce (což byl daleko perspektivnější byznys) zapomenout. Nyní je Nvidia v opačné situaci – snad žádný výrobce motherboardů, který má všech pět pohromadě, se nevzdá čipsetů Intelu kvůli nForce a na to zřejmě Intel spoléhá.

Nebude Intel bit na tom, že jeho nejvýkonnější procesor nebude možno spárovat s nejvýkonnější grafickou platformou, kterou je právě SLI? Paradoxně nikoliv. Konkurenční Phenomy totiž neporazí ani zastarávající Core 2 Quad a tak si Intel může být jist, že zákazník toužící po maximálním výkonu vždy sáhne po procesoru z jeho stáje, ať už to bude Nehalem, či Core.

Nehalem s integrovaným grafickým jádrem

Podobně jako AMD, i Intel pracuje na procesorech s integrovaným grafickým jádrem a dočkat bychom se měli právě v generaci Nehalem (konkrétně jádro Havendale a jeho mobilní verze Auburndale, více o nich zde). To není nijak překvapivé a vlastně nijak překvapivá není ani informace, že grafické jádro bude umístěno na samostatném čipu a pod heatspreaderem tedy budou dva kousky křemíku.

Spekulovalo se, že podobný přístup použije i AMD u svého projektu Fusion, neboť procesory jsou vyráběny SOI výrobním postupem ve vlastních továrnách AMD (případně u Chartered Semi) a ATi vyrábí grafická jádra (i čipsety s IGP) jiným výrobním procesem u tchajwanských TSMC nebo UMC. Nedávno se ale AMD nechalo slyšet, že celý Fusion bude vyráběn v továrně AMD SOI technologií, tak se nechme překvapit.

Chladič pro Nehalem

Jelikož procesory do patice LGA1366 jsou větší, než ty současné do LGA775 (fotografie jsou v článku Anandtechu), potřebují i nový chladič. Fudzilla zveřejnila fotografii chladiče, který se nápadně podobá těm, které Intel momentálně dodává jako boxované pro Core 2, jen je poněkud větší:

Dodává ale, že toto není model, který se ke čtyřjádrům architektury Nehalem bude dodávat. Nicméně, vydání je stále ještě několik měsíců daleko, takže bychom neměli zavrhovat žádnou možnost.

USB 3.0 jen pro Intel

Tento střípek s Nehalemem přímo nesouvisí, nicméně když už jsme nakousli téma čipsetů, mohu snad přidat i tuto zprávu. Jelikož USB 3.0 vyvinul zejména Intel, má nad tímto standardem jisté pravomoce a údajně se rozhodl, že si vysokorychlostní USB nechá jen pro své čipsety a ostatním výrobcům jej licencovat nebude.

Otázkou je, zdali Intelu záleží na tom, aby výrobci periferií podporovali USB 3.0, nebo je ochoten technologii pohřbít kvůli lépe vypadajícím specifikacím. Pokud se nejedná o fámy, USB 3.0 by potkal stejný osud, jako například s DirectX 10.1 na grafických čipech ATi. Jelikož většinu trhu drží Nvidia, vývojáři se zdráhají standard podporovat. I tak je ale štítek DX10.1 na krabici Radeonů dobrým marketingovým tahákem.

To je zatím o Intelu a jeho Nehalemu vše. Zatím se můžete těšit na další zprávy z Computexu, kterými vás budeme v průběhu následujících několika dní zásobovat.

Zdroje: Anandtech, Fudzilla