Sandy Bridge – Llano od Intelu na 3,8 GHz

11. 2. 2010

Sdílet

 Autor: Redakce
  • AMD Llano je 32nm čtyřjádrový procesor s IGP přímo v procesoru, tedy to samé, co si tu představíme dnes, v zeleném podání.
  • Článek je zčásti stavěn na už známých a zmiňovaných informacích, zde si o Sandy Bridge můžete přečíst poměrně nedávnou novinku od Lukáše Fialy.

Asijské servery nedávno zveřejnily dva obrázky – die-shoty
čtyřjádrového procesoru architektury Sandy Bridge do patice H (LGA 1156). Jelikož na
jednom z nich byl i podrobný popis nastávajících procesorů, rozhodli jsme
se proto dosud získané informace o architektuře Sandy Bridge přehledně shrnout
do článku.

Tick-tock: plán válcování konkurence až do 2017

Zdroj obrázku: CanardPC

Do úvodu známý obrázek populárního „tick-tock“ principu,
který Intel dodržuje takřka s železnou pravidelností. Od architektury Core
(„tock“, nová architektura na starém 65nm výrobním postupu z Q4 2006) tu
je patrné jen jednokvartálové zpoždění, způsobené pozdním nástupem
architektury Westmere („tick“, stará
architektura na novém 32nm výrobním procesu z Q1 2010).

  • O novinkách v architektuře Westmere se dočtete zde.

Nyní máme před
sebou další „tock“, novou architekturu Sandy Bridge
. Ta bude později převedena
do zmenšené a mírně zdokonalené Ivy Bridge a poté budeme stavět zase na novém
22nm Haswellu. Čistě teoreticky by šlo dodržet „tick-tock“ až do roku 2017, do
inovace 11nm architektury.

Zdroj obrázku: PC Watch

Die-shot z PC Watch toho příliš neukáže. Vidíme čtyři
jádra, obdélníkový tvar procesoru, GPU integrované přímo v procesoru a
řadič PCI Express. GPU je možná propojeno s L3 cache. Pojďme se podívat
raději na další, podrobnější obrázek z HotHardware, který je už nových
informací plný:


Zdroj obrázku: HotHardware

Kromě rozmazaného pohledu na velký monolitický čip se čtyřmi jádry a IGP tu máme popisky včetně frekvencí GPU i CPU, velikosti cache a další vysvětlivky. Čtyřjádrový procesor s IGP se s 32nm výrobou vešel
do plochy 225 mm², je tedy menší, než například jádro Bloomfield (264
mm²). TDP tohoto výkvětu má být pouhých 85 W. Pojďme se na tyto i jiné dosud
získané informace podívat pěkně pohromadě:

Procesor: 4 (8)× 3,8 GHz jen v patici H (LGA 1156)

Jádra procesoru by měla být od Core/Penrynu/Nehalemu/Westmeru
hlavním terčem vylepšení. Výkon na takt by měl podle různých zdrojů vzrůst. Jádra
mají ovšem stále hrubý základ v architektuře Core. Vzhledem k tomu, že podle HotHardware mají nová mainstreamová čtyřjádra do LGA 1156 pracovat na
frekvencích 3,0-3,8 GHz, dá se ale očekávat, že nárůst výkonu na takt nebude
nijak obrovský, když Intel tolik zapracoval na vyšších taktech.

Ti, co tvrdí, že LGA 1156 je mrtvá platforma bez budoucnosti, pravdu ještě nějaký čas mít nebudou, opravdu velmi
rychlá čtyřjádra tu budou už za rok, dvoujádra přijdou pravděpodobně také někdy
v tomto období. U LGA 1366 zůstanou nejspíše šestijádra a osmijádra.
Zatím nevíme, zda nebudou nové procesory vyžadovat nové čipsety šedesátkové
řady.

Druhý pohled (Lukáš Fiala):

Sice se o tom nikde vyloženě nepíše a Intel rozhodně není v takovém konkurenčním tlaku, aby musel nutně inovovat, nicméně se domnívám, že hlavní změny se u Sandy Bridge odehrají právě ve výpočetních jádrech. Jestliže použité platformy, sběrnice a integrované řadiče přebírá Sandy Bridge od Nehalemu a Westmere, pak by se s výpočetními jednotkami vycházejícími z Core jen stěží dalo hovořit o nové architektuře. Vylepšení v jádrech ostatně naznačují i nové instrukce AVX (viz dále).

Na druhou stranu nelze očekávat změny tak radikálního rázu, jako mezi NetBurstem (Pentium 4/D) a Core. Tehdy šlo o posun paradigmat, podle kterých se procesory navrhovaly – namísto frekvence bez ohledu na spotřebu se prioritou stal poměr výkon/watt. A tento princip z módy ještě nevyšel a hned tak nevyjde, takže nové jádro se zřejmě nebude navrhovat úplně od píky.

Podpora Hyper-Threadingu či Simultaneous Multi-Threadingu tu
zůstává, jádro procesoru zvládá v jednom taktu teoreticky pracovat až na
čtyřech operandech a dvou vláknech, v LGA 1156 tak zůstává osm logických
jader, v LGA 1366 jich nově bude až šestnáct.

Integrovaný paměťový řadič bude podporovat paměti DDR3 na
frekvenci až 1600 MHz, opět záleží na použité patici, zda dvoukanálově, na
128bitové sběrnici (LGA 1156), či tříkanálově na 192b dálnici (LGA 1366).
Sdílená Enhanced Smart Cache L3 má velikost 8 MB, dále má každé jádro
k dispozici 256 kB L2 a 32+32 kB L1 pro data a instrukce. Tyto části patří
sice mezi uncore, tématicky je však řadím k procesoru.

Co dovede AVX a AES-NI

Lukáš Fiala v novince ze srpna/augusta 2008:

Intel už dříve prozradil, že v budoucnu přestane vylepšovat
instrukční sadu SSE, jelikož ji nahradí nová AVX (Advanced Vector Extensions). Zatímco
starší procesory obsahovaly SSE jednotku s XMM registry o šířce 128 bitů, AVX
navyšuje šířku na 256 bitů. Laicky řečeno (a v jednoduchých operacích to tak
opravdu je) může AVX jednotka pracovat s dvojnásobkem hodnot naráz. Na obrázku
vpravo nahoře je znázorněno mimo jiné sčítání dvou hodnot – takových operací
může AVX s 32bitovými čísly provést osm naráz (nenavazují-li výpočty na sebe).

AVX je nadstavbou SSE a všechny předchozí sady SSE jsou
v AVX obsaženy, takže programy zkompilované pro SSE nepřijdou zkrátka.
Mezi novými instrukcemi v AVX jsou například takové, které pracují se třemi
nebo čtyřmi operandy – díky nim lze některé složitější výpočty provádět efektivně.

Sada instrukcí AVX by měla být jedním z nejdůležitějších a výkonově nejvýznamnějším vylepšení jader oproti starším generacím.

Novým procesorům neschází ani podpora šesti šifrovacích
instrukcí AES-NI, přítomných nově ve Westmere, které využijete zejména při
šifrování dat a internetových přenosů.

Na novém IGP si zahrajete skutečně cokoli

Asi nejdříve nás „zlevačtoucí“ zaujme na obrázku
z HotHardware zřejmě veliké grafické jádro. To je převedeno na 32nm proces a
integrováno do procesoru, není už jen samostatným velkým čipem vedle jádra.


S hustotou integrace 45nm by bylo GPU odhadem podobné
dnešnímu GMA HD, integrovanému ve všech dvoujádrových Core i3, i5 a i7.
Frekvence jádra byla přibližně zdvojnásobena, od dnešních 533–766 (či ojediněle
900) MHz. Zpráva, že IGP v Sandy Bridge bude přibližně dvakrát výkonnější
než IGP ve Westmere, by společně s danou frekvencí odpovídala faktu, že EU
(Execution Units) bude stále 12. Intel ostatně nemá důvod navrhovat od základu
nové jádro s jiným počtem EU. Jádro bude tedy prakticky stejné, až na tři
hlavní věci:

  • Frekvence IGP se bude pohybovat kolem 1000–1400
    MHz. To se projeví průměrně přibližně 100% nárůstem hrubého výkonu GPU.
  • GPU bude propojeno s L3 cache a přes ni
    bude komunikovat s paměťovým řadičem, který nově podporuje rychlejší paměti.
    Jako hlavní výhoda dedikovaných grafik oproti integrovaným se vždy udávala
    samostatná rychlá paměť na široké sběrnici připojená přímo na GPU, jak se zdá,
    toto už nově nebude pravda. Nízkolatenční přístup do rychlé RAM by měl podpořit
    výkon grafiky především ve hrách s většími texturami na větším rozlišení.
  • Grafické jádro bylo posunuto o plný stupeň výrobního
    procesu dolů, což ho nejen zmenšilo, ale zejména snížilo i jeho spotřebu. Vzhledem
    ke značnému zrychlení frekvence ale nečekejte příliš extrémní změny k lepšímu.

Dvojnásobný, místy i několikanásobný výkonový skok nás čeká
ve hrách. I GMA HD dovede v nízkém rozlišení hratelně vykreslovat
nejnovější díl Call of Duty, na nových procesorech tak budete moci bez
diskrétní grafiky hrát na nízké detaily už skutečně leccos. Akcelerace flashe a
různých typů HD videa se zdokonalí především ve větším počtu akcelerovaných RF.
Milovníci úsporných HTPC a notebooků budou nadšeni, automatické přepínání IGP a
dedikované grafické karty za chodu systému tu s námi se vší
pravděpodobností zůstane.

Co je vlastně „Sandy Bridge System Agent“?

Asi jediná nepopsaná uncore část je System Agent, respektive
severní můstek integrovaný opět v procesoru.

Ten bude obsahovat PCU, Power Controller Unit, kterou jsme
popisovali u Westmere. Tato jednotka má na starost řízení frekvence a napětí
jednotlivých jader. Nejenže v případě potřeby dovede přetaktovat procesor
na frekvence Turbo Boostu, zároveň dovede jednotlivá jádra, uncore čbásti a
dokonce i integrované GPU, pokud nejsou momentálně potřebné, zpomalovat či
zcela vypínat, dále dovede manipulovat s napětím všech částí procesoru a
samozřejmě i IGP. Otázkou je, zda budou zásahy do chodu IGP umožněny i na
desktopu, či pouze na mobilní platformě, jako je tomu u Westmere.


pokročilá správa energie, vypínání core i uncore částí, od Westmere zůstává

Dále v System Agentu najdete různé sběrnice. Přes
1156pinový kontakt vedou sběrnice PCI Express 2.0 a DMI 2.0 (5 GT/s). Možná je
nezmíněný FDI, Flexible Display Interface, pro přenos obrazu do portů na desce.

Závěr – co nás čeká?

Sečteno a podtrženo, zhruba za rok hodlá Intel na trh uvést 32nm
čtyřjádra na frekvencích méně či více přes 3 GHz. Výkon na takt od
Nehalemu/Westmeru mírně vzroste, spotřeba a její správa se naopak malinko
zlepší (oproti Bloomfieldu či Lynnfieldu), TDP klesne na nádherných 85 W. Procesory budou mít instrukční sadu
AVX, tedy vylepšený a rozšířený soubor všech prozatímních SSE, instrukce AES-NI
a budou podporovat Hyper-Threading i Turbo Boost. Přímo v procesoru bude
integrováno silné 32nm IGP, propojené s 8MB L3 cache procesoru. Procesory
se budou vsazovat do LGA 1156, stejně tak jejich dvoujádrové verze.

ICTS24


Core i5-750 byl podle vás nejúspěšnější procesor roku 2009. Nová čtyřjádra pro stejný socket možná budou více než zajímavým upgradem.

Do LGA 1366 budou nejspíše dostupná šestijádra a
osmijádra, která budou mít mimojiné tříkanálový řadič pamětí a nebudou
obsahovat IGP.