Nejsilnější Bulldozer: recenze osmijádra AMD FX-8150

12. 10. 2011

Dva roky za plánem a dva roky před parniválcem

AMD by moc ráda navázala na nebývale úspěšné časy v začátcích architektury K8. Prvními zástupci kladiv (kódové označení bylo Hammer) byly tehdy Opterony, následovaly Athlony FX pro náročné uživatele desktopů a Athlony 64 jako cenově dostupnější zástupci. Zlatá léta AMD byla tedy spjata se jménem FX a do jisté míry i stavebnictvím. Nyní se americká procesorová dvojka vrací z hvězd znovu na zem, Stars a třeba i nějakou tu konkurenci odhrnou Bulldozery, jméno Phenom alespoň na chvíli zmizí v prachu veškeré té roboty, Athlony budou patřit patici FM1 s procesory pro méně náročné uživatele a současná AM3+ dostane první číslem doprovázené FX.

Vzpomínka na dobu hojnosti

Ano, FX a číslo. Takto stručně budou označováni první zástupci rodiny Bulldozerů. Desktopové verze prvních Bulldozerů jsou kódově označovány jako Zambezi, serverové pak jako Valencia a Interlagos (slepenec dvou osmijader). Když k Zambezi přidáte základní desku s čipsetem AMD 990FX (jižní můstek SB950) a do slotu PCIe osadíte Radeon 6800 nebo 6900, získáte tak platformu s označením Scorpio (předešlé platformy s Phenomy se jmenovaly Leo, Dragon a Spider). V novém názvosloví snad máme pořádek a nezbývá se podívat, co nového Bulldozery přinášejí.

Jestli jste náhodou loni v létě (ano, už je to celkem dlouho, co AMD o Bulldozeru veřejně a nahlas mluví) vynechali článek Bulldozer a Bobcat, dvě nové architektury AMD, pak pro vás zopakuji, že ačkoli zdánlivě osazujete stejně jako Phenom II vypadající procesory do stejné patice už existujících základních desek (musí to být AM3+), vnitřní návrh pojala AMD dost odlišně.

Bulldozer module

Jakýmsi základem procesorů AMD FX či jejich serverových bratrů není (jediné) procesorové jádro, ale dvoujádro. AMD mu říká Bulldozer module a každý takový modul kromě dvou x86 ALU sdílí dekodér instrukcí, jednotky pro predikci větvení kódu a skoků, L2 cache a FPU.

V konkrétním případě FX řady 8000 takovéto čtyři moduly sdílí velkou 8MB L3 cache, vnější sběrnici HyperTransport (16 bitů jedním, 16 bitů druhým směrem – znáte už od dob K8), severní můstek, paměťový řadič a jeho dva 72bitové kanály DDR3.

Osmi-, nebo taky čtyřjádro

AMD tak vytvořila zdánlivě sice první desktopový osmijádrový procesor, pokud by se ale některé sdílené prostředky staly úzkým hrdlem, bude výkon odpovídat spíše čtyřjádrovým CPU. Je to jakási alternativní cesta oproti HyperThreadingu známém u procesorů Intel (nejdříve Pentia 4, poté znovu u Nehalemu (Bloomfield) až k dnešním Sandy Bridge).

Zatímco u Intelu jde o implementaci zpracování dvou vláken současně jedním fyzickým jádrem CPU, u AMD jeden modul se dvěma „jádry“ pracuje se dvěma procesovými vlákny (thread). To by mělo Bulldozeru oproti přístupu Intelu poskytnout lepší možnosti škálování výkonu a předvídatelnosti chování, konkrétně také v případě jednovláknové zátěže bude výhodou to, že všechny jinak sdílené prostředky jsou tomuto „threadu“ plně k dispozici.

Další silnou stránkou Bulldozeru (a tentokrát už bez otazníku, jak to bude v praxi) jsou instrukční sady. V tomto ohledu nové FX bez diskuzí splňují přízvisko nejmodernější (x86 CPU) a podporují:

SSE 4.1 a 4.2
AVX (Advanced Vector eXtensions)
- až 256bitové spojením dvou 128b FP registrů
- AES-NI (pro často používané šifrování)
- FMAC (Fused Multiply-Accumulate) ve verzi se čtyřmi operandy (FMA4)
XSAVE
XOP

FMA4 má najít uplatnění v HPC (High Performance Computing) a v současnosti AMD pouze vytvořila OpenCL utilitku demonstrující urychlení s FMA4 při výpočtech s fraktály (Mandelbrot). Intel se k podpoře FMAC přidá zřejmě s generací Ivy Bridge.

Patice a modely

Vlastníte-li novější základní desku s paticí označovanou jako AM3+ s 942 otvory pro piny, nebudete muset kvůli přechodu na AMD FX investovat do nové. Zatím AMD samozřejmě doporučuje používat desky s čipsetem 990FX, ale takto platforma pro Bulldozery vymezena není. Bulldozer podporuje dva kanály pamětí DDR3 (1333–1866 MHz) a jižní můstek SB950 potom snad mimo USB 3.0 nabízí všechny možné sběrnice pro moderní PC.

Rodinka desktopových Bulldozerů není při startu nijak přehnaně košatá, vybírat ale už můžete mezi osmi-, šesti- a čtyřjádrovými procesory. FX-8150 má stát 245 USD (Core i5-2500K na newegg.com stojí 220 USD), FX-8120 205 USD, FX-6100 pak 165 USD (i5-2300 stojí 180 USD, Phenom II X6 1055T potom 150 USD) a nakonec FX-4100 bude za mořem k mání za 115 USD (i3-2100 je asi o 10 USD dražší). Jedná se o koncové ceny (retail) bez DPH.

Aktualizace - dnes dopoledne mi z Alfa.cz byly zaslány tyto ceny:
AMD FX-6100 (6core, 3.3GHz, 14MB, socket AM3+, 95W ) Box 3620 Kč
AMD FX-8120 (8core, 3.1GHz, 16MB, socket AM3+, 125W ) Box 4530 Kč

Základní frekvence 32nm technologií SOI vyráběných procesorů se pohybuje od 3,1 do 3,6 GHz, s maximálně zvýšeným násobičem díky Turbo Core potom od 3,8 do 4,2 GHz. Toto nemalé zvyšování frekvence pro situace, kdy nejsou plně vytížena všechna jádra, si zaslouží malou ilustrovanou zastávku.

Turbo Core se řídí podle TDP (Thermal Design Power) procesoru – dokud se příkon drží pod stanoveným TDP, může být aplikováno navýšení násobiče a třeba u modelu FX-8150 mohou klidně i všechna jádra pracovat na frekvenci nikoli 3,6, ale 3,9 GHz. Bude-li se jednat o zátěž pro méně vláken (jader), může být použito ještě vyšší Turbo – až 4,2 GHz. Naopak díky podpoře C1E a C6 se AMD daří dosáhnout dobrých výsledků příkonu v idle. Další úspory jsou dány sdílením části procesoru. Turbo Core máte do velké míry pod kontrolou i v AMD OverDrive (s Bulldozery pracuje verze 4.x):

Éra stavebních strojů začíná

Přestože už tak bylo nejen pro příznivce značky AMD, ale obecně pro všechny přející si zdravou a odvětví vpřed ženoucí konkurenci, čekání na Bulldozer nekonečné, dozvíte se hned při jeho uvedení o tom, že příští rok tu máte "Bulldozer refresh" alias Piledriver (nebudeme tedy hrnout, ale pro změnu bourat), za dva roky už bude AMD válcovat a třetí rok po uvedení FX bude ve znamení bagru.

V další kapitole vás už čeká trochu více praxe:

Fotografie testovacího kitu, parametry v tabulce

Parametry a tabulkové srovnání s dalšími procesory

V první kapitole jste mohli vidět čtyři základní modely řady AMD FX, ve skutečnosti už jich AMD ohlašuje více:

Pamatujete-li si ještě článek Marketing vyhnaný do extrémů: uniklá prezentace procesorů AMD FX, pak bohužel už můžeme potvrdit, že kritizovaná uniklá prezentace nebyl žádný podvrh, nýbrž i pro odborné novináře určené poučení od AMD (tehdy chyběla jen testovací konfigurace: 1, 2). Hned jeden z počátečních slajdů ukazuje zavádějící srovnání se současnými Intel Core i5 a i7 – Sandy Bridge:

Ne, že by všechno v něm nebyla pravda, Bulldozer opravdu pracuje na vyšších frekvencích, má obrovský součet velikostí L2 cache, novější instrukce či jako platforma více spojů pro PCI Express 2.0. Takovýmto srovnáním máme zřejmě nabít okamžitého dojmu, že nový produkt AMD je ve všech směrech lepší.

Výrobce	AMD	AMD	AMD	AMD	AMD	AMD
Řada	A8	Athlon II X4	Phenom II X4	Phenom II X6	FX	FX
Model	3850	645	980 BE	1090T	6100	8150
Frekvence	2,9 GHz	3,1 GHz	3,7 GHz	3,2 GHz	3,3 GHz	3,6 GHz
Turbo	–	–	–	3,6 GHz	3,6–3,9 GHz	3,9–4,3 GHz
Počet jader	4	4	4	6	6	8
Kódové označení	Llano	Propus	Deneb	Thuban	Zambezi	Zambezi
L1 cache	4× 128 kB	4× 128 kB	4× 128 kB	6× 128 kB	6× 16 + 3× 64 kB	8× 16 + 4× 64 kB
L2 cache	4× 1024 kB	4× 512 kB	4× 512 kB	6× 512 kB	3× 2048 kB	4× 2048 kB
L3 cache	–	–	6144 kB	6144 kB	8192 kB	8192 kB
FSB/HT/QPI	2 GB/s (UMI)	4 GHz (DDR, HT)	4 GHz (DDR, HT)	4 GHz (DDR, HT)	5,2 GT/s (HT)	5,2 GT/s (HT)
Násobič	29	15,5	18,5	16	16,5	18
Výrobní proces	32 nm	45 nm SOI	45 nm SOI	45 nm SOI	32 nm	32 nm
Velikost jádra	224 mm²	169 mm²	258 mm²	346 mm²	315 mm²	315 mm²
Počet tranzistorů	~1 mld.	~300 milionů	758 milionů	904 milionů	~2 miliardy	~2 miliardy
TDP	100 W	95 W	125 W	125 W	95 W	125 W
Patice	FM1	AM3	AM3	AM3	AM3+	AM3+
Výrobce	Intel	Intel	Intel	Intel	Intel	Intel
Řada	Core i3	Core i7	Core i5	Core i5	Core i7	Core i7
Model	2100	870	2300	2500K	2600K	980X
Frekvence	3,1 GHz	2,93 GHz	2,8 GHz	3,3 GHz	3,4 GHz	3,33 GHz
Turbo	3,1 GHz	3,6 GHz	3,1 GHz	3,7 GHz	3,8 GHz	3,6 GHz
Počet jader	2 (4)	4 (8)	4	4	4 (8)	6 (12)
Kódové označení	Sandy Bridge	Lynnfield	Sandy Bridge	Sandy Bridge	Sandy Bridge	Gulftown
L1 cache	2× 64 kB	4× 64 kB	4× 64 kB	4× 64 kB	4× 64 kB	6× 64 kB
L2 cache	2× 256 kB	4× 256 kB	4× 256 kB	4× 256 kB	4× 256 kB	6× 256 kB
L3 cache	3072 kB	8192 kB	6144 kB	6144 kB	8192 kB	12 288 kB
FSB/HT/QPI	20 Gb/s	2,5 GT/s	20 Gb/s	20 Gb/s	20 Gb/s	6,4 GT/s
Násobič	31	22	28	33	34	25
Výrobní proces	32 nm high-k	45 nm high-k	32 nm high-k	32 nm high-k	32 nm high-k	32 nm high-k
Velikost jádra	131 mm²	296 mm²	216 mm²	216 mm²	216 mm²	248 mm²
Počet tranzistorů	504 milionů	774 milionů	995 milionů	995 milionů	995 milionů	1180 milionů
TDP	65 W	95 W	95 W	95 W	95 W	130 W
Patice	1155	1156	1155	1155	1155	1366

Ale ta krásná plechovka…

Pozdě, ale přece. Pondělí dopoledne bylo časem obdržení velké černé krabice od AMD, takřka vzápětí mi byla doručena deska Gigabyte 990FXA-UD7 s v patici osazeným šestijádrovým AMD FX-6100. Jelikož jsem věděl, že díky zvolení do kitu bude většina prvních recenzí AMD FX dělána na Asus Crosshair V Formula, rozhodl jsem se svět alespoň trochu informačně obohatit o výsledky právě na 990FXA-UD7. Navíc se jedná o srovnatelně kvalitní řešení, obě desky představují špičku pro Bulldozer.

AMD FX-8150 můžete tedy vidět naopak osazen v Crosshairu – takto byl v kitu přepravován. Na obou procesorech byla znát přinejmenším jedna výměna chladiče. Do kitu AMD přibalila ještě velikánskou přezku se štírem a už provařenou plechovku se zobrazením procesoru FX.

HWiNFO, CPU-Z, testovací konfigurace, návod pro interaktivní grafy

Testovací sestavy a konfigurace

AMD FX (AM3+) byly otestovány s konfigurací:

základní
deska: Gigabyte 990FXA-UD7, BIOS F6e
paměti: 2× 2 GB Exceleram DDR3-1333, 1,5 V (nastaveny na 1333-8-8-8-24-1T)

Pro procesory patice FM1 máme tuto sestavu:

základní
deska: MSI A75MA-G55
paměti: 2× 2 GB Exceleram DDR3-1333, 1,5 V (nastaveny na 1333-8-8-8-24-1T)

Platforma LGA 1155 byla zastoupena konfigurací:

základní
deska: Intel DP67BG (Burrage)
paměti: 2× 2 GB Exceleram DDR3-1333, 1,5 V (nastaveny na 1333-8-8-8-24-1T)

Pro
procesory AMD AM3 (Phenom II a Athlon II) byla
použita:

základní
deska: Gigabyte GA-MA790FXT-UD5P (AMD 790FX), BIOS F7 (F8c pro 1090T, F8k pro 1055T, F8m pro Athlon II X4 645)
paměti:
4× 1 GB Kingston DDR3-1866, 1,5 V (nastaveny na
1600-8-8-8-24-2T, 1,75 V)

Jádro
testovací sestavy pro platformu Intel LGA 1156 bylo
tvořeno těmito komponentami:

základní
deska: Gigabyte GA-P55A-UD4 (Intel P55), BIOS F11
paměti: 4× 1 GB
Kingston DDR3-1866, 1,5 V (nastaveny na 1333-8-8-8-24-1T,
pro Pentium G6950 potom na 1066-7-7-7-20-1T, 1,64 V)

Kvůli LGA 775 jsem oprášil tyto komponenty:

základní deska: Asus Rampage Extreme (Intel X48), BIOS 0501
paměti: 4× 1 GB Kingston DDR3-1800, 1,9 V (nastaveny na 1333-8-8-8-24-1T, u Pentia DC na 1066-7-7-7-1T)

U
Bloomfieldu a Gulftownu pak
takto:

základní deska: Gigabyte GA-EX58-UD5 (Intel X58), BIOS
F11
paměti: 3× 1 GB Kingston DDR3-1866, 1,5 V (nastaveny na
1333-8-8-8-24-1T, 1,5 V u Extreme a 1066-7-7-7-20-1T u Core i7-920)

A
všechny platformy měly společné tyto komponenty:

grafická
karta: Nvidia GeForce GTX 280, 1024 MB
pevný disk: Intel X25-M Gen2, 160 GB (SSD)
zdroj: Corsair CMPSU-650TX
mechanika: Toshiba SD-H802A, HD DVD, DVD-ROM
chladič procesoru: Noctua NH-C12P, 1350 rpm
operační systém: Windows 7 Enterprise, 64-bit
ovladače
GPU: Nvidia ForceWare 196.21, GeForce PhysX: off

Za
zapůjčení základních desek EX58-UD5, P55A-UD4 a 790FXT-UD5P
děkujeme společnosti Gigabyte.

Za poskytnutí testovacích pamětí DDR3 děkujeme společnosti Kingston

Za poskytnutí chladiče Noctua NH-C12P a teplovodivé pasty Noctua
NT-H1 děkujeme
společnosti RASCOM Computerdistribution

Jak na interaktivní grafy 2.0

Pokud se vám nelíbí písmo se stíny, velmi snadno je vypnete v
Nastavení. Máte-li ještě problémy s rychlostí zobrazování, můžete v
Nastavení povypínat také animace.
V základním nastavení jsou pruhy
seskupeny dle úhlopříčky monitory a dále seřazeny dle naměřené hodnoty
(vzestupně, či sestupně
pak podle toho, je-li zrovna vyšší = lepší či naopak). Toto můžete
snadno změnit zvolením řazení dle naměřené hodnoty v testu, seskupením
třeba podle matrice apod.
Po najetí myší na některou z
položek (třeba na HP ZR24w) se z této stane 100 %
(základ) a ostatní položky se spočítají podle ní. Všechny absolutní
hodnoty se změní na relativní. Zpět se změní, až kurzor myši opustí
oblast s názvy položek (v tomto případě procesorů).
Budete-li chtít nějakou
položku (monitor) v grafech sledovat, můžete si její pruh libovolně
obarvit. Stačí klepnout levým tlačítkem myši na barevném pruhu a vybrat
si z palety. Máte-li povoleny cookies, mělo by vám nastavení vydržet i
pro další grafy v dalších kapitolách.
Cenu a další základní parametry (například rozlišení či úhlopříčku) můžete zobrazit kdykoliv v
každém grafu: stačí u vybraného procesoru najet kurzorem myši nad pruh s
hodnotou (měření) a chvíli počkat. Objeví se jako plovoucí nápověda (tooltip).
Zámek základu (monitor, který
se stane těmi 100 % a od něhož se odvíjí další relativní hodnoty)
aktivujete pomocí současného stisku klávesy CTRL a levého tlačítka myši
nad procesorem (či jeho pruhem v grafu), který chcete uzamknout.
Před prvním použitím grafů si
pro jistotu vyprázdněte cache prohlížeče (zřejmě bude stačit refresh) a v případě problém smažte i příslušné cookies.
Interaktivní grafy 2.0 jsou
kompatibilní s prohlížeči Firefox (testovány verze 4.x), Opera
(testováno s 11.x), Internet Explorer 8 a 9 (verze 7 a starší už nejsou
podporovány) a Chrome (zde mají tooltipy hranaté rohy namísto kulatých).
V případě problémů se nejdříve
ujistěte, že máte v prohlížeči povoleny skripty i cookies, dále splnění
bodů 7 a 8, teprve potom nám chybu prosím co nejpřesněji reportujte.
Jedná se o první ostré nasazení grafů, takže i přes delší testování
autorem a redakcí při komplexnosti aplikace určitě ještě nějaké mouchy v
nějaké kombinaci objevíte.

Zasloužená reklama:

Autorem enginu interaktivních grafů na ExtraHardware je Lukáš Prvý, který opravdu umí v makrech pro Office (VBA), JavaScriptu, XHTML a asi i v lecčems dalším neuvěřitelné věci v
krátkém čase. Budete-li na váš web potřebovat nějakou skutečnou vyšší
dívčí, můžete jej už teď kontaktovat na e-mailu LukasPrvy(zavináč)email.cz

Video

x264 benchmark

x264 benchmark testuje výkon procesoru při převodu videa v
rozlišení 720p s použitím kodeku H.264. Benchmark je ke stažení na TechARP.com,
používáme výsledky z náročnějšího druhého průchodu.

VirtualDubMod + DivX 6.8.4

VirtualDubMod slouží pouze jako rozhraní pro převod 400MB
souboru MPEG-2 (.VOB) ve standardním DVD rozlišení do .AVI s kodekem
DivX. Experimentální podporu SSE4 necháváme vypnutou, volba Enhanced
multi-threading je naopak zapnuta. Předvolen je profil Home Theater a
kvalita Balanced.

VirtualDubMod + XviD 1.2.2

I XviD už v novějších verzích podporuje práci na více jádrech procesoru.

Windows Media Encoder 9

1TB full HD video pořízené Frapsem ve hře Empire: Total War je převáděno do WMV9 720p, 5,5 Mb/s.

PCMark Vantage

Následující
dva testy jsou spouštěny současně (multi-tasking):

Následující dva testy jsou spouštěny současně
(multi-tasking):

Průměrný výkon v testech převodu videa

Hudba

WAV do MP3: LameEnc 3.97 a 4.0a

Jeden rozměrný soubor ve formátu WAV je pomocí kodeku LameEnc
převáděn do souboru formátu MP3.

Nero AAC

Ten samý WAV je pomocí prostřednictvím volně stažitelného kodeku Nero AAC převáděn do MP4 (AAC).

FLAC

Převod několika větších WAV do bezztrátového FLAC je rychlou záležitostí, zvláště na vícejádrových procesorech. Jako frontend pro převod používám Foobar 1.0.

PCMark Vantage

Následující
tři testy jsou spouštěny současně (multi-tasking):

Průměrný výkon

Do průměrného výkonu v testech práce se zvukem (či hudbou, chcete-li) je počítán pouze jeden test LameEnc.

Bitmapová grafika, fotografie

Paint.NET

Pro testování výkonu ve volně šiřitelném bitmapovém editoru
používáme rozhraní TPUbench a benchmark PdnBench.

Zoner Photo Studio 13 x64

ZPS 13 je oproti verzi 12 důslednější ve využití více procesových vláken. V jednom sub-testu jsou prováděny
dávkové operace nad 56 fotografiemi ve formátu JPEG, v dalším je
převáděno 96 fotek ve formátu RAW (CR2 z přístroje Canon a Adobe DNG z
DSLR Pentax) do JPEG.

RawTherapee 3.0a

Volně stažitelný program pro práci s fotografiemi ve formátu RAW toho umí překvapivě hodně, s výkonnostními optimalizacemi je už na tom hůře.

Autopano Giga 2.0.6

Fantastický program pro automatizovanou tvorbu panoramat umí využít až 16 procesových vláken a je schopen zapojit i GPU (k testování procesorů této možnosti nevyužívám). Pro tříjádrový Athlon je rychlejší zvolit čtyři procesy (namísto dvou), pro šestijádrový Phenom pak osm. Naopak šestijádrový Core i7-980X s HyperThreadingem běží rychleji s osmi vlákny a nikoli s šestnácti (mezistupně, jako třeba tři, šest anebo dvanáct vláken program nenabízí).

AutoStitch

AutoStitch sice není tak dokonalý jako Autopano Giga, ale také nestojí 260 EUR (demo bylo svého času zcela zadarmo) a popravdě je na automatickou tvorbu panoramat schopnější než třeba Zoner Photo Studio.

Everest PhotoWorxx

Jakýsi dílčí test výkonu procesoru při práci s fotografiemi nabízí i Everest. Už dříve jsem si všiml, že nemá rád tříjádrové procesory (u starší verze test snad ani nedoběhl), dnes na tří- a šesti- jádrech běží pomaleji než na dvou- a čtyřjádrech (poměrně).

Průměrný výkon

Kapitolu zakončí opět sumarizační graf, do něhož není počítán jen PhotoWorxx z Everestu.

Rendering

3Ds Max 2011

Postup měření v 3Ds Max (Design) 2011 je popsán v tomto článku. Vaše výsledky můžete ukázat a s dalšími konfiguracemi srovnávat zde: 3Ds Max (Design) 2011 s mental ray – vaše výsledky.

Frybench

Postup měření v programu Frybench je popsán v tomto článku. Vaše výsledky můžete ukázat a s dalšími konfiguracemi srovnávat zde: Frybench – výsledky.

Cinebench R11.5

Poslední verze benchmarku výkonu v Cinema 4D. Opět se podíváme i na výkon s jediným vláknem a na poměr mezi single/multi threaded výkonem.

Cinebench R10

Cinebench je benchmark snažící se nastínit výkon procesorů při
renderingu v CAx programu Cinema 4D společnosti Maxon. Používáme x CPU
benchmark (vícevláknový).

POV-Ray v3.7

Beta verze freeware raytraceru POV-Ray umožňuje využít vícejádrové
procesory. Pro testy používáme jednu ze scén mezi příklady dodanými s
programem: chess2.pov a rozlišení 800 × 600 px bez anti-aliasingu.

Blender 2.48

Pro testování v 3D modeláři Blender používáme standardní nastavení
a model flyingsquirrel.blend.

Průměrný výkon

Shrnující graf je spočten z obou testů Cinebench, Blenderu, POV-Ray, Frybench i 3Ds Max 2011.

Aplikační výkon v testech PCMark Vantage, multi-tasking

PCMark Vantage

PCMark Vantage prověří celý počítač a je to tzv. polosyntetický
benchmark. Obsahuje fragmenty skutečných aplikací, renderuje například
webové stránky v prohlížeči s více záložkami, pracuje hromadně s fotkami
a občas některé činnosti dělá současně. Zejména u nejsilnějších procesorů současnosti už nejsou jeho výsledky zcela spolehlivé a kolikrát nepomůže ani trojité opakování (a buď průměrování, či braní nejlepšího výsledku). Celkové skóre PCMarku Vantage je hodně ovlivněno tím, jak se „pevný disk“ zrovna vyspí, mnoho jeho dílčích (a hlavně multi-taskingových) testů však považuji stále za dobré.

Následující dva testy jsou spouštěny současně (multi-tasking):

Následující tři testy jsou spouštěny současně (multi-tasking):

Komprese souborů a šifrování

WinRAR

7-zip

WinZIP 14.5 + AES

Extrakce 200MB zaheslovaného archivu ZIP (šifrování AES).

Zlib (Everest)

Jeden dílčí test komprese souborů nabízí i Everest:

SiSoft Sandra – AES a SHA

PCMark Vantage

TrueCrypt 7

Testy pochází z integrovaného benchmarku (Tools, Benchmark), nastaveno 100 MB.

Při zprůměrování osmi dílčích testů TrueCrypt dostaneme tento shrnující graf:

Průměrný výkon

Do celkového výkonu v této části je TrueCrypt započítán jen jednou (jeho celkový průměr, viz graf nad tímto odstavcem).

Prvočísla, PI, šachové úlohy, fraktály, MIPS, FLOPS, MMX/SSE, .NET

Fritz Chess

Benchmark simulující počítání šachových kombinací skutečného
šachového programu Fritz.

Everest 5.3, CPU Queen

Především diagnostický nástroj Everest obsahuje i několik
syntetických benchmarků, čistě procesorový CPU Queen či výpočty
fraktálů.

SiSoftware Sandra

Sandra obsahuje několik modernizovaných verzí základních benchmarků procesorů (Dhrystone, Whetstone apod.) i .NET verze těchto prověrek ALU i FPU.

wPrime 2.0

Vícevláknová obdoba jednoduchého benchmarku SuperPI (samozřejmě se
nepočítá Ludolfovo číslo, ale prvočísla).

SuperPI mod XS 1.5

Výpočet Ludolfova čísla na milion desetinných míst.

MaxxPI2

Opět počítání pí, ale modernějším vícevláknovým kódem.

Průměrný výkon

Webové prohlížeče, HTML, Java, JavaScript, Flash

Následující tři testy jsou spouštěny současně
(multi-tasking):

Průměrný výkon

Propustnost a latence pamětí, cache, mezijádrová komunikace

U všech platforem (AMD AM3, Intel LGA 1366 i LGA 1156) jsem se pokusil o nějaké typické bezproblémové nastavení pamětí DDR3, přesněji to bylo takto (LGA 1156 a AM3 4 GB v dual, LGA 1366 3 GB v triple channel):

4× DDR3-1600, 8-8-8-24-2T: Phenom II X6 1090T (Thuban, 3,2 GHz) a 1055T (2,8 GHz), Phenom
II X4 980 BE (Deneb, 3,7 GHz) a 965 BE (Deneb, 3,4 GHz), Athlon II X3 435 (Rana, 2,9 GHz), Athlon
II X2 250 (Regor, 3,0 GHz)
2× DDR3-1333, 8-8-8-24-1T: Athlon II X4 645 (Propus, 3,1 GHz), A8-3850 (Llano, 2,9 GHz), A6-3650 (Llano, 2,6 GHz), FX-8150 (Zambezi, 3,6 GHz), FX-6100 (Zambezi, 3,3 GHz)
3× DDR3-1333, 8-8-8-24-1T: Core i7-980X (Gulftown, 3,33 GHz), Core i7-975 XE (Bloomfield, 3,33 GHz)
3× DDR3-1066, 7-7-7-20-1T: Core i7-920 (Bloomfield, 2,66 GHz)
2× DDR3-1333, 8-8-8-24-1T: Core i5-750 (Lynnfield, 2,66 GHz), Core i5-661 (Clarkdale, 3,33 GHz), Core 2 Quad QX9650 (Yorkfield, 3 GHz) a Core 2 Duo E8500 (Wolfdale-6M, 3,16 GHz), Core i7-2600K (Sandy Bridge, 3,4 GHz), Core i5-2500K (Sandy Bridge, 3,3 GHz), Core i5-2300 (Sandy Bridge, 2,8 GHz), Core i3-2100 (Sandy Bridge, 3,1 GHz), Pentium G620 (Sandy Bridge, 2,6 GHz)
4× DDR3-1066, 7-7-7-20-1T: Pentium Dual-Core E6500 (Wolfdale-2M, 2,93 GHz)

Před tím, než zabloudíte ke grafům z propustností z Everestu 5.3, je důležité vědět, že tento nemá kód benchmarku optimalizován pro nové procesory. Podobně jako u některých dalších pak v nejaktuálnějším sestavení dopadá propustnost výrazně lépe (na screenshotu pod odstavcem je FX-8150):

Poznámka: Propustností pamětí se dále zabývám ve dvanácté kapitole.

Herní výkon a 3DMark (CPU PhysX)

Call of Duty 4

1680 × 1050 px, maximální detaily, bez anti-aliasingu, režim
timedemo.

Crysis

800 × 600 px, DirectX 10, CPUbenchmark.bat, celkové detaily: low, physics: very high,
bez anti-aliasingu

Enemy Territory: Quake Wars

Far Cry 2

Left 4 Dead

Trackmania Nations Forever

Unreal Tournament 3

1280 × 720 px, VCTF-Suspense, maximální detaily, bez
anti-aliasingu

World in Conflict

1280 × 720 px, střední detaily, DirectX 10, fyzika zapnuta, bez
anti-aliasingu

X3: Terran Conflict

3DMark Vantage

Základní nastavení (performance), pouze CPU score.

3DMark06

Implicitní nastavení, opět pouze CPU score.

Průměrný výkon

Zatím do průměrného herního výkonu počítám i výsledky z 3DMarku, jelikož ve Vantage jde o test výpočtu PhysX na CPU (GeForce PhysX je v ovladačích vypnuta) a v 06 potom zase o zajímavý softwarový rendering. Většina současných her ale s více než čtyřmi jádry takto dobře neškáluje a třeba PhysX pro dvanáct vláken CPU je výsadou CPU testů v 3DMark Vantage.

Pro zajímavost můžete srovnat náš průměr s jakýmsi shrnutím herního výkonu z PCMark Vantage:

Mnou zjištěný herní výkon (z Call of Duty 4, Far Cry 2, Crysis, TMNF apod., nikoli z 3DMarku či PCMarku) jsem podělil cenou a můžete se tak podívat na graf obsahující poměr herního výkonu k ceně:

Příkon („spotřeba“) a teploty

wattmetr

Spotřeba (ano příkon) celé sestavy s daným procesorem je měřena pomocí
zásuvkového měřiče spotřeby elektrické energie FK Technics. A přestože chladič, zdroj a grafická karta zůstávají neměnné a paměti jsou nastaveny také velmi srovnatelně, pořád se jedná o spotřebu celé platformy dané do jisté míry také základní deskou, osazenou čipovou sadou a dalšími čipy právě na desce (i když i v tomto případě jsou podmínky díky použití desek Gigabyte ze stejné třídy v rámci možnosti co nejvíce srovnány).

Teplotní testy berte spíš jako velmi hrubou informaci. Použitým
chladičem je sice Noctua NH-C12P a pastou pak Noctua NT-H1, přesto může dojít k ne vždy stejnému rozetření pasty a teplota okolí se může také mezi testy lišit až o tři stupně Celsia. Pro patici AM3 má také starší revize C12P trochu jiné uchycení než kolem patic pro procesory Intel. U mnoha procesorů ukazuje čidlo v klidu teploty nižší než jsou teploty v místnosti.

Preview výkonu AMD FX-6100

Šestijádrový či třímodulový Bulldozer jsem ještě nestihl změřit v plné škále testů. Přesto se už ve zhruba dvaceti grafech můžete podívat na srovnání výkonu v několika již provedených testech včetně měření příkonu (spotřeby). FX-6100 by měl být levnější než Core i5-2300, ale dražší než třeba Phenom II X6 1055T.

Příkon (spotřeba) změřený izolovaně na EPS12V, vliv pamětí, přetaktování

Příkon (spotřeba) změřený izolovaně na EPS12V

Poprvé se v recenzi na EHW můžete setkat kromě tradičního měření příkonu celé sestavy zásuvkovým wattmetrem také izolovaným měřením příkonu na EPS12V.

Bočník měřící procházející proud sestrojil Honza Černý, napětí bylo kontrolováno běžným multimetrem VoltCraft VC-140. Podle toho, že celá sestava s AMD-FX odebírala zhruba o 20 W více v idle, se dá tipovat, že kromě rozdílu mezi deskami (na AM3 s čipsety 790FX nebo 990FX je k dispozici například taky více linek PCIe 2.0) bude i do procesoru zřejmě nějaký proud dodáván i skrze ATX 24-pin. Příkon FX-8150 ve vícevláknové zátěži je však každopádně vyšší než udávané TDP. U A8-3850 zřejmě zase pro změnu při jednovláknové zátěži nezafungoval správně power management.

Vliv frekvence pamětí na výkon FX-8150

Stejně jako třeba v případě Llana, i u Bulldozeru jsem vyzkoušel vliv rychlejších pamětí. Řadič procesoru podporuje frekvence od 1333 do 1866 MHz, nastavení 1333-8-8-8-24-1T mám zavedeno napříč mnoha konfiguracemi, nyní jsem vyzkoušel tedy i druhý okraj (1866-10-10-10-30-1T). Paměťová propustnost se zvedla o necelých 10 %, dopad na ostatní testy činil 0–8 %. Pro herní výkon se koupením rychlejší nebo vyšší frekvence zvládajícíh pamětí dá počítat se ziskem v průměru 4 %. Tedy tam, kde není výkon stejně limitován spíše grafickou kartou.

Vliv nastavení pamětí na výkon FX-8150	DDR3-1333, CL8	DDR3-1866, CL10	Nárůst
x264 benchmark HD 3.15 [fps] (vyšší je lepší)	35,98	36,01	0,1%
LameEnc 4.0a WAV do MP3 Play/CPU Ratio (vyšší je lepší)	25,98	25,736	0,9%
Paint.NET 3.5.4 [s] (menší je lepší)	13,799	13,891	-0,7%
Everest 5.3 (Memory Read) [kB/s]	11295	12079	6,9%
Everest 5.3 (Memory Write) [kB/s]	7394	8104	9,6%
Everest 5.3 (Memory Copy) [kB/s]	7434	8117	9,2%
Everest 5.3 (Memory Latency) [ns] (menší je lepší)	55,5	51,2	7,7%
Everest 5.3 (PhotoWorxx) [kB/s]	45160	48836	8,1%
Everest 5.3 (SinJulia) [kB/s]	3413	3414	0,0%
Call of Duty 4, 480p [fps]	167,6	173,9	3,8%
Call of Duty 4, 16×10 [fps]	129,2	129,7	0,4%
Unreal Tournament 3, 720p [fps]	198,83	213	7,1%
World in Conflict, 720p [fps]	100	104	4,0%

Přetaktování

Ačkoli kupujete tedy procesor bez zábran pro přetaktování (násobič otevřený směrem nahoru – "unlocked FX"), bude pro vás asi overclocking nejvyššího modelu zklamáním. Pro mě byl tedy extrémním zklamáním a mám pocit, že to souvisí s grafem v horní části této kapitoly a také s faktem, že ani v jednovláknové zátěži se Turbo zastavilo kousek nad 4,1 GHz místo max. až 4,3 GHz.

Zkusil jsem nejdříve nastavit 4,6 GHz a po zvednutí napětí o 0,1 V jsem se dostal ke spuštění Prime95. Po zvýšení o dalších 0,05 V (celkem tedy o 0,15 V) jsem mohl Prime95 i pustit a teprve asi po dvou sekundách vidět chybu v kontrolním součtu při počítání prvočísel. Deska se v té době do procesoru snažila pouštět asi 1,56 V.

Dalších pokusů jsem s FX-8150 tedy zanechal, s FX-6100 to zřejmě bude zajímavější. AMD obecně ukazuje takovéto rozsahy dosažitelné podle použitého chlazení:

Pro taktování CPU v novinářském kitu s deskou Crosshair V a s vodním chlazením AMD připravila tyto tipy:

přepněte chlazení na max. výkon (Extreme)
vypněte v BIOSu APM_Master_En a Turbo Core
v Asus VRM zvyšte vše (High pro Load Line Calibration, vypnutí Overcurrent a Thermal protection atd.)
zkoušejte napětí mezi 1,4 až 1,55 V
pokud se deska jednoduše vypne, přesáhli jste OCP limit (26,5 A na EPS12V či ATX12V)
zkuste vypínat jádra CPU
zkuste více procesorů – uvidíte rozptyl 100–300 MHz
zkontrolujte kontakt mezi blokem vodního chlazení a procesorem
sledujte teploty pomocí Asus Monitoring

Za povšimnutí stojí také fakt, že zatímco v oné už zmíněné kritizované prezentaci AMD píše o přetaktování na
4,8 GHz a až 30 % výkonu navíc, v průvodci pro recenzenty s konkrétním návodem už je více při zemi a mluví o 4,4 GHz a 17 % výkonu navíc díky přetaktování.

Shrnutí výkonu a verdikt

Shrnutí výkonu

V grafu celkového výkonu nejsou započítány syntetické testy
(Everest apod.) a jednotlivá skóre z PCMark Vantage. Pokud tento výkon podělíme aktuální cenou procesorů vč. DPH, dostaneme
následující index výhodnosti jednotlivých CPU. Platí, že vyšší číslo
znamená výhodnější procesor. Ceny jsem zjišťoval 12. října 2011 v e-shopu Alfa.cz. V případě, že zde procesor nebyl zalistován, použil jsem nejnižší cenu z vyhledávače Heureka.cz a to z e-shopu, kde byl CPU skladem a pokud měl obchod status Ověřeno zákazníky. U již neprodávaných procesorů jsem nechal poslední prodejní cenu a u ještě neprodávaných AMD FX jsem ceny spočítal trojčlenkou pomocí cen procesorů jako i5-2500K v Alfa.cz a známých poměrů dolarových cen (newegg.com).

Verdikt

Poctiví čtenáři už vědí – většina hodnocení se bohužel nemůže nést v pozitivním duchu. Jsem určitě rád, že se AMD podařilo uvést v mnoha ohledech opravdu novou a inovativní architekturu. Velký třesk jako v případě K8 se ale nekonal a dokonce je teď Intel ku AMD v desktopových procesor v opačném gardu než tehdy. Tedy procesory Core mají na své straně spotřebu i výkon na MHz (či jedno jádro) podobně jako Athlony 64, kdežto Phenomy a teď zřejmě i FX připomínají svými provozními vlastnostmi oproti konkurenci nebo právě výrazně vyššími nutnými frekvencemi pro slušný výkon daleko více Pentia 4.

AMD si je samozřejmě vědoma toho, že stávající zástupci rodiny Bulldozer nejsou těmi nezastavitelnými stroji, jež si prohrnou cestu k zákazníkovi bez ohledu na konkurenci. Cenová politika AMD – kdy v podstatě rezignovala na highend – se snaží nedovolit o jejích procesorech mluvit jako o nevýhodných. Na druhou stranu alespoň u vyšších modelů, jakým byl i recenzovaný FX-8150, se také nedá mluvit o tom, že by byl bůhvíjak lákavý.

On přeci jen výkon 3,6GHz Zambezi (s max. Turbem až 4,3GHz) v jednovláknové aplikaci srovnatelný s 2,8GHz Pentiem G620 (levný Sandy Bridge s menší cache) byl určitě nepříjemným zjištěním pro samotnou AMD. A rozhodně nemluvím jen o mezi overclockery tak populárním benchmarku Super PI.

Jestliže v průměrném výkonu vypočteném z metodiky, která nereprezentuje jen pro vícevláknové zpracování optimalizované aplikace (ale také se jim rozhodně nevyhýbá), bojuje nejvyšší člen desktopové rodinky Bulldozerů s průměrným Sandy Bridge (i5-2300), tak je asi úplně jedno, že s rychlejšími pamětmi u FX-8150 mohla AMD uhrát alespoň plichtu. Měřit se s i5-2300 pravděpodobně cílem ambiciózní vlajkové lodi FX nebylo.

Dalo by se říci, že i Bulldozer je podobná písnička jako Thuban: v několika mnohavláknových aplikacích jako třeba rendering či převod videa se procesor od AMD jeví jako za svou cenu přinejmenším zajímavý. Jenže když jsme u toho Thubanu – FX-8150 nepřekonává X6 1090T nijak výrazně. Vzhledem k tomu, že existuje ještě 1100T (o 100 MHz vyšší frekvence), kdekoho určitě napadne škodolibá poznámka o tom, jestli nebylo lepší zase trochu vyladit Phenomy II, převést je na nový výrobní proces, mít v podstatě stejný výkon a nikterak horší provozní vlastnosti a ještě ušetřit spoustu peněz jinak padlých za vývoj kompletní nové generace procesorů.

Zatím chtějme věřit alespoň v lepší poměr výkon/cena u nižších modelů Bulldozerů (FX-6100 už je z části otestován přímo v tomto článku) a tomu, že nová architektura tu je v podobě ne zrovna ideálně vyladěných produktů. Možná jsou Zambezi tím správným vkladem pro úspěch další generace ("Piledriver") plánované již na příští rok.

Nakonec se musím znovu zastavit u přetaktování, jelikož to bylo zklamáním nikoli trošku starším, ale zcela čerstvým. I samotné logo "Unlocked FX" působí na kupujícího jistě slibně, jenže v praxi to alespoň dle zkoušeného kusu vypadá, že AMD s FX-8150 jede v podstatě blízko hranic jeho možností. Nasvědčujete tomu jak vysoký příkon (spotřena) v zátěži, tak velmi malá rezerva pro přetaktování i nedosahování nejvyššího násobiče Turbo Core.

AMD FX-8150 (Zambezi, 3,6 GHz)

+ v několika testech výkonnější i než Core i7-2600K
+ otevřený násobič, přetaktování a nastavení Turbo Core softwarem
+ již připravené desky, jako platforma představuje soubor většiny moderních funkcí
- vysoký příkon v zátěži
- poměrně daleko za špičkou konkurence
- slabší výkon v jednovláknových testech
- malý výkonnostní pokrok oproti Phenomu II X6
- nikterak lákavý poměr výkon/cena
- velmi často pomalejší i než Core i5-2300