Ryzen Threadripper byl vydán. AMD má (na krátko) nejrychlejší procesor pro desktop PC

11. 8. 2017

Sdílet

 Autor: Redakce

Včera ve tři hodiny nastal čas Č procesorů AMD Ryzen Threadripper – až šestnáctijádrových CPU s jádry Zen, které AMD vytvořilo spojením dvou čipů, které používá v běžných Ryzenech a procesorech Epyc. Informace o parametrech a různých vlastnostech jsme zde již probrali při jejich oznámení (viz zde a zde), takže zde jen zrekapitulujeme a přidáme nově se objevivší informace, které definitivní uvedení přineslo.  

Ryzen Threadripper

AMD zatím začalo prodávat dva modely. Zaprvé dvanáctijádro Ryzen Threadripper 1920X, které má základní takt 3,5 GHz, maximální turbo 4,0 GHz a celkem 32 MB L3 cache. Prodávat se má za 799 dolarů. Druhý model Ryzen Threadripper 1950X má také 32 MB L3 cache, ale šestnáct jader, základní takt 3,4 GHz a turbo také 4,0 GHz. Jeho cena je pak 999 dolarů, tedy částka tradičně spojovaná s extrémním highendem. Obě CPU ale mají 200MHz XFR boost, takže s dobrým chlazením mohou pro jedno až čtyři jádra nasadit frekvenci až 4,2 GHz. Stejné je také TDP, které je nastaveno 180 W. A procesory si ho v mnohajádrové zátěži také vezmou. 31. srpna má jinak vyjít ještě osmijádrový model 1900X za 549 dolarů – s takty 3,8–4,0 GHz. Všechny modely jsou odemčené pro taktování.

Ryzen Threadripper na fotografii webu PC Perspective Ryzen Threadripper na fotografii webu PC Perspective

Threadrippery se instalují de socketu TR4 (jenž sdílí fyzické provedení s paticí SP3 pro serverové Epycy, ale není kompatibilní) a mají vlastní desky platformy X399. Její hlavní předností je konektivita. Všechny Threadrippery mají čtyřkanálový řadič pamětí DDR4 s oficiální podporou frekvence až 2666 MHz (pro čtyři single-rank moduly) a až osmi modulů DIMM (včetně ECC). Procesory také vyvádějí 64 linek PCI Express 3.0 – z čehož čtyři jsou použité pro čipset X399, 48 linek je volných pro grafické karty (sloty PC Express ×16) a zbylých 12 lze použít třeba pro NVMe SSD (PCIe 3.0 ×4), připojená přímo k procesoru a nikoliv k čipové sadě. Mimochodem, podle některých zpráv zatím Threadripper neumožňuje zavést operační systém z pole RAID vytvořeného z přímo připojených NVMe SSD, ale tato funkcionalita by prý měla být doprogramována později.

Schéma platformy AMD X399 Schéma platformy AMD X399

NUMA povaha procesoru a co s tím

To, že je Ryzen Threadripper složen ze dvou čipů, z něj do určité míry činí ekvivalent systému s dvěma procesory v režimu NUMA (tedy s dvěma sadami paměti). Naštěstí se zdá, že tento faktor nebude takovou koulí u nohy, jak se zdálo a mnoho aplikací schopných využít 32 vláken škáluje na tento „slepenec“ docela pěkně. Hlavním faktorem asi bude, že propojení obou čipů má velmi velkou kapacitu – Infinity Fabric mezi oběma polovinami Threadripperu má propustnost 102,22 GB/s obousměrně.

ryzen-threadripper-amd-propojeniHlavním zdrojem potenciálních ztrát výkonu je u takového konfigurace zvýšená latence paměti, která nastává, když jádro jednoho čipu přistupuje do paměti připojené k druhému. Podle AMD je latence pro lokální RAM 79 ns a pro RAM druhého čipu 133 ns při použití paměti DDR4 2400. Podle AnandTechu s DDR4 na 3200 MHz latence klesnou na 65 a 108 ns. Při náhodném přístupu do paměti bude latence proměnná podle umístění a průměr je tedy někde mezi.

AMD mělo s Threadripperem volbu, zda „NUMA“ (dvouprocesorový) charakter odkrýt pro operační systém, nebo zda mu Threadripper poskytnout jako jeden uniformní procesor („UMA“). Obojí má výhody a nevýhody. Operační systémy dnes respektují systémy NUMA při rozdělování vláken na jádra. Pokud by CPU přiznalo, že je NUMA, pak by takový systém mohl běžné aplikace nehlásící se jako „NUMA-aware“ spouštět jen na jedné polovině čipu a druhou ignorovat – a lze se obávat, že většina běžných aplikací jako NUMA-aware označená není. Pokud by naopak byl NUMA charakter zakryt, pak hrozí, že optimalizované aplikace nebudou moci využít informaci o rozdělení jader, nebo že přidělení jader na druhé polovině CPU zase v ne-NUMA aplikacích zhorší výkon kvůli latencím.

Přepínatelné režimy

Proto budou BIOSy desek podporovat obě konfigurace a bude mezi nimi možné se při rebootu přepnout. Toto nastavení se jmenuje local mode, respektive distributed mode. Local mode znamená, že se CPU tváří jako NUMA systém ze dvou polovin a aplikace budou alokovat vždy nejprve paměť jednoho procesoru a jeho vlákna. Budou tak mít nižší latenci, ale také nižší propustnost, jelikož mají k dispozici jen dva kanály DDR4.

Distributed mode operační paměti Distributed mode operační paměti

Režim „UMA“, kdy se Threadripper tváří jako jeden monolit, se jmenuje „Distributed mode“ a paměť rozprostřena (prokládána) mezi oba čipy, což znamená onu proměnlivou a v průměru vyšší latenci. Distributed mode je výchozí/automatické nastavení. V testech se totiž ukazuje, že snad s výjimkou her toto moc nevadí a většina vícevláknového softwaru dobře škáluje na všechna jádra. Pro většinu těchto aplikací, které nejsou NUMA-aware, by tak omezení jen na polovinu čipu zbytečně zabilo potenciální výkon.

Local mode operační paměti Local mode operační paměti

Pro hry by měl být o něco výkonnější režim Local, navíc k němu ale bude možné použít ještě jednu volbu v BIOSu. Takzvaný „Game“ režim také používá alokaci paměti přednostně v jedné polovině čipu, navíc k tomu ale ještě vypne polovinu jader, a to deaktivací jader v jednom čipu. Toto vypnutí poloviny procesoru (kdy ale zůstávají aktivní jeho paměťové řadiče) má označení „legacy mode“, jelikož má mimo jiné sloužit k odstranění problémů ve hrách, které s 32 vlákny nepočítají, což může znamenat třeba i pád programu. Tento režim by se měl dát použít, pokud potřebujete pro nějakou hru maximum možného výkonu, opět ale bude vyžadovat reboot, takže praktičtější bude se omezit bez něj a hrát v běžném Distributed režimu s celým CPU.

Creator Mode zahrunuje režim paměti distributed, Game Mode zahrnuje local mode paměti a k tomu legacy režim (vypnuté SMT) Creator Mode zahrunuje režim paměti distributed, Game Mode zahrnuje local mode paměti a k tomu legacy režim (vypnuté SMT)

Protějšek režimu „Game“ se nazývá Creator mode, měly by být výchozí volbou a používá režim paměti Distributed s legacy režimem jader deaktivovaným. Mělo by tedy jít o výchozí volbu. Režimy Creator a Game by se také měly dát přepnout v utilitě Ryzen Master, ale efekt to opět bude mít až po restartu systému.

Efekt režimu Game podle AMD Efekt režimu Game podle AMD
Efekt režimu Local a Distributed podle AMD Efekt RAM režimu Local a Distributed podle AMD

Pozor na chlazení

Socket TR4 je zcela specifický a potřebuje speciální chladič. AMD k Threadripperům doporučuje chlazení vodní a minimálně pro přetaktování je asi dobrý nějaký silnější typ s 240mm nebo 360mm radiátorem. Mezi vodníky je také nejvíce kompatibilních modelů, jelikož AMD přímo do balení procesoru přikládá rámeček pro upevnění bloků vyráběných Asetekem. Ty používá docela dost výrobců, takže tento jednoduchý adaptér umožňuje osadit poměrně dost existujících vodníků. Seznam kompatibilních byste měli nalézt zde na webu AMD. Pro odpůrce vody jsou připravené i nějaké vzduchové chladiče – Arctic pro patici TR4 nabízí chladič Freezer 33 TR a hned tři modely by měla během pár týdnů začít prodávat i Noctua.

Balení procesoru Threadripper obsahuje rámeček pro přimontování chladičů na bázi technologie Aseteku Balení procesoru Threadripper obsahuje rámeček pro přimontování chladičů na bázi technologie Aseteku. A také šroubovák Torx, potřebný pro manipulaci se socketem

Celkové množství tepla, které je třeba odvést, je poměrně velké – 180 W, po přetaktování třeba 300 W – což omezí možnost chladit vzduchem. S chlazením Threadripperů by ale zas tak velký problém být nemel. Alespoň proti Skylake-X, jelikož rozvaděč tepla je postaru přiletovaný a ne připastovaný. Určitý pozor je snad třeba dát na to, že čipy jsou ve velkém pouzdru poměrně daleko od sebe. Není prý nutné, aby základna plně překrývala jejich pozici (třeba kulaté bloky Aseteků to nesplňují), ale je dobré použít víc pasty, aby po přimáčknutí dosáhla až ke všem okrajům. AMD doporučuje použít pět „kuliček“ máznutých do obrazce, jaký dělá číslo pět na hrací kostce (viz toto video).

MSI ukázalo instalaci Threadripperu do socketu TR4 na videu MSI ukázalo instalaci Threadripperu do socketu TR4 na tomto videu

Podle recenzí dosahují TR 1950X v zátěži teplot pod 60 stupňů. Je u nich ovšem ale opět zapeklitost s udáváním teploty. Signál Tcontrol, který procesor posílá desce, má v základu hodnotu o 27 stupňů vyšší, než ve skutečnosti. Je to proto, aby deska nastavovala vyšší otáčky pro chlazení. Pro zjištění skutečné teploty je offset 27 nutno odečíst. Utility s podporou pro Threadrippery by to eventuálně měly zohlednit – například aktuální HWInfo by to již mělo dělat automaticky.

Recenze

Včera začaly vycházet první recenze na zahraničních webech. Pročíst si už můžete test PC Perspective, Tom's Hardware, AnandTechu (test s pomalejšími pamětmi na 2400 MHz) a francouzský (ale s docela podrobnými výsledky) Hardware.fr a německý ComputerBase.de. Techspot otestoval kromě běžných her a úloh také efekt režimů local a distributed a Hardware Canucks efekt frekvence pamětí (a režimy local/distributed také). Ve vícevláknových aplikacích Threadripper 1950X dokáže poměrně citelně (i o 20–30 %) porazit desetijádrovou špičku Intelu Core i9-7900X. Té se často hodně blíží už levnější Threadripper 1920X stojící o pětinu méně, v některých benchmarcích i vyhrává.

Nicméně v jednovláknových zátěžích má Skylake-X výhodu. Lze jej také procentuálně více přetaktovat, zatímco Threadrippery umožňují typicky jen 3,9–4,0 GHz jako ostatní Zeny. O něco lepší je i9-7900X i ve hrách, ale nepříliš výrazně (pokud se u Threadripperu zapne režim Game). Oba tyto procesory nejsou pro hry nejoptimálnější a prohrají s mainstreamovým Kaby Lake. Mimochodem, některé hry údajně na procesorech s 32 vlákny padají nebo ani nejdou spustit, jelikož programátoři s takovýmto hardwarem nepočítali a nenapsali kód čistě. V těchto případech by mohl pomoci režim Game, který část vláken vypne.

Absolutní výkonnostní trůn si Intel vezme zpět, ale za vyšší ceny

Výsledky v různých aplikacích se dosti liší. Pokud ale budeme hledět na nejrelevantnější vícevláknové programy, lze říct, že AMD po dlouhé době nabízí nejvýkonnější desktopový procesor na trhu. Platí to minimálně pro úlohy jako 3D rendering a enkódování videa, jako u všech procesorů s větším počtem jader je adekvátní výkon jen tehdy, když jsou jádra plně využita. Ignorování výkonu ve hrách a programech vytěžujících pár nebo jen jedno jádro sice není kompletně fér, ale kvůli takovým aplikacím se ani Skylake-X, ani Threadripper nekupuje a stačí na ně mainstreamové CPU. Rozhodujícím faktorem by dle mého názoru měly být úlohy, pro které se mnohojádrová CPU dělají a pro které je jejich uživatelé potřebují. Pokud provádíte mix úloh, kdy je kromě škálujících problémů třeba i něco jednovláknového a jde o důležitou část „provozu“, pak může být Skylake-X celkově vhodnější, i když ve vícevláknových aplikacích výkon obětujete.

ICTS24

amd-ryzen-threadripper-ilustrace-1600Každopádně toto vítězství ve vícevláknovém výkonu asi AMD nevydrží příliš dlouho a je plodem toho, že Intel ještě nestihl vydat všechny procesory Skylake-X. Koncem srpna Intel vydá dvanáctijádrový model Core i9-7920X a koncem září by dokonce mělo vyjít až osmnáctijádro. Model Core i9-7920X by měl přinejmenším zmírnit skluz, který má ve vícevláknových úlohách Core i9-7900X, asi ale nebude stačit na to, aby Threadripper 1950X porazilo všude. To by ale mělo dokázat Core i9-7980XE s 18 jádry.

Intel chtěl zřejmě toto zvlášť dát najevo, jelikož výjimečně nechal probublat ven údajný výkon, který toto CPU dosáhne v Cinebench R15. Má dosahovat 3200 bodů, čímž by o nějakých 6,5 % předstihlo nejvyšší model od AMD, a to v benchmarku, který mu vyloženě sedí (proti i9-7900X je tento výsledek mimochodem lepší o 47,5 %). Nicméně je tento extrémní model také dvakrát dražší, takže bez nějakých slev by Threadripperu měla zůstat lepší známka za poměr cena/výkon. I za 14jádro, které by se mohlo Threadripperu 1950X už zřejmě vyrovnat v mnohovláknovém výkonu, bude Intel chtít 1400 dolarů, tedy o 40 % víc.