Zvláštnosti a technické detaily Ryzenů 7000 s 3D V-Cache: 7nm křemík, ovladače, BIOS… a lišta Xbox?

8. 3. 2023

Sdílet

 Autor: AMD
AMD má zase herní trůn, procesory Ryzen 7000 s V-Cache porazily Raptor Lake od Intelu. Podívali jsme se na technické detaily 3D čipletového Zenu 4 a na to, jak AMD řeší běh her na hybridních modelech s dvěma čiplety. Například proč k nim potřebujete Xbox Game Bar.

V poslední únorový den se začaly prodávat procesory Ryzen 7000 s 3D V-Cache, čili technologií 3D čipletů, které klasickým procesorům přidává větší kapacitu L3 cache. Minulá generace (Ryzen 7 5800X3D) ukázala, že toto prospívá hrám, a vypadá to, že stejné je to nyní. Ryzeny 7000 jsou zaměřené právě na použití v herních počítačích a podle recenzí se zdá, že v této roli překonaly procesory Raptor Lake od Intelu a jsou teď špičkou v herním výkonu.

Základní koncepce Ryzenů 7000X3D pokračuje v tom, jak byl postaven Ryzen 7 5800X3D. Procesor má standardní IO čiplet a substrát, ale jeden z CPU čipletů je speciální – křemík je snížený, má vyhloubené tzv. TSV a jimi vertikálně napojený vrchní čiplet obsahující přídavnou kapacitu L3 cache, která transparentně rozšíří jeho původní L3 cache z 32 MB na 96 MB. Na toto souvrství pak klasicky dosedá krycí kovový rozvaděč tepla, takže procesor už dále vypadá standardně.

3D V-Cache tvoří 7nm čiplet, ale je to nový křemík

Zvláštností je, že cache je vyráběná odlišným výrobním postupem. AMD potvrdilo, že tento čiplet je 7nm, zatímco CPU čiplet pod ním s jádry Zen 4 je 5nm. Toto dovoluje zlevnit jeho výrobu. Čiplet je tímto větší, než by byl s 5nm procesem, ale náklady jsou zřejmě přesto nižší. Nejde ale o stejný cache čiplet, jaký byl použitý u Zenu 3, ale o nový vylepšený návrh. AMD uvádí, že se podařilo jeho plochu zmenšit ze 41 mm² na 36 mm², ačkoliv má zhruba stejný počet tranzistorů (pro obě verze se uvádí 4,7 miliardy).

Hustota tranzistorů výrazně stoupla z cca 114 na 130 milionů tranzistorů na milimetr čtvereční. Paradoxně jde o vyšší hustotu tranzistorů, než má i 5nm CPU čiplet s jádry Zen 4. To je proto, že pro V-Cache tvořenou převážně pamětí SRAM byly použité knihovny dosahující vysoké hustoty tranzistorů, zatímco pro CPU čiplet ne.

Prezentace procesorů AMD Ryzen 7000X3D s 3D V Cache 1 Prezentace procesorů AMD Ryzen 7000X3D s 3D V-Cache (zdroj: AMD)

Kromě toho logické obvody, zejména ty stavěné na vysoký výkon a frekvence, mívají vždy mnohem nižší hustotu, než jaké proces dosahuje pro husté buňky SRAM. Pokud by se obvody V-Cache implementovaly stejným způsobem s knihovnami optimalizovanými na nejnižší plochu na 5nm procesu, pak by výsledek už byl menší než na procesu N7.

Protože se zmenšil podkladový CPU čiplet, musí 3D V-Cache v Ryzenech 7000X3D mít jiné rozložení kontaktů pro propojení (byť u nich údajně byla snížená plocha, kterou zabírají). V generaci Zen 3 seděly kontakty nad L3 cache CPU čipletu, skrz níž byly vyrobeny vertikální kanály (tzv. TSV), jimiž prochází měděný vodič propojující vrstvy měděných spojů na spodku CPU čipletu s měděnou vrstvou na spodku V-Cache čipletu. U Zenu 4 se muselo rozložení změnit. TSV nyní nevedou jen skrz L3 cache, část TSV s vodiči poskytujícími napájení jde také skrze bloky SRAM v L2 cache jader Zen 4. Přes L3 cache jdou signální (datové, řídící) vodiče.

Prezentace procesorů AMD Ryzen 7000X3D s 3D V Cache 2 Prezentace procesorů AMD Ryzen 7000X3D s 3D V-Cache (zdroj: AMD)

Tato změna znamená, že AMD nemohlo použít stejný čiplet jako v předchozí generaci, o čemž se dříve spekulovalo. Kromě toho to vyvrací také údaj o zmenšené ploše cache čipletu.

V-Cache Zenu 4 má o 25 % vyšší propustnost

Nový čiplet spolu se Zenem 4 také dosahuje vyššího výkonu, tedy alespoň v propustnosti, která by měla vyhovovat HPC aplikacím. Zatímco u předchozí generace se dařilo dosáhnout mezi CPU čipletem a V-Cache propustnosti až 2 TB/s, nyní je to až 2,5 TB/s. Na druhou stranu latence je údajně o něco vyšší, narostla o 4 cykly (což jsou v kontextu L3 cache jednotky procent).

Celá 3D V-Cache je na stejné větvi napájení jako procesorová jádra. Nemůže mít separátní nižší napětí a frekvenci proti jádrům Zen 4. Podle webu Tom's Hardware je alespoň v případě procesoru Ryzen 9 7950X3D maximální dosažená frekvence na CPU čipletu 5,25 GHz v jednovláknové a 4,85 GHz v mnohovláknové zátěži a maximální napětí 1,152 V. Toto nejsou hodnoty ze specifikací, ale naměřené během recenze, takže nemusí být 100% platné vždy a pro všechny exempláře. Oproti tomu druhý čiplet procesoru bez V-Cache dosáhl na takty až 5,75 GHz (jednovláknově) a 5,30 GHz (mnohovláknově) a maximální napětí bylo 1,384 V.

Kvůli tomu, že čiplet s 3D V-Cache nesmí dostat tak vysoké napětí, opět u těchto procesorů nebude povoleno klasické přetaktování změnami násobičů a frekvencí. Avšak částečný OC je možný – jsou povolené funkce Precision Boost Overdrive, které dovolují zvýšit výkon v rámci běžného fungování boostu, a dále Curve Optimizer umožňující podvoltování. Je samozřejmě možné přetaktovat paměti DDR5.

Řízení výkonu a schedulingu na Ryzenu 7000X3D 1 Řízení výkonu a schedulingu na Ryzenu 7000X3D (zdroj: AMD)

Jak zajistit optimální výkon: ovladače, BIOS a interakce s Windows

Jak už jsme psali při odhalení procesorů, umístění V-Cache jen na jeden z obou CPU čipletů má ten dopad, že u procesorů s 12 a 16 jádry má jedna polovina CPU 96MB L3 cache a relativně nižší maximální takty, zatímco druhá polovina má vyšší frekvence, ale jen 32MB L3 cache. Pro ideální výkon ve hrách je třeba, aby byly umístěny na jádra čipletu s 3D V-Cache a pro aplikace naopak (ale neplatí to zcela bez výjimek). Podobně jako hybridní procesory Intelu toto potřebuje speciální řízení.

U Ryzenů 7000X3D je to zajištěno na několika úrovních. První částí je mít dostatečně nový BIOS (UEFI) v základní desce. Dále pak také aktualizovat ovladače čipsetu (které jsou reálně ovladačem celé platformy AM5) minimálně na verzi 5.01.03.005 a k tomu také mít aktuální verzi Windows 10 nebo 11. Je tu ale také čtvrtá komponenta – použití tzv. Game Mode ve Windows a jako pomůcka lišta Xbox Game Bar (je třeba verze 5.823.1271.0 a novější). Ty jsou důležité proto, že na ně AMD navázalo ovládání toho, kam jsou hry přiřazeny.

Řízení výkonu a schedulingu na Ryzenu 7000X3D 2 Řízení výkonu a schedulingu na Ryzenu 7000X3D (zdroj: AMD)

BIOS desky a ovladače jsou důležité proto, že BIOS desky skrze rozhraní CPPC2 (to je tedy nutné mít zapnuté) komunikuje operačnímu systému, která jádra má prioritně využívat – to jsou normálně ta, která dosahují nejvyšších frekvencí. Ovšem s procesory Ryzen 9 7900X3D a Ryzen 9 7950X3D je nutné, aby při hraní her byla priorita změněná ve prospěch jader s V-Cache. A to zajišťuje právě ovladač, který detekuje běh her a dynamicky během hraní přepne firmware tak, aby systému Windows hlásil, že má upřednostnit jádra na čipletu s V-Cache.

K čemu Xbox Game Bar?

Ve většině případů by to mělo jít automaticky, ovladač přepne na V-Cache tehdy, když je aktivní Game Mode ve Windows (nebo také režim Mixed Reality). Z tohoto vyplývá využití lišty Xbox Game Bar. Tu máte ve Windows 10 a 11, pokud jste ji nějak na sílu neodinstalovali, a vyvolává se nejjednodušeji stiskem klávesy Windows + G.

Xbox Game bar má seznam různých her, které identifikuje a zapíná pro ně automaticky Game Mode, čímž se zajistí i to, že se umístí na jádra s V-Cache. Vedle toho ale Xbox Game Bar slouží i jako nástroj, kterým můžete automatickou detekci korigovat, pokud selže. Pokud vám hra není detekována, otevřete Xbox Game Bar, kde můžete kliknout na možnost „toto je hra“, čímž se program přidá na seznam. Ovladače AMD na to už zareagují automaticky.

Řízení výkonu a schedulingu na Ryzenu 7000X3D 4 Řízení výkonu a schedulingu na Ryzenu 7000X3D (zdroj: AMD)

Vedle této obsluhy by mělo být možné ladit nebo přebít kritéria přepínání také v BIOSu desek (jak uniklo už před vydáním). Ovladače platformy / čipové sady AMD také instalují tzv. AMD PPM Provisioning File Driver, který parkuje (deaktivuje pro přijímání úloh) ta jádra, která nemají V-Cache, když je aktivní Game Mode. Tím se zajistí, aby hra nepřetékala na druhý čiplet a minimálně v některých případech by to mělo zlepšit výkon tím, že aplikace zůstává v rámci 3D V-Cache. Použití jader z různých čipletů totiž zhoršuje latence mezi vlákny. V případě, že hra běží naopak na čipletu bez V-Cache (protože jí víc vyhovují vysoké frekvence), se naopak zaparkují jádra na čipletu s V-Cache.

Řízení výkonu a schedulingu na Ryzenu 7000X3D 3 Řízení výkonu a schedulingu na Ryzenu 7000X3D (zdroj: AMD)

AMD také zmiňuje, že toto řízení výkonu ve hrách nemusí být přesné, pokud je ve Windows aktivní VBS (Virtualization-based Security, v českých Windows je volba označená jako Izolace jádra), kterou proto může být optimální vypnout, byť se tím obíráte o jednu z bezpečnostních bariér před malwarem a útoky. Izolace jádra ale vždy o něco zhoršuje výkon, takže je možné, že náruživí hráči by ji měli vypnutou tak jako tak.

Procesor AMD Ryzen 9 7950X3D s 3D V cache pro socket AM5 1600 Procesor AMD Ryzen 9 7950X3D s 3D V-Cache pro socket AM5 (foto: AMD)

Ryzen 7 7800X3D extrabuřty nepotřebuje

Pokud se vám toto zdá překomplikované, je tu jedna potenciální úleva. Toto vše platí jen pro asymetrické modely se dvěma čiplety, tedy Ryzen 9 7900X3D a 7950X3D. Nic z tohoto nebudete potřebovat s levnějším osmijádrovým Ryzenem 7 7800X3D, který vyjde v dubnu. Ten má jen jeden čiplet, všechna jádra jsou v něm a sedí na jedné unifikované V-Cache. Žádná detekce her ani přiřazování nebudou třeba a procesor bude fungovat plně bez jakékoli podobné přípravy.

bitcoin_skoleni

Nevýhodu to má tu, že nebude poskytovat žádná jádra s vysokou frekvencí pro neherní úlohy. To, že nikdy nebude používat extrémní frekvence a napětí, by ale také mělo být vidět na spotřebě. Ryzen 7 7800X3D by měl být velmi efektivní.

Zdroje: Tom's Hardware (1, 2, 3)