Co vám Intel neřekne: all-core boosty Core i9-13900KS a propad taktů Sapphire Rapids s AVX-512

3. 1. 2023

Sdílet

 Autor: Intel
Díky leakerovi víme, jak moc klesnou frekvence nejvýkonnějšího 56jádrového procesoru Intelu při použití AVX2, AVX-512 a nových maticových instrukcí AMX.

Za chvíli se v USA rozhoří (tedy doufejme ne doslova) CES 2023 a jedna z věcí, která by na něm měla být představená, je po třech letech nová generace procesorů Intel pro segment HEDT (ale současně i pracovních stanic): Xeony W-2400 a W-3400 pro platformu Intel W790. Pravděpodobně se brzo dozvíme oficiální specifikace těchto procesorů. Ale předtím se podíváme na jednu neoficiální informaci, která pravděpodobně v oficiálním odhalení nebude.

Intel v poslední době často neuvádí větší podrobnosti o boostu, zejména o all-core boostech, tedy taktech, kterých procesor maximálně dosáhne při zátěži všech jader (pokud ho nepřetaktováváte). Zrovna u Xeonů a obecně mnohojádrových procesorů je to dost důležitý detail. Leaker HXL, který v prosinci provalil slajdy Intelu k platformě W790 i k procesorům a jejich specifikacím, teď ale k maximálním all-core turbům vypustil údaje pro jeden konkrétní procesor – Xeon W9-3495X. Měl by to být vůbec nejvýkonnější model pro platformu W790, takže informace o těchto taktech může být zajímavá pro orientaci.

Xeon W-3495X má dle uniklé tabulky specifikací 56 jader, 112 vláken, 350W TDP a 105 MB L3 cache (a také osmikanálový řadič DDR5-4800 a 112 linek PCIe 5.0). Jeho maximální boost pro jednovláknové či málovláknové úlohy je 4,8 GHz – toto je na preferovaných jádrech pomocí technologie Turbo Boost Max 3.0. Naproti tomu základní takt je jenom 1,9 GHz. Toto by měla být cosi jako více méně garantovaná nejnižší („worst-case“) frekvence dosahovaná v těch nejvíce vytěžujících – netypických – úlohách při 350W TDP.

Při boostu ale je povolený o hodně vyšší takt (což asi ale také bude znamenat vyšší spotřebu než oněch 350 W; jaké bude PL2, na to jsme hodně zvědaví). HXL píše, že pro programy, které nevyužívají žádné z vyšších SIMD instrukcí a vystačí si s instrukcemi SSE až SSE4 (128bitové vektory), je all-core boost tohoto procesoru 2,9 GHz. Toto by tedy asi mělo být maximum, které z procesoru půjde vydolovat pro zátěže vytěžující všech 112 vláken, pokud nepřistoupíte k přetaktování.

Vizualizace procesoru Intel Sapphire Rapids 1600 Vizualizace procesoru Intel Sapphire Rapids. 56jádrový model bude složený ze čtyř propojených čipletů (zdroj: Intel)

Ovšem vyšší SIMD instrukce budou opět měnit situaci – Sapphire Rapids s nimi opět bude snižovat frekvence, tento rys architektury Intelu tedy aspoň v nějaké formě přetrvává. S instrukcemi AVX či AVX2 se bude dosahovat maximálního boostu jen 2,8 GHz. Tato redukce o 100 MHz je ale hodně nízká až nevýznamná. Cena za instrukce AVX-512 také není nějaká tragická, ale už je znatelnější. S AVX-512 prý bude maximální all-core boost 2,5 GHz. Ztratíte tak 400 MHz, jde o redukci taktu o téměř 14 %.

Pokud tedy budete chtít pro nějakou mnohovláknovou úlohu chtít optimalizovat výkon pomocí AVX-512, musíte hlídat, aby v ní tyto instrukce zvýšily výkon na 1 MHz o více než těchto 14 %, jinak se to nevyplatí. Z našeho testování se zdá, že třeba při enkódování v x265 bude tedy lepší AVX-512 nechat vypnuté, protože snížená frekvence převáží. Nicméně je pravda, že některé modely s nižším počtem jader mohou mít „daň za AVX-512“ nižší, tam to pak může být jiné.

https://twitter.com/9550pro/status/1609920554697658369

HXL uvádí ještě další nižší maximum – pokud program bude používat maticové instrukce AMX, je all-core maximum již jen 2,2 GHz. AMX má užití zejména ve výpočtech umělé inteligence a provádí velké množství výpočetních operací, které asi také mají hodně vysoké energetické nároky. Proto asi musí snížit takt. Tyto úlohy zřejmě ale budou schopné generovat navýšení výkonu i přes redukci ve frekvenci, neboť jsou obvykle napsané tak, že jejich výkon škáluje s dosaženými TFLOPS (respektive TOPS).

Tip: Deska platformy Intel W790 na fotce. Čtyřkanálové i osmikanálové HEDT procesory jsou kompatibilní

All-core boosty pro Core i9-13900KS odhalené

Mimochodem, HXL stejným způsobem publikoval také all-core boosty pro Core i9-13900KS – nadcházející speciální edici 24jádrového Raptor Lake pro mainstreamovou platformu LGA 1700. Pro tento procesor již unikly „kompletní“ specifikace přímo ze slajdů Intelu, které ale zrovna all-core boosty neuvádějí.

Podle HXL bude all-core boost na velkých jádrech 5,6 GHz, tedy o 400 MHz nižší než maximální 6,0GHz boost, jenž bude dostupný s Turbo Boost Max 3.0 a Thermal Velocity Boostem nejspíše na dvou jádrech. Boostování na 5,6 GHz na všech P-Core je o 100 MHz vyšší, než co dokáže Core i9-13900K – tam je all-core maximum „jen“ 5,5 GHz.

bitcoin_skoleni

U 24 malých jader E-Core je maximum procesoru i9-13900KS na hodnotě 4,3 GHz. V tomto případě je limit stejný jako u běžného modelu i9-13900K.

Intel Core 13. generace (Raptor Lake) 125W / 65W
Model Jádra P+E/vlákna
Takt P-Core
Max. turbo P-Core L3 cache GPU TDP Max. turbo spotřeba Čip
Core i9-13900KS 8+16/32 3,2 GHz 6,0 GHz 36 MB Ano 125 W 253 W B-0
Core i9-13900K 8+16/32 3,0 GHz 5,8 GHz 36 MB Ano 125 W 253 W B-0
Core i9-13900KF 8+16/32 3,0 GHz 5,8 GHz 36 MB Ne 125 W 253 W B-0
Core i9-13900 8+16/32 2,0 GHz 5,6 GHz 36 MB Ano 65 W 219 W B-0
Core i9-13900F 8+16/32 2,0 GHz 5,6 GHz 36 MB Ne 65 W 219 W B-0
Core i7-13700K 8+8/24 3,4 GHz 5,4 GHz 30 MB Ano 125 W 253 W B-0
Core i7-13700KF 8+8/24 3,4 GHz 5,4 GHz 30 MB Ne 125 W 253 W B-0
Core i7-13700 8+8/24 2,1 GHz 5,2 GHz 30 MB Ano 65 W 219 W B-0
Core i7-13700F 8+8/24 2,1 GHz 5,2 GHz 30 MB Ne 65 W 219 W B-0
Core i5-13600K 6+8/20 3,5 GHz 5,1 GHz 24 MB Ano 125 W 181 W B-0
Core i5-13600KF 6+8/20 3,5 GHz 5,1 GHz 24 MB Ne 125 W 181 W B-0
Core i5-13600 6+8/20 2,7 GHz ? 24 MB Ano 65 W ? C-0
Core i5-13500 6+8/20 2,5 GHz 4,8 GHz 24 MB Ano 65 W ? C-0
Core i5-13400 6+4/16 2,5 GHz 4,6 GHz 20 MB Ano 65 W ? C-0
Core i5-13400F 6+4/16 2,5 GHz 4,6 GHz 20 MB Ne 65 W ? C-0
Core i3-13100 4+0/8 3,4 GHz 4,5 GHz 12 MB Ano 60 W ? H-0
Core i3-13100F 4+0/8 3,4 GHz 4,5 GHz 12 MB Ne 60 W ? H-0

Zdroje: HXL (1, 2)