Kontroverze vzbuzené tím, co AMD řeklo o očekávaném výkonu Zenu 4, a tím, jak tato číslo kdekdo analyzoval, už jsme zmiňovali v pondělí v článku o tom, co k procesorům zatím prozradila přímo samotná firma. Vedle toho se teď ale objevily nové úniky, které by v těchto debatách mohly udělat trochu pořádek, pokud budeme předpokládat, že jsou reálné. A jak už to bývá, pravda asi je někde mezi 0% IPC alarmisty a pohádkami o 25% nárůstu.
AMD možná chtělo být vzhledem k poměrně dlouhé době, která zbývá do vydání Ryzenů 7000, na Computexu 2022 opatrné, pročež zvolilo onu formulaci, že jednovláknový výkon naroste o víc jak 15 % (to je konkrétně výkon v Cinebench R23 ST). Opatrnost je asi na místě, protože AMD údajně zatím nemá naměřený finální výkon – ačkoliv už prý brzy budou vyrobené tzv. kvalifikační vzorky, které již mají stejné takty jako sériové kusy, zatím je firma nemá. Benchmarky prezentované na Computexu byly údajně všechny naměřené na ranějších ES vzorcích.
Nicméně ona opatrnost se vymstila „bouřemi“ na Twitteru a podobných sociálništích. AMD totiž prezentovalo také to, že Ryzen 7000 bude schopen dosahovat taktu až 5,5 GHz (pravda, není jasné, zda ho držel při běhu CB 23 ST). Pokud by se předpokládalo, že takt vzrostl z 5050 MHz u Ryzenu 5950X na 5500 MHz, což je +9 %, pak by pro 15% celkový nárůst výkonu muselo IPC narůst jen o 5,5 %. Podle některých závěrů to dokonce znamená, že Zen 4 ani není pořádně inovovaná architektura (jako byl třeba Zen 2), ale jen die shrink Zenu 3 s větší L2 cache a AVX-512, což je dle našeho názoru dost mimo.
Tuto kalkulaci ještě zhorší, pokud byste předpokládali, že část nárůstu výkonu (těch 15 %) tvoří nárůst díky použití paměti DDR5-6000. Řada komentátorů také zapomíná, že boost Zenu 3 (zde Ryzenu 9 5950X) v naměřeném benchmarku pravděpodobně byl 5,05 GHz, a ne 4,90 GHz, které jsou ve specifikacích. Pokud se vychází z hodnoty 4900 MHz, pak by nárůst IPC u Zenu 4 vycházel na pouhých +2,4 %.
Více: Zen 3 se přece jen dostal na 5 GHz. Boost Ryzenů 5000 je reálně vyšší než podle specifikací
Všechny tyto úvahy jsou ale asi spíš mimo, i když je pravda, že aspoň ukazují, že nerealistické představy o 20% nebo dokonce 25% nárůstech IPC, které se občas objevovaly, byly hodně mimo. Informace jsou zatím příliš nepřesné, aby se dalo IPC opravdu odvodit, výpočty mají příliš velkou nejistotu. Nevíme například jistě, na jaké frekvenci ES vzorek v Cinebench běžel, a také všechny analýzy jako by ignorovaly onen detail, že výkon v Cinebench R23 ST má narůst ne o 15 %, ale o nějaké číslo vyšší než 15 %. AMD podle svých marketingových zástupců schválně bylo s touto hodnotou opatrné, což znamená, že je v ní nějaká rezerva, o níž nevíme, jak je velká.
IPC Zenu 4 podle zákulisních informací
Tolik tedy stav internetové debaty o IPC Zenu 4 podle oficiálního sdělení od AMD. Ale přece jenom možná na otázku po IPC Zenu 4 máme odpověď. Objevily se totiž úniky ze dvou zdrojů, které IPC uvádějí, a má jít ne o počty, ale o údaje od insiderů. Musíme upozornit, že není zaručeno, že jsou tyto informace opravdu reálné a přesné. Úplně nevěrohodně ale nevypadají a je to v této situaci asi nejsolidnější záchytný bod pro ty, kdo si chtějí o Zenu 4 a Ryzenech 7000 udělat představu.
Zdroj číslo jedna: (vyšší) jednociferné zlepšení
Nejdřív se povídání o IPC objevilo od youtubera Moore's Law is Dead. Ten měl v nedávné době správné informace například o Epycu „Bergamo“ s jádry Zen 4c, takže aspoň nějaké insiderovské zdroje bude mít. Tento youtuber přiznal, že jeho vlastní předešlé odhady nárůstu IPC byly dost přestřelené (na druhou stranu AMD asi zase překonalo očekávání co do frekvencí).
Aktuálně mu údajně jeho zdroj poprvé uvedl konkrétní nárůsty IPC, které má Zen 4 přinést. Pro pořádek – IPC znamená „Instructions per Cycle“, ale hovorově se tím myslí, o kolik se změní výkon při dané konstantní frekvenci neboli výkon na 1 MHz. Pokud máte dvě CPU, každé se stejnou frekvencí, a jedno má o 50 % lepší IPC, pak bude mít celkově o 50 % vyšší výkon.
Podle tohoto zdroje údajně má být nárůst IPC u Zenu 4 asi o 7–9 % proti Zenu 3, přičemž je to údajně číslo platící pro aplikace typu productivity. Jaké přesně, není řečeno, ale pod toto označení se vejde leccos – MS Office, Photoshop, OCR aplikace, práci s fotografiemi, ale třeba i testy PCMark. Je to tedy jednociferné číslo, ale přece jen o něco lepší než pesimistické údaje okolo 5 %.
Moore's Law is Dead také uvádí, že finální frekvence Ryzenů 7000 bude ve skutečnosti o něco lepší, než co předvedly ES vzorky na Computexu, což může konečný výkon dál o chloupek zlepšit. Zcela maximální boosty dostupné jen pro jednovláknové zátěže mají být výš – minimálně podle něj dosáhnou 5,6 GHz. Existují prý i vzorky s ještě o trošku vyšším boostem, ale není asi úplně zaručené, zda se takto brutální takty opravdu AMD podaří dostat i do sériové výroby. Přece jen, byly by to frekvence vyšší, než dosáhl Intel u speciální edice CPU Core i9-12900KS, která používá výběrový křemík. A doteď se mělo za to, že výrobní procesy Intelu dosahují nejvyšší takty.
Pokud bychom tedy dali dohromady uváděné hodnoty nárůstu IPC s tímto taktem, vychází nám, že teoreticky by jednovláknové aplikace mohly na nejvýkonnějším Ryzenu 7000 (při 5600 MHz) být až o 21 % rychlejší než na Ryzenu 9 5950X (5050 MHz) – pro 7% nárůst IPC. Nebo až o 23 %, pokud by platilo IPC vyšší o 9 %. Je to ale opravdu „až“, také se může stát, že procesor maximální single-thread boost nebude držet dlouhodobě nebo že škálování s frekvencí nebude úplně lineární. Také mějte na paměti, že jde o výkon v aplikacích. Výkon ve hrách se může vyvinout jinak.
Zdroj číslo dva: IPC v all-core zátěži stoupne o něco víc
Druhým zdrojem je web Angsronomics, který se objevil na scéně před několika dny, ale jeho prvním dílem byl docela rozsáhlý únik detailních parametrů pro čipsety AMD B650, X670 a X670E, podle kterého se zdá, že web má dobré zdroje. Je to tedy zase nezaručená informace, ale asi se dá říct, že hodná pozornosti. Autorem tohoto webu ostatně může být (pod přezdívkou SkyJuice) někdo, kdo se na leakerské scéně pohyboval již předtím.
Angstronomics neuvádí totéž co Moore's Law is Dead, ale je to velmi blízko, takže k sobě asi obě verze sedí. Podle jeho zdrojů je prý pro architekturu Zen 4 očekávané zlepšení IPC +7 % v jednovláknových úlohách, ale v mnohovláknových úlohách se čeká nárůst IPC +10 %. Proč vyšší než v ST? Mohlo by to být proto, že s 1MB L2 cache nebudou jádra vytvářet při zátěži všech vláken takový tlak na sdílenou L3 cache. Nebo by to mohl být vliv vyšší propustnosti pamětí DDR5, která nebude 16 jader tolik brzdit jako DDR4. A nebo to také může znamenat, že SMT bude přidávat víc výkonu než u Zenu 3 (třeba i díky větší 1MB L2 cache). To je něco, co se v jednom vlákně neprojeví a naměříte to až v MT zátěži.
Performance Per Clock (PPC) targets for the Zen4 core are targeted at +7% Single-Thread PPC, +10% Multi-Thread PPC over their Zen3 core, with significantly higher PPC for memory sensitive workloads thanks to DDR5 while core execution bound workloads like Cinema4D have a lower PPC improvement.
Šílené frekvence?
Angstronomics uvádí i něco k frekvencím. A to je také docela bomba, potvrdí-li se. AMD má údajně ve dokumentech uvedené parametry vzorků procesorů Ryzen 7000, které by měly jít maximálním boostem dokonce až na 5850 MHz. Toto by asi zase byl absolutně maximální strop pro jedno vlákno a je docela možné, že bude dosahován jen výjimečně a krátkodobě. A na krabičce bude napsáno nižší číslo (třeba těch 5,6 GHz).
Angstronomics upozorňuje, že není jasné, že se takto šíleně vysoko nataktovaný Ryzen 7000 opravdu dostane na trh. Může se třeba ukázat, že tento takt nebude stabilní, nebo že ho zvládne tak málo čipů, že se taktový model prostě nebude moci prodávat. Nebo by mohlo jít o nějaký háček typu, že CPU bude potřebovat vražedné napětí a chlazení na nižší než pokojovou teplotu („chiller“ nebo podobnou exotiku). Nebo dokonce ani tento ES vzorek nemusí existovat a může jít jen o dokumentaci ke konfiguraci, kterou by AMD chtělo, ale vůbec se nedá z 5nm procesu TSMC vytřískat. Toto tedy berte s obrovskou rezervou a spíš pro zajímavost.
Regarding frequency targets, the game demo showing 5.55GHz maximum frequencies was also not with the final version. While Angstronomics is aware of an Ordering Part Number (OPN) that is fused for a 5.85 GHz Fmax, we will have to wait and see what the retail stepping fuses will be set at.
Nicméně, pokud by náhodou tchajwanská high-tech motyka spustila, kombinace IPC zvýšeného o 7 % a tohoto taktu by vedla k až o 23,9 % lepšímu jednovláknovému výkonu v porovnání s Ryzenem 9 5950X (za předpokladu jeho boostování na 5050 MHz).
Angstronomics také mluví o tom, že 7% zlepšení IPC v jednom vlákně je interní cíl. AMD ale v minulosti často veřejně uvádělo relativně konzervativní cíle a poté je o něco překonalo (například interní cíl pro Zen 2 prý na začátku byl 8% zlepšení IPC, ale nakonec jádro dopadlo lépe; Zen měl mít o 40 % lepší IPC než 28nm Excavator, ale nakonec AMD uvádělo +52 %). Je otázka, zda je tady také řeč o čísle, které je předběžné a má tento potenciál pro zlepšení. Pokud by se například IPC zlepšilo ne o 7 %, ale o 9 %, pak frekvence 5,85 GHz dosáhne o 26 % lepší ST výkon. Ale je možné, že v této fázi vývoje už údaj o IPC není takto nejistý/rezervovaný, a tudíž těch 7 % už je hotová věc.
Die shrink Zenu 3 by vypadal jinak
Jak už bylo řečeno, zatím tyto informace berte s rezervou. Dokud se nepotvrdí v testech, nebudeme mít jistotu, že tyto úniky také nebyly mimo (a ještě víc berte s rezervou čísla o celkovém nárůstu, které jsme dopočítávali my). Ovšem 7–9 % nezní vůbec nerealisticky, to už bychom asi dřív pochybovali o těch frekvencích vyšších než 5,6 GHz.
Tip: Unikly první detaily Zenu 4. Zvětšení L2 cache a TLB, podpora AVX-512, snad i počet ALU
Mimochodem, nepravděpodobnost oněch názorů, které si dovolily označit Zen 4 ze pouhý die shrink Zenu 3, tedy převod staršího jádra na nový výrobní proces, možná ukazují i ty vysoké frekvence. Nárůst maximálního boostu z 5050 MHz na 5600 MHz (nemluvě o tom, kdyby se potvrdilo těch 5,85 GHz) a bezproblémové držení 5,5 GHz ve hře snad dokonce na více jádrech (ne však všech) je výrazně nad očekáváními. Je to víc, než co přinesly minulé přechody na nový výrobní proces.
Je proto pravděpodobné, že se nejedná jen o efekt 5nm procesu, ale že na tyto monstrózní takty musely jádru pomoci úpravy v architektuře – mohlo by to být například prodloužení pipeline o jeden nebo více stupňů, nebo třeba zvýšení latence L1 cache – ale podobných úprav zvyšujících frekvenční potenciál asi architekti CPU mohou provést mnoho i na místech v jádře, která nejsou přímo vidět. Přidání stupně do pipeline opravdu není něco, co může udělat „die shrink“, tím vzniká v podstatě nová architektura. A i menší úpravy při zachování hloubky pipeline jsou pořád změny architektury, i když přidávají jen megahertzy a ne nové ALU nebo instrukční dekodéry.
O kolik podle vás naroste IPC (výkon na 1 MHz) procesorové architektury AMD Zen 4 proti Zenu 3?
Zdroje: Moore's Law is Dead, Angstronomics