Z AMD zřejmě unikly detaily jádra Zen. Konec modulů, víc ALU, HT, 256bitové SIMD

28. 4. 2015

Sdílet

 Autor: Redakce

Už i AMD opatrně přiznalo, že to má momentálně v oblasti procesorů těžké a k většímu vzmachu se nadechne až v roce 2016 s 14nm procesem a novou architekturou Zen. O té jsme se zatím dozvěděli jen střípky ohledně podporovaných instrukčních rozšíření, včera ale poprvé vypluly na hladinu internetových vod bližší detaily samotného jádra. Tedy pokud budeme věřit úniku, který se objevil na německém fóru Planet 3DNow!. Pokud je pravý, pochází z prezentace, kterou firma ukáže 6. května během akce AMD Financial Analyst Day.

Na zmíněném webu nejprve anonym s přezdívkou „insider2015“ vložil schéma jádra Zen, které vidíte níže. Poté tentýž uživatel připojil údaj, že nové jádro má mít rozměr (zřejmě bez L2 cache) pod 10 mm². To by bylo poloviční proti tomu, co měří modul Excavator na 28nm procesu, Zen ale zřejmě bude 14nm. A dnes přidal i další slajd. Podle zápatí mají tyto informace být prezentovány investorům a analytikům na zmíněné akci příští týden. Osobně jsem spíše nakloněn věřit, že jde o reálné informace, zaručeno to ale zatím nijak není.

Schéma jádra Zen je jen základní, nicméně řadu podstatných věcí lze hned vyčíst. Za prvé, bude opuštěn koncept modulu Bulldozer se sdílenými částmi. Každé jádro bude mít vlastní FPU, dekodéry, schedulery, celočíselnou část, L1 a L2 cache (ta má kapacitu 512 KB, takže by mohla být rychlejší než 2MB u Bulldozeru a jeho dětí).

Architektura jádra Zen ve srovnání s modulem Excavator (Zdroj: fórum Planet3DNow!)
Architektura jádra Zen ve srovnání s modulem Excavator (Zdroj: fórum Planet3DNow!)

Jádro bude širší

Za druhé, jádro by mohlo být podstatně výkonnější než jádro rodiny stavebních strojů. Celočíselná část si z čtyř pipeline polepší na šest, bohužel nevíme, jakého typu. Přirozená a pravděpodobnější by byla kombinace tří aritmeticko-logických jednotek (ALU) a tří AGU (load/store), což je o polovinu lepší než u Bullodzeru, který měl po dvou. Potenciálně výkonnější by bylo použití čtyř ALU, jenže kombinace jen se dvěma AGU by asi byla nevyvážená.

Jde o nepravděpodobnou variantu (4 ALU by si AMD spíše schovalo až na další evoluci jádra), ale úplně vyloučit ji nelze. Takové uspořádání má totiž ARM jádro Cyclone od Applu – a právě v této společnosti pracoval manažer projektu Jim Keller před svým návratem do AMD. Nicméně Cyclone slouží pro jinou ISA a jiné účely, takže tuto souvislost raději nepřeceňujte – všechny dosavadní jádra od AMD měla vždy poměr ALU a AGU jedna ku jedné.

Jednotka FPU má zdá se opět koncepci tradiční pro AMD – bude oddělená od celočíselné části a zároveň bude implementovat všechny instrukce SIMD (i ty celočíselné). Má stejné tři pipeline jako Steamroller – dvě FMAC a jednu MMX. Ovšem obě FMAC budou mít dvojnásobnou šířku 256 bitů, což umožní zpracovat instrukce AVX/AVX2 v jednom kroku – propustnost tedy bude dvě tyto instrukce za takt v každém jádře. Výkon v SIMD tedy bude s použitím AVX/AVX2 potenciálně mnohem vyšší.

AMD zřejmě přijme za svou technologii SMT

Kolik bude mít Zen dekodérů není jasné, čekal bych ale asi čtyři, jako u Bulldozeru (ale také všech architektur Intelu od Conroe po Broadwell). Všimněte si nicméně, že od frontendu směřují jak do celočíselné, tak do FPU části dvě šipky, podobně jako do sdílené FPU v starší modulární architektuře. Jádro tedy s vysokou pravděpodobností podporuje technologii analogickou HT (obecně se též hovoří o SMT) u Intelu a bude zpracovávat dvě vlákna naráz. Od toho lze čekat zvýšení celkového vícevláknového výkonu, neboť druhé vlákno může vytížit prostředky, které první vlákno nechává na ocet.

 

Druhý slajd, zveřejněný stejným „vypouštěčem“, pak ukazuje, že základní jednotkou v procesorech založených na Zenu bude čtveřice jader spojených se sdílenou L3 cache o velikosti 8 MB. Těchto jednotek může být v CPU více, propojených „vysokorychlostním“ rozhraním. Dozvídáme se také, že architektura pamětí cache je oproti například sérii K7/K8/K10 plně inkluzivní – vše v nižších stupních mezipamětí je zrcadleno ve vyšších, což usnadňuje jejich synchronizaci mezi jádry. Podle slajdů se návrh Zenu bude dát použít jak pro úsporná, tak pro vysoce výkonná CPU.

Základním stavebním kamenem procesorů AMD na bázi Zen bude jednotka čtyři jader se sdílenou L3 cache (Zdroj: fórum Planet3DNow!)
Základním stavebním kamenem procesorů AMD na bázi Zen bude jednotka čtyři jader se sdílenou L3 cache (Zdroj: fórum Planet3DNow!)

Zen by mohl mít podstatně lepší IPC i celkový výkon

Protože jsou zatím venku jen tato základní schémata, nelze ještě dělat moc ambiciózní předpovědi. Je ale jasné, že jádro Zen je „širší“, s třemi ALU a dedikovanou 256bitovou FPU bude moci šahat po značně vyšších výkonech na jedno vlákno. Navíc z něj skrze SMT může vydřít i lepší vícevláknový výkon. Při stejném počtu jader bude tedy Zen zřejmě o hodně výkonnější než stavební stroje, pokud ovšem nebude mít výrazně redukovanou frekvenci.

Pro srovnání: tři ALU měly architektury Intelu od prvního Core 2 přes Nehalem až po Ivy Bridge (Haswell přidal čtvrtou), což lze asi brát jako rozsah možných úrovní výkonu na jeden megahertz, kterých by Zen mohl dosáhnout. Tři ALU a tři AGU měly i K7 až K10 od AMD. U nich ale šlo o méně pružný návrh se třemi oddělenými schedulery pro každý pár ALU/AGU, takže bych čekal, že IPC Zenu bude i výrazně lepší než IPC architektury K10. Navíc by Zen měl mít účinnější predikci větvení a další zlepšováky, které se objevily v novějších procesorových architekturách. Asi největší otázka je nyní, jak vysokých taktů se bude AMD dařit s tímto jádrem dosahovat při akceptovatelné spotřebě. Neboť bez rozumného taktu (nad 3 GHz a čím výš, tím líp) samotné IPC nepomůže.

Na závěr bych raději znovu připomenul, že autenticitu zveřejněných schémat ještě nemáme potvrzenou, takže raději vše berte s rezervou. Pravda by snad měla vyjít najevo šestého a doufejme, že se též dočkáme nějaké roadmapy naznačující, kdy bude Zen na trhu. Prozatím víme jen zhruba, že by se procesory se Zenem měly objevit nejdříve v roce 2016. Podle neoficiálních a neověřených zpráv by nová architekura mohla příští rok přijít do serverových Opteronů, ale také do desktopových procesorů s kódovým označením Summit Ridge.

ICTS24

Zen, ilustrační foto

Zdroje: Planet 3DNow!, fórum (1, 2, 3)