Procesory nové generace s architekturou Zen začne AMD bohužel vypouštět až za rok (pokud nenastane zpoždění), nicméně už letos se k nim začaly objevovat informace. Zdá se, že v první generaci vytvoří AMD jeden osmijádrový čip, z něhož vzejdou desktopová CPU Summit Ridge a slepením více čipů pak Opterony a údajně také výkonná APU pro superpočítače, kombinovaná s GPU čipem Greenland. K posledním jmenovaným vypustil nyní web Fudzilla další uniklé informace, naznačující víc o tom, jak budou procesory architektury Zen fungovat.
Informace, které Fudzilla o těchto výpočetních APU dříve podávala, nebyly dvakrát přehledné a koherentní, nyní už ale vše působí o něco důvěryhodnějším dojmem. Tentokrát web přišel s informacemi o propojovací logice, kterou bude Zen používat pro komunikaci, a také se schematickým obrázkem, z nějž si lze udělat docela dobrou představu o stavbě zmiňovaného APU. To mělo podle dřívějších informací obsahovat šestnáct jader architektury Zen, GPU s označením Greenland a také paměť HBM. To zdá se stále platí. Schéma již ovšem jasně ukazuje, že tyto komponenty budou samostatnými čipy, tedy nikoliv integrované v jediném křemíku.
Celé APU bude tedy podobné letošnímu Fiji – kromě GPU a pamětí bude mít ale na interposeru přiděláno také CPU. GPU je v schématu označeno jako Greenland, zatímco CPU část má zřejmě kódové označení Zeppelin. Zdá se, že paměti HBM budou připojené ke GPU (což je asi dáno tím, že půjde o čip primárně určený do samostatných grafik), zatímco část CPU bude mít řadič pro konvenční paměti DDR4. Ten má mít čtyři kanály a pozor, údajně má pracovat s efektivní frekvencí až 3200 MHz, což by bylo docela dobré (Skylake a Haswell-E/EP oficiálně podporují 2133 MHz, Broadwell-E/EP má přidat 2400 MHz). Mohlo by to znamenat, že i Summit Ridge pro desktop by uměl takovéto takty, je ale taky možné, že se zde již bavíme až o nějaké následující generaci čipů, nikoliv o prvním 14nm Zenu.
Schéma HPC APU s grafikou Greenland (Zdroj: Fudzilla)
Zen má novou propojovací logiku s rychlostí až 100 GB/s
Další nová informace se týká způsobu, jakým budou všechny tyto záležitosti propojeny. AMD pro Zen podle Fudzilly chystá zcela novou propojovací logiku, která má na cestě mezi CPU částí a GPU poskytovat propustnost 100 GB/s. To by mělo být dost kapacity i pro plnohodnotný přístup GPU do systémové paměti, pokud budou použity ony čtyři kanály DDR4-3200 (jeden má teoretickou přenosovou rychlost 25,6 GB/s). Tato propojovací logika bude koherentní, takže CPU a GPU budou mít navzájem plně synchronizovaný obsah pamětí a cache, stejně jako CPU v standardním víceprocesorovém systému. Použití této logiky pro připojení GPU má podle uniklého materiálu eliminovat omezující propustnost a latence standardní sběrnice PCI Express; není bez zajímavosti, že podobné plány má s rozhraním NVLink také Nvidia.
Stejné koherentní linky budou zřejmě jednotlivé čipy CPU používat pro komunikaci mezi sebou ve slepencových procesorech a asi též mezi jednotlivými uzly ve vícesocketové desce. Tato propojovací logika by měla být implementována v hardwarových blocích PHY s flexibilní funkcí, které se mají dát alternativně využít jaké jiné IO – například jako řadič PCI Express. Díky tomu tento hardware nebude zahálet ani v čipech, prodávaných na trhu PC. Fudzilla fyzickou vrstvu těchto externích linek označuje také jménem GMI (Global Memory Interconnect). Není to zcela jasné, ale stejný druh koherentní propojovací logiky by snad mohla fungovat i přímo uvnitř čipu, kde by zajišťoval komunikaci mezi jeho částmi – jádry, cache, řadiči a tak dále.
Jméno či kódové označení čipu, pro nějž je schéma vytvořeno, zatím neznáme. Mělo by asi jít o první generaci APU pro superpočítače, které AMD chystá. Téměř určitě jde ale o jiný čip, než je koncept s označením EHP, o němž jsme psali dříve v tomto týdnu. Ten by v případě své realizace tvořil až nějakého z potomků zde započaté linie. První APU pro HPC by snad ale AMD chtělo začít prodávat už v roce 2016 nebo 2017.
Jaký bude mít první APU pro HPC výkon
Popisky u GPU Greenland uvádějí, že má mít teoretickou propustnost výpočtů přes 4 TFLOPS. Jelikož se ale jedná o APU určené pro sektor HPC, pravděpodobně je těch 4 TFLOPS v dvojité přesnosti. „Herní“ výkon Greenlandu v jednoduché 32bitové přesnosti by tudíž mohl být minimálně dvojnásobný, teoreticky dokonce tří či čtyřnásobný (běžné poměry rychlosti FP32 a FP64 jsou u GPU určených pro výpočetní nasazení 2:1, 3:1 a 4:1). U CPU podobné popisky nejsou, starší informace Fudzilly mu však přisuzovaly 16 jader Zen. Tomu by nasvědčoval onen čtyřkanálový řadič DDR4. Čipy Summit Ridge, které by APU mohlo na interposeru používat, mají totiž obsahovat osm jader a kanály dva, osazen by tudíž byl pár, propojený linkami GMI.