MCST, tedy Moskevské centrum technologií SPARC (původně totiž vyvíjelo tuto architekturu, nikoliv vlastní), má v současnosti na trhu čtyřjádrový 65nm procesor Elbrus-4C – nebo Elbrus-4S. Panuje totiž trochu zmatek v jejich značení. V azbuce je samozřejmě znak vypadající jako naše C ve skutečnosti S, takže Эльбрус-4С na čipu by logicky mělo znamenat Elbrus-4S. Jak ale vidíte ze slajdů ze zářijové konference Russian Super Computing Days, sám výrobce ve vlastních materiálech psaných anglicky používá verzi „Elbrus-4C“. Každopádně, na rok 2016 a následující jsou plánovány další dvě generace: Elbrus-8C a Elbrus-8CV. Vzhledem k tomu, že znak jako „V“ se v azbuce ani nevyskytuje, je tato část označení zřejmě psána latinkou, jakkoli je to matoucí. Takže to vypadá, že C je správně.
Obě architektury budou vznikat na 28nm procesu TSMC, nicméně generačně budou velmi vzdálené. Elbrus-8C by se měl začít vyrábět v první polovině příštího roku a vzorky by dle plánu měly být hotové ještě před koncem letoška. Elbrus-8CV má vyplodit první vzorky až v druhém čtvrtletí roku 2018 a do výroby by pak měl jít až v jeho čtvrtém kvartále. Pokud jej ovšem nepostihne zpoždění.
2016: Elbrus-8C
Elbrus-8C má poskytnout podstatně vyšší výkon: počet jader s zvýší ze čtyř na osm, ale navýšena bude také pracovní frekvence. Zatímco Elbrus-4C běžel jen na 800 MHz, Elbrus-8C již má mít takt 1,30 GHz. Ovšem také TDP má narůst, ze 45–60 W u architektury 4C na 60–90 W. Za jeden takt má čip údajně zvládat přes 30 („30+“) operací, což je víc, než kolik MCST uvádí pro Elbrus-4C (25), takže parně dojde i na nějaké zvýšení IPC. Vysvětlením by mohlo být rozšíření instrukčního slova, neboť jde o architekturu VLIW.
Procesor bude mít rovněž změněný systém pamětí cache – místo 2 MB bude mít L2 cache každého jádra jen 512 KB (díky čemuž by mohla mít nižší latenci) a CPU dostane L3 cache s kapacitou 16 MB, sdílenou pro všechna jádra. MCST uvádí, že teoretický výpočetní výkon Elbrusu-8C by měl činit 250 GFLOPS v jednoduché a 125 GLFOPS v dvojité přesnosti. Pro Elbrus-4C se přitom udává 50/25 GFLOPS.
Roadmapa procesorů Elbrus-8C, Elbrus-8CV
Pro čip bude vyvinuta také nová čipová sada KPI-2, jež by měla být uvedena současně. Tento čip bude vyráběn také u TSMC, ale na 65 nm. Poskytne Elbrusu čtyřkanálový řadič pamětí DDR3 na taktu 1600 MHz, řadič PCI Express s celkem 20 linkami a funkce jižního můstku. Podporováno bude 6Gb/s rozhraní SATA s osmi porty, osm portů USB 2.0 a také tři gigabitová síťová rozhraní Ethernet.
2018: Elbrus-8CV
Elbrus-8CV by měl opět proti předchůdci přinést podstatné zvýšení výkonu, tentokrát ale bude asi hlavně architektonické. Stále osmijádrový čip má zrychlit na 1,50 Ghz a velikost cache bude stejná jako u 8C. Rychlost bude zvýšena výrazným navýšením IPC – jádra Elbrusu-8CV mají údajně vykonávat až „50+“ operací za takt. Bude tedy zřejmě použito výrazně větší instrukční slovo, takže v jednom taktu program ke zpracování odešle víc instrukcí spojených do balíku. Ovšem při takto vysokém paralelismu se bude muset také hodně vytáhnout překladač, aby dokázal výpočetní prostředky navíc saturovat.
Elbrus-8CV má zhruba zdvojnásobit matematický výkon jádra za takt. Architektura dnes podle MCST umí za takt 24 operací s plovoucí desetinnou čárkou nad hodnotou s jednoduchou přesností (32 bitů) a 12 operací při dvojité přesnosti (64 bitů). Elbrus-8CV má jedním jádrem za jeden takt zvládnout dvojnásobek. Celkový hrubý výkon v jednoduché přesnosti má být víc něž 512 GFLOPS, v dvojité 256 GFLOPS.
TDP Elbrusu-8CV má být dle plánů nezměněné, tedy 60–90 W, i když velikost čipu značně stoupne. Zatímco Elbrus-8C měří údajně 321,4 mm², Elbrus-8CV naroste na nějakých 435 mm², což už spíše než CPU připomíná výkonné GPU. Je možné, že již bude mít integrovaný paměťový řadič. Pokud ne, dostane alespoň nový čipset – má již totiž místo DDR3 podporovat paměti DDR4. Řadič bude jaždopádně opět čtyřkanálový a zvládne DDR4 na taktu 2400 MHz.
Díky binárnímu překladu lze spustit i Windows
Čipy Elbrus se musí vzhledem k exotičnosti architektury používat s vlastním portem Linuxu, což omezuje šíři jejich použití. MCST pro ně proto vyvíjí technologii dynamického binárního překladu v softwarové mezivrstvě. S tou je možné používat software pro architekturu x86 a dokonce i operační systémy – běží pod ní prý DOS, Windows XP/7, QNX, Linux a další. Výkon má přitom být až na úrovni 80 % rychlosti nativního kódu (otázka ale je, zda by to potvrdily i nějaké reálné testy).
Pro Elbrusy je vyvinut softwarový binární překladač, umožňující běh kódu pro architekturu x86/PC
I tak ale patrně Elbrusy stále nedoznají nějakého většího ohlasu mimo určitá citlivá průmyslová odvětví či vojenský průmysl. Pro PC to bude hardware příliš drahý, takže i dostupnost asi bude velmi omezená.
Zdroj: MCST (prezentace na Russian Super Computing Days)