Nové „lidové“ procesory Sparc mají osm jader, 8× SMT a integrovaný InfiniBand

1. 9. 2015

Sdílet

 Autor: Redakce

V srpnu jsme psali o tom, že Oracle pracuje na procesorech s kódovým označením Sonoma, které by údajně měly po letech přinést na svět levnější CPU architektury Sparc – nebo alespoň čip levnější, než je u této „enterprise“ platformy momentálně norma. Takový krok by mohl této dnes spíše okrajové instrukční sadě přinést oživení a širší rozšíření, Sonoma by tudíž mohla být důležitým procesorem. Koncem měsíce přednesli zástupci Oraclu tyto čip konečně poodhalili na procesorové konferenci Hot Chips.

Procesory Sonoma budou odvozené od highendových Sparců M7, které společnost Oracle prezentovala na stejné akci před rokem. Na rozdíl od těchto čipů, které míří na serverovou špičku, by ale Sonoma měla být řešením, které dostane Sparc i do mainstreamovějších serverů za dostupnější ceny. Za tímto účelem je jednak samotný procesor poněkud zmenšen a zjednodušen, zároveň ale Oracle sníží i cenu celé platformy zjednodušením I/O, potřebných komponent na základní desce a integrací důležitých periférií. Výsledkem má eventuálně být procesor, na němž lze stavět menší obvykle dvouprocesorové servery s podobnou hustotou integrace, jako lze mít s Xeony E5.

Procesory Sparc rodiny Sonoma (Hot Chips 27)
Procesory Sparc rodiny Sonoma (Hot Chips 27)

 

Méně je někdy více

Zatímco Sparc M7 má nést 32 jader s architekturou označenou S4, Sonoma jich bude obsahovat jen osm na čipu vyrobeném 20nm procesem u TSMC, architektura S4 je však zachována. Zároveň budou tyto procesory v podstatě čipy typu SoC, nebudou tedy potřebovat mnoho další externí infrastruktury. To je klíčem k potřebnému snížení ceny, komplexnosti a potažmo velikosti základní desky jedné serverové instance. Díky stejným faktorům se také značně zlepší spotřeba, v této sféře velmi důležitá.

 

Předchozí generace Sparců se srovnatelnými parametry (Oracle pro srovnání používá řadu T5) potřebovaly řadu externích můstků a řadičů, nebo například buffery u operační paměti. Sonoma bude naopak používat klasické paměti DDR4 s taktem 2133/2400 MHz. CPU má celkem čtyři kanály (dva dvoukanálové řadiče); podporovány jsou dva moduly DIMM na kanál a celková kapacita může být až 1 TB pro každý procesor. Ty mají být v systému obvykle dva, čipy ale mají čtyři duplexní 16Gb/s koherentní linky.

Procesory Sparc rodiny Sonoma (Hot Chips 27)
Sonoma integruje na čip řadu komponent, servery budou menší, levnější a úspornější (Hot Chips 27)

Sonoma má dále integrovány dva řadiče PCI Express 3.0 ×8 pro připojení úložišť přímo k procesoru a také síťovou konektivitu, čímž máte v podstatě serverový stroj hotov. Pro síťování ale Oracle nepoužívá Ethernet, nýbrž InfiniBand. Procesor má integrována dvě rozhraní InfiniBand, každé s propustností 56 Gb/s (FDR ×4) obousměrně. Integrovaný InfiniBand činí z těchto CPU ojedinělou záležitost a spolu s příslibem relativně levné platformy by tím pádem Sonoma mohla být pro některé druhy serverů a klastrů dosti zajímavá.

Struktura čipu Sonoma (Hot Chips 27)
Struktura čipu Sonoma (Hot Chips 27)

 

Jádro S4

Samotné jádro S4 je stavěno na zpracovávání dvou instrukcí v jednom taktu („2-issue“) a používá architekturu typu „out of order“ s dvěma ALU a po jedné jednotce pro load/store, větvení, FPU a instrukce SIMD. Jádro je stavěno na agresivní využití SMT – každé může zpracovávat až osm vláken naráz, přičemž počet těchto logických vláken může CPU dynamicky měnit od osmi až po jedno jediné. Oracle s těmito CPU klade důraz také na využití specializovaných akcelerátorů. Ty zajišťují jednak kryptografii s širokým sortimentem algoritmů (kromě AES třeba DES/tripple DES, Camellia, RSA, hashovací funkce MD5, různé typy SHA), integrovány jsou ale i specifické akcelerátory DAX pro databáze v RAM.

Procesory Sparc rodiny Sonoma (Hot Chips 27)
Schéma jádra S4 (Hot Chips 27)

Uspořádání oněch osmi jader bude poněkud složité. Jsou rozdělena do dvou čtyřjádrových klastrů, v jejichž rámci je sdílena L3 cache o kapacitě 8 MB (celkem jí má tedy Sonoma 16 MB). Jádra mají své vlastní L1 cache s kapacitou 16+16 KB pro data a instrukce. Nezvyklé je, že rozdělaná mezi data a kód je i L2 cache – instrukční L2 má 256 KB sdílených mezi čtyřmi jádry v klastru, kdežto také 256KB datové L2 cache jsou v klastru dvě, sdílené vždy párem jader.

Procesory Sparc rodiny Sonoma (Hot Chips 27)
Procesor Sonoma je složen ze dvou čtyřjádrových klastrů (Hot Chips 27)

 

Podobně jako byl Sparc M7 prezentován dlouho před svou reálnou dostupností (která doposud nenastala), je i odhalení architektury Sonoma předběžné. Ani tyto Sparcy se zatím nevyrábějí a nemáme zatím ani žádný výhled na to, kdy by se na trhu mohly objevit – teoreticky by to opět mohlo trvat i rok či déle. V jakém stádiu příprav nebo výroby se nacházejí, bohužel prozrazeno nebylo.

bitcoin_skoleni

Na závěr si ještě můžete prohlédnout další zveřejněné detaily přímo ve slajdech z Hot Chips, jak je dal dohromady web ComputerBase:

Zdroje: The Platform, ComputerBase