IBM začíná prodávat procesory Power10, v serverech E1080. Desky Talos ho nedostanou?

11. 9. 2021

Sdílet

 Autor: IBM
IBM vydává po čtyřech letech novou generaci svých RISC procesorů Power. Power10 používá 7nm proces a jedno CPU bude mít až 60 jader/240 vláken. Špatná zpráva je tu ale pro uživatele, které předchozí generace nalákala na svoji open source koncepci.

Pomalu to budou čtyři roky, co IBM vydalo poslední generaci procesorů Power, které pokračují tradici jedné z hlavních RISC architektur 90. let. Nyní přichází jejich nový pokračovatel, procesory Power10 s novou mikroarchitekturou jádra a vyráběné na moderním 7nm procesu. Přináší obligátní nárůsty výkonu, ale také velmi pokročilé I/O a také PCIe 5.0. Určitá vada je, že se zřejmě neobjeví v relativně dostupných deskách Talos.

S procesory Power10 vás neseznamujeme vůbec poprvé. Nyní totiž sice poprvé přicházejí reálně na trh, ale IBM je odhalilo už loni v létě, kdy prezentovalo jejich architekturu a další detaily na konferenci Hot Chips. Teď se tato z pohledu PC světa exotická CPU začínají prodávat, a to jako součást nových Power10 Serverů řady E1080 přímo od IBM. Tato řada používá SMT8 procesory Power10, kdy jedno CPU má až 15 jader, z nichž každé zpracovává osm vláken (takže celkem 120).

Křemík procesoru IBM Power10 Křemík procesoru IBM Power10 (Zdroj: IBM, via HardwareLuxx)

Servery E1080 jsou buď čtyřprocesorové (4S) nebo 16procesorové (16S), což při použití nejvyššího modelu CPU s 15 jádry dává až 1920 vláken na jeden server, u 4S serveru pak 480. K tomu je pak konektivita PCIe 5.0 (32 linek). IBM ji zřejmě poskytne jako první výrobce procesorů (jako se mu to povedlo u PCIe 4.0 v Power9), pokud tedy stihne fyzické dodávky serverů před tím, než Intel začne prodávat procesory Alder Lake/Core 12. generace (to prý bude 19. listopadu).

Server IBM Power E1080 Server IBM Power E1080 (Zdroj: IBM)

Servery používají paměti DDR4. V 4S modelu lze mít až 16 TB RAM (s 64GB moduly), 16S server podporuje i 128GB moduly, s nimiž ho lze osadit celkem až 64 TB paměti DDR4. Použité jsou ale speciální nekompatibilní moduly (CDIMM).

Server IBM Power E1080 z vrchu Server IBM Power E1080 z vrchu (Zdroj: IBM)

IBM Power10: SMT8 a MCM řešení na 7 nm

Procesor Power10 je, jak už bylo řečeno, nová architektura jádra. Je vyráběn na 7nm procesu, zatímco Power9 byl 14nm. Změna je ještě v tom, že toto CPU je vyráběno v továrnách Samsungu na technologii jeho EUV 7nm procesu. IBM ho zvolilo jako náhradního dodavatele, když ze hry vypadly GlobalFoudries, původní plán počítal se 7nm výrobou v tomto podniku.

Procesory jsou skládané z jednoho základního 7nm čipu, který obsahuje 16 jader, ovšem alespoň jedno je vždy vypnuté kvůli zvýšení výtěžnosti (takže každý čip s vadou v jednom jádru je pro potřeby IBM plně funkční), proto je jader maximálně 15. Z těchto čipů jsou stavené procesory buď s jedním, nebo se dvěma kousky křemíku. Servery E1080 zdá se používají jen jednočipové modely, které teď IBM nabízí s 10, 12 nebo 15 jádry SMT8 (ale nemusí to asi být kompletní nabídka). Tyto jednočipové procesory umožňují vytvořit až 16S server.

Loni firma oznámila, že bude existovat i dvojčipová verze, která ale možná bude dostupná až později, nebo v odlišném serveru. Tyto procesory mají díky dvěma čipům až 30 jader STM8 (takže 240 vláken). Ale protože čipy používají část komunikačních rozhraní k propojení obou křemíků, bude tato verze podporovat maximálně jen 4S servery. Mají ovšem dvojnásobnou konektivitu PCIe 5.0 (64 linek) a také dvojnásobnou propustnost pamětí díky zdvojení řadičů.

Open Memory Interface a PowerAxon

I/O a paměť je speciální kapitola. Procesor nemá přímo integrované řadiče pro DDR4, místo toho používá opět něco podobného bufferové architektuře. Z čipu vychází rozhraní OMI (Open Memory Interface), které je agnostické co do druhu použitých pamětí – může na něm tedy být DDR4, DDR5 nebo dokonce i jiné druhy pamětí, ale ty musí implementovat kompatibilitu s OMI. Asi není úplně pravděpodobné, že by se pro Power začaly vyrábět speciální čipy DRAM rovnou již mající rozhraní OMI, takže reálně asi bude potřeba bufferový čip na desce (trochu jako byly čipy Centaur u Power8) nebo na modulech. Servery E1080 patrně používají druhé řešení. Ačkoliv tedy paměti používají standardizované rozhraní, to bude kvůli izolovanosti platformy vyžadovat použití proprietárních paměťových modulů.

Vedle OMI mají procesory ještě konektivitu PowerAXON, která má také celkovou propustnost až 1 TB/s. Na toto rozhraní lze připojit FPGA, ASIC akcelerátory, úložiště, teoreticky ale také další specializované paměti (například nevolatilní).

SMT8 a SMT4

IBM používá ještě jednu zvláštnost, která je převzatá z minulých generací. Zmiňovali jsme, že jádro je SMT8 a podporuje 8 vláken na jedno jádro. Ve skutečnosti IBM toto SMT8 jádro tvoří spřažením dvou jader („slice“), kde každá slice má čtyři vlákna a dohromady téměř nic nesdílí.

To, že se dvě slice tváří jako jedno jádro, je patrně i s cílem zlevnit per-core licence enterprise softwaru. Tato architektura ale dovoluje zpřístupnit každé z těchto dvou jader zvlášť jako „SMT4“ jádro se čtyřmi vlákny. Použitý je v obou případech to stejný křemík, v němž by tedy tyto SMT4 modely procesorů Power10 měly mít buď 30 jader (jednočipová verze pro až 16S servery) nebo dokonce 60 jader (dvojčipové modely pro 1S až 4S servery).

Vzhledem k tomu, že jsou slice z velké části nezávislé, jejich spřažení nezvýší patrně IPC v jednom vlákně. U takto dvojnásobně širokého SMT8 jádra proto dostanete výrazně vyšší mnohovláknový výkon, ale prostředky navíc jsou využitelné právě až při běhu mnoha vláken najednou. Jednovláknový výkon by měl být u SMT4 i SMT8 podobný (a výrazně nižší než výkon jednoho jádra se všemi jeho vlákny).

Architektuře IBM Power10 jsme se podrobněji věnovali loni v tomto článku, takže v případě zájmu doporučujeme přečtení, opakovat všechny informace znovu zde asi nemá smysl.

Galerie: Odhalení procesorů IBM Power10, prezentace architektury na HotChips 32

Výkon?

V tiskové zprávě k vydání serverů E1080 jsou uvedené některé výkonnostní přísliby v porovnání se servery E980 (které měly procesory Power9). Jako obvykle je asi třeba je brát s rezervou, jelikož mohou být výběrové, navíc není moc jasné, jak se měřilo. Výkon Power10 bychom si proto měli „zařadit“ asi až tehdy, když vyjdou nějaké nezávislé testy.

Podle IBM ale má Power10 přinést až o 30 % lepší výkon na jedno jádro, což je mezigeneračně dobrý nárůst. Je ale také pravda, že je to proti CPU uvedenému v roce 2017, tedy pokrok za téměř čtyři roky.

Výkon v mnohovláknových aplikacích narostl o trošku víc, procesory Power10 mají mít až o 50 % lepší „škálování“ a výkon v obecných úlohách. Při porovnání spotřeby má ale poměr výkon/watt být až 3× lepší. V tom pomáhá lepší energetická efektivita 7nm procesu (byť ten od Samsungu je podle odhadů horší, než 7nm technologie TSMC).

Úlohy používající specializované jednotky mají vyšší nárůsty, například kryptografie AES má prý 2,5× lepší výkon na jedno jádro a díky speciálním jednotkám pro maticové násobení v každém jádru je výkon AI aplikací běžících přímo na CPU až 5× lepší než u Power9 (při inferenci).

Toto je srovnání zřejmě platné pro onu maximálně 15jádrovou jednočipovou verzi Power10 (SMT8) oproti předchozí generaci Power9, které mělo maximálně 12 jader (SMT8, verze se SMT měla samozřejmě dvojnásobek). Odtud tedy asi omezené pokroky. Mnohovláknový výkon generace Power10 by snad měla výrazně vylepšit ona dvoučipová verze s až 30 jádry SMT8, kterou ještě toto srovnání nezohledňuje.

Uvidíme ale, zda dvojčipová verze bude stíhat na tempo vývoje v serverových procesorech s86 a také na platformě ARM. Je pravděpodobné, že Power10 nepovede k nějakému masivnímu rozšíření této architektury v běžných serverech proti minulým generacím, IBM spíš asi bude držet své dříve získané niky v různých speciálnějších nasazeních.

Dostupnost tento měsíc, parametry neuvedené

IBM nesdělilo přímo žádné parametry procesorů, víme tedy jen, že zatím jsou k mání 10jádra, 12jádra a 15jádra (s SMT8), ale bez toho, že by byly sdělené frekvence nebo třeba spotřeby těchto CPU. Jediné vodítko, které máme, je v poznámkách k tiskové zprávě. Podle té mají 15jádrové (SMT8) procesory IBM Power10 zřejmě základní frekvenci 3,55 GHz a boost 4,0 GHz, nebo takovouto konfiguraci aspoň IBM použilo pro své oficiální benchmarky. Loni firma uváděla, že jednočipové verze budou dosahovat přes 4 GHz a dvojčipové přes 3,5 GHz (je možné, že těch víc jak 4,0 GHz bude mít turbo u 10jádra nebo 12jádra, takže plán se možná povedlo splnit).

Ani ceny firma neuvádí, ale to je na tom divné asi nejméně – v této chvíli budou CPU zřejmě dostupná jen v rámci IBM Power10 Serveru E1080 a samostatně se koupit (ani použít) dát nebudou. Platforma Power je otevřená a proto by se ještě mohly objevit také servery a desky dalších výrobců (v předchozích generacích to byl Tyan). Pro ně by se pak procesory asi mohly prodávat i samostatně.

Tip: IBM otevírá instrukční sadu Power. Je zadarmo jako RISC-V, poskytne bezplatně i jádra

Servery Power10 E1080 s SMT8 procesory Power10 se ale už teď dají objednávat a první zákazníci je mají dostat ještě před koncem měsíce, takže IBM patrně i stihne fyzickou dostupnost před koncem Q3 2021.

Galerie: IBM Power E1080, první servery s procesory IBM Power10

Power10 Talos pro běžný trh (zatím?) nebude

Přímo servery od IBM jsou dneska asi poměrně řídce používané. Běžnější uživatelé se v poslední době s touto architekturou procesorů setkávali hlavně skrze open source pracovní stanice Talos II (případně Talos II Lite) a Blackbird firmy Raptor Computing Systems. Ta převzala pomyslnou štafetu po víc jak 15 let starých počítačích Apple a stala se asi jediným v praxi (pro jednotlivého lidového uživatele) relevantním dodavatelem počítačů s procesory IBM Power.

Zatím to ovšem vypadá, že následníka stanic/desek Talos s procesorem Power10 firma nechystá, nebo alespoň ne v nejbližší době. Důvodem je právě ono (poměrně „hardcore“) open source zaměření, které Raptor používá jako hlavní marketingový tahák. Pro IBM Power10 nyní není možné vyrobit desku s plně open source firmwarem. Některé IO bloky (PPE I/O Processor) a paměťové rozhraní (OMI DRAM bridge, to jsou zřejmě buffery oněch speciálních pamětí, komunikující s rozhraním OMI) totiž vyžadují binární firmware, možná proto, že je v nich použito licencované IP (zřejmě od Synopsys). Není jasné, zda se někdy povede toto omezení odstranit, nicméně Raptor Computing Systems nyní avizuje, že kvůli němu jeho nabídka desek (a počítačů) zůstane na generaci procesorů Power9.

https://twitter.com/RaptorCompSys/status/1435510763402244105

bitcoin školení listopad 24

Samozřejmě to nemusí být definitivní rozhodnutí. Teoreticky by tu mohla být možnost, že je to z části firma chce tímto vyhlášením zabránit tomu, aby lidé přestali kupovat stávající generaci, tj. tzv. Osborne efektu, ale každopádně to asi vypadá, že v blízkém horizontu žádné desky Talos pro Power10 nebudou. Je ostatně možné, že objem těchto prodejů pro IBM nebyl příliš významný, a tak ani moc nehodlá tohoto svého zákazníka v projektu nové Power10 desky pro domácí uživatele nějak moc podporovat.

Zdroje: IBM, AnandTech, datasheet (via Talospace)