Poslední roky ukázaly, že není radno se ve všem spoléhat na globální trh a kritická odvětví jako čipový průmysl je dobré mít vlastní. To platí i pro Evropu či EU. Jak už jsme párkrát psali, existuje v jejím rámci projekt na lokálně vyvíjené procesory a GPU či akcelerátory AI, které by byly bezpečnou alternativou pro superpočítače, ale eventuálně také třeba daly základ i řešením pro automobily. V tomto programu vzniklý procesor SiPearl Rhea se přiblížil realitě, ale nabral dost nepříjemné zpoždění, kvůli kterému asi jeho první generace nebude mít moc velký úspěch.
Projekt Evropského výpočetního hardwaru European Processor Initiative (EPI), primárně zaměřeného na superpočítače, existoval už v roce 2018, takže v podstatě předjímal světové problémy, které přišly poté. Pod záštitou Evropské komise v něm různé firmy jako třeba STMicroelectronics, BSC nebo Atos vyvíjejí jednak ARM procesory, jednak výpočetní akcelerátory (u těch se počítá s využitím RISC-V) pro použití v superpočítačích a pro umělou inteligenci.
CPU v rámci EPI vyvíjí společnost SiPearl a je jedním ze serverových procesorů architektury ARM, které v posledních letech přicházely na trh od Amazonu, Microsoftu a teď i Googlu. Stejně jako tyto „hyperscale“ společnosti SiPearl staví na licencované architektuře od ARMu, což dovoluje skočit do tohoto náročného oboru poměrně rychle skoro od nuly, ale úplně triviální to samozřejmě není.
První (novodobý) evropský výkonný procesor má dva roky zpoždění
Vývoj prvního procesoru SiPearl, který má jméno či kódové označení Rhea (či Rhea1, pokud jde o jeho nynější první generaci), podle aktuálně zveřejněných informací postihlo poměrně značné zpoždění. O tomto CPU jsme měli zprávy již na začátku roku 2020 a byl to jeden z prvních projektů, který měl používat výkonná „HPC“ jádra ARM Neoverse-V1 s SVE. Procesor měl mít 72 jader Neoverse V1 a výkonný paměťový subsystém s čtyřmi kanály pamětí DDR5, ale současně také s rychlou cache tvořenou pamětí HBM2e. Plánovaná byla i podpora PCI Expressu 5.0.
Avšak vydání stále ještě nenastalo a SiPearl teprve nyní oznamuje tzv. tapeout, tedy dokončení (elektronického) návrhu a jeho odeslání k výrobě do TSMC – tapeout proběhl někdy začátkem letošního roku. Výroba byla původně plánována na 6nm procesu, takže snad už rozběhnutí nebude tak obtížné, pokud tedy nebudou objeveny vážné chyby v návrhu, které by si vyžádaly náročnější revize.
Ovšem komerční vydání čipů je kvůli obvyklému procesu zprovoznění křemíku a jeho příprav a oprav prakticky vždy vzdáleno minimálně rok a někdy i déle od tapeoutu. To znamená, že opravdové vydání a komerční dostupnost procesorů SiPearl Rhea1 nastane až v roce 2025. S trochou štěstí to bude v jeho první polovině. SiPearl uvádí, že ze začátku roku 2025 budou k dispozici vzorky, poté asi ještě nějaké měsíce do finálního vydání uplynou. Původní vydání mělo přitom být v roce 2023.
Kvůli tomuto poměrně pozdnímu vydání bude procesor Rhea1 poměrně pozadu za zbytkem trhu. I pokud pomineme Intel a AMD (to letos vydává procesory Epyc 9005 s architekturou Zen 5, které by prý mohly být hodně velkým výkonnostním posunem), serverové procesory pro ARM mezitím poskočily minimálně o jednu generaci. Amazon měl architekturu Neoverse-V1 již v procesoru Graviton3 v druhé polovině roku 2022 a na konci roku 2023 oznámil či začal s nasazováním Gravitonu4 s jádry Neoverse V2, která již mají vyšší výkon (jsou derivátem architektury Cortex-X3, zatímco Neoverse-V1 by měla být podobná ještě Cortexu-X1). Také procesor Nvidia Grace už má jádra Neoverse-V2.
Rhea1: 80jádro s HBM2e
Na druhou stranu budou konečné specifikace o něco vyšší než původně plánované. SiPearl nyní parametry oficiálně představila během veletrhu ISC v Hamburgu. Procesor tvoří zřejmě monolitický čip vyráběný 6nm procesem TSMC, v kterém je integrováno místo dříve uváděných 72 rovnou 80 jader ARM Neoverse-V1, což by pořád mělo mít ne úplně špatný výkon. Je také dobré podotknout, že Neoverse-V1 podporuje instrukce SVE, které vykonává na dvou 256bitových jednotkách.
Následující generace jádra Neoverse-V2 má čtyři SIMD jednotky, ale snížila jejich šířku na 128bitů a přidala podporu SVE2. Čistě pro potřeby HPC sektoru v tradičním smyslu, tedy vědeckých floating-point výpočtů, tedy Neoverse V1 nemusí být zas tak v nevýhodě, teoretickou výpočetní kapacitu může mít podobnou.
Neoverse V2 nebo novější architektura by ovšem měly díky SVE 2 výhodu pro jiné druhy výpočtů (například AI), na které by v budoucnosti procesory SiPearl také měly mít kompetenci. Dlužno dodat, že podle SiPearl bude Rhea1 pořád i pro tyto úlohy dobře použitelné CPU (v případě umělé inteligence ale hlavně pro inferenci, už ne tak pro trénování), ostatně pro těžké AI zátěže jsou podstatné hlavně akcelerátory a CPU má hlavně za úkol je různě obsluhovat a řídit. Nezbývá ale než doufat, že další generace už budou mít vývoj hladší a takto opožděné nebudou.
Procesor SiPearl Rhea1 si proti třeba Gravitonu také zachová výhodu v pamětech. Má sice jen relativně užší čtyřkanálové paměti DDR5 (každý kanál podporuje dva moduly), ale k nim je nakonec opravdu přidaná paměť HBM2e od Samsungu (zde je také, podobně jako na použitém výrobním procesu, vidět to zpoždění, protože aktuální AI akcelerátory již používají HBM3 a přichází HBM3e). Použité jsou čtyři pouzdra, tedy s šířkou sběrnice 4096 bitů.
Procesor má také 104 linek PCI Express 5.0 pro připojení SSD, síťových adaptérů nebo GPU a jiných akcelerátorů. Může poskytnout 6 rozhraní PCIe 5.0 ×16 a další dvě pomocná rozhraní PCIe 5.0 ×4. Jádra, paměti a IO propojuje koherentní logika CMN-700 typu mesh.
To, že je použitá licencovaná architektura ARMu, která se mezitím již osvědčila jinde a Linux a serverový software je na ni připraven, by mělo znamenat, že po svém uvedení by procesory SiPearl měly jít relativně snadno nasadit do praxe. Dost bude ale záležet na tom, zda se pro ně podaří najít uplatnění, tedy výrobce serverů, kteří by je nabízeli, a provozovatele, kteří je pak budou nakupovat.
Je možné, že kvůli zpoždění nakonec Rhea1 bude hrát spíš roli prototypu a vývojové platformy sloužící pro přípravu na ostrý provoz následující generace procesoru, která by se asi mohla jmenovat Rhea2. Možná tedy od Rhea1 bude vyrobena relativně malá série a nakonec může jít o dost exotický hardware. Zda se ještě postaví nějaký superpočítač, ve kterém bude procesor použit, není jasné.
Zdroje: SiPearl, Tom’s Hardware