Intel ukázal obří GPU Xe HPC: čtyři druhy 7nm a 10nm čipletů, HBM2 a 3D vrstvy Foveros

1. 2. 2021

Sdílet

 Autor: Intel/Raja Koduri
Intel ukázal GPU Xe HPC vyráběné čipletovou technologií. Suverénně nejsložitější procesor, jaký jsme viděli, skládačku tvoří sedm různých technologií a minimálně 36 čipletů.

Minulý týden jsme psali o vydání prvních samostatných GPU Intelu coby karet Iris Xe pro desktop – ovšem jen pro OEM trh, protože karty zdá se ani nefungují v běžných PC a potřebují speciální podporu v BIOSu desky. Tato první 10nm generace GPU Intel Xe nebude mít asi moc velký dopad na počítačový trh, ale to se samozřejmě může změnit s jejími výkonnějšími následníky, kteří už jsou také na cestě.

Raja Koduri, který grafickému snažení polovodičového obra velí, teď ukázal vysoce výkonné GPU Intel Xe HPC, které bude pohánět superpočítač Aurora. Mělo by jít o velmi komplexní GPU označené „Ponte Vecchio“, o kterém jsme rozsáhle psali. A musíme říct, že ač zatím těžko říct, zda naplní očekávání na poli asfaltotrhání, tak minimálně jeho „fyzické půvaby“ předstihují všechna očekávání – něco podobně zajímavého jsme dlouho neviděli.

Tip: Intel odhalil extrémní GPU Ponte Vecchio: 7nm, CXL, čiplety a Foveros pro superpočítače

Fotografie čipu – tedy přesněj vícečipového MCM pouzdra – byla oficiálně zveřejněná na twitteru Koduriho a můžete ji vidět zde. Plocha substrátu a úhrnu čipů je asi hodně velká, jak lze odhadnout podle množství SMD součástek okolo okrajů.

GPU Intel Xe HPC GPU Intel Xe HPC (Zdroj: Intel/Raja Koduri)

Rozměry jednotlivých křemíků ovšem dost možná nejsou reálné. Vypadá to, že s fotkou se manipulovalo. Když se totiž podíváte na oba krajní sloupce čipletů, velice pravděpodobně jde o úplně stejné komponenty, jen je to na pravé straně čipu postupně osazeno vzhůru nohama. Výška čipletů sedí, ale šířka nikoliv – někdo nejspíš v Photoshopu části pouzdra natáhl nebo zúžil, aby konkurence nemohla tak snadno zjistit, jak přesně velké co je (inženýři ovšem asi nebudou tak snadno oklamání). Mimochodem, také kondenzátory(?) okolo mají nestejnou velikost, což asi manipulaci potvrzuje.

Čtyři různé výrobní procesy

Toto obří vícečipové pouzdro (čipletové GPU) je umožněné technologií Foveros, Koduri uvádí, že v mixu je rovnou sedm pokročilých technologí. Andreas Schilling z HardwareLuxxu si myslí, že jde o Foveros, křemíkové můstky EMIB nahrazující interposer, paměti HBM2 (či HBM2E?) a čipy z čtyřech různých výrobních procesů.

Samotné výpočetní čiplety jsou buď 7nm proces Intelu, nebo 7nm či novější technologie TSMC. Čip Xe Link pro I/O a propojení je vyráběný u TSMC, dále je tu čiplet s Rambo Cache, který je vyrobený next-gen 10nm procesem „Enhanced SuperFin“, který bude teprve použitý u procesorů Alder Lake. A poté by tu měla být ještě „základový čiplet“, který je vyrobený o generaci předcházejícím a nyní aktuálním procesem 10nm SuperFin jako Tiger Lake. Tato „Base Tile“ by zřejmě měla být uložená pod čiplety, které vidíte na snímku, takže je vlastně GPU dvouvrstvé.

Výrobní procesy použité u GPU Intel Xe HPC a ostatních grafických čipů Intelu Výrobní procesy použité u GPU Intel Xe HPC a ostatních grafických čipů Intelu (Zdroj: Intel)

Toto GPU Xe HPC je evidentně tvořené dvěma symetrickými částmi. Web WCCFtech uvádí, že se mu podařilo zjistit, co který čiplet dělá, jeho popis můžete vidět na následujícím obrázku. Po stranách by prý měly být čipy HBM2 (tedy paměti) a ve dvou protilehlých růžcích je onen Xe Link sloužící pro I/O, tedy připojení k procesoru a možná také k dalším GPU v uzlu superpočítače.

GPU Intel Xe HPC s částmi popsanými dle interpretace WCCFtechu GPU Intel Xe HPC s částmi popsanými dle interpretace WCCFtechu (Zdroj: WCCFtech)

Osm čipletů zhruba čtvercového tvaru uprostřed každé ze symetrických polovin by prý mohly být samotné výpočetní křemíky, tedy místo, kde se při práci budou mydlit všechny ty TFLOPSy. Čtyři úzké čiplety mezi nimi jsou prý Rambo Cache. Okolo této mozaiky jsou další úzké „čiplety“, ale toto jsou prý možné jen pasivní „vycpávky“ pro větší tuhost, neobsahující logické obvody – možná jsou nutné kvůli tomu, že je pod výpočetními čiplety a „Ramby“ ona Base Tile, která má možná větší plochu, tudíž je nutné po okrajích kus přidat, aby rozvaděč tepla na výsledném puzzle dobře seděl?

Protože plochy jednotlivých křemíků asi byly zmanipulované, moc bych se nezabýval nějakými odhady plochy. Také samozřejmě není jisté, zda těch manipulací nebylo víc, případně jestli se interpretace jednotlivých komponent od WCCFtechu nemýlí.

ICTS24

Galerie: Odhalení GPU architektury Intel Xe HPC, OneAPI a GPU Ponte Vecchio pro superpočítač Aurora

Půjde každopádně o hodně zajímavý hardware, podobný „rázovitostí“ třeba starým procesorům Power5, které také tvořilo velké množství čipů. Bude určitě zajímavé sledovat, jak si toto vysoce komplexní řešení poradí s výrazně jednodušeji stavěnými výpočetními GPU/akcelerátory Nvidie (nyní má na trhu generaci A100) a AMD (Instinct MI100), respektive jejich následníky (pokud ti také už nebudou podobné frankensteinské hybridy).

Zdroje: Raja Koduri, WCCFtech