Meteor Lake je první procesor Intelu vyráběný jeho vlastním 4nm procesem, což je důležitý milník. Paradoxně je to současně i první procesor Intelu vyráběný u TSMC, protože řada jeho součástí je takto outsourcovaná – i to je milník. Jde totiž o první mainstreamový procesor Intelu používající čiplety či dlaždice a pokročilé 3D pouzdření. Skoro nad rámec toho už je, že má také nová jádra CPU, nové GPU a také novou jednotku NPU pro akceleraci AI.
Meteor Lake není úplně první takovýto procesor Intelu, protože experimentálně byla čipletová konstrukce vyzkoušena už před třemi lety u poměrně neúspěšného mobilního Lakefieldu (což byl také první big.LITTLE procesor od Intelu). V mainstreamových procesorech ale tato změna přichází až nyní.
Kombinování různých technologií (a dokonce od různých dodavatelů) v takto „disagregovaném procesoru“ umožňuje použít optimální výrobní proces pro jednotlivé části výsledného SoC – tedy levnější starší proces pro konektivitu a čipsetové bloky (hůře škálující na nové procesy) a drahý novější proces pro jádra CPU a GPU. Je také možné měnit jednotlivé komponenty, například ke stejnému základu přidávat různě výkonné GPU a CPU dlaždice.
Jednotlivé dlaždice/čiplety obsahují vlastní jednotku pro správu spotřeby (PMC), která jim pomáhá šetřit energii při nečinnosti. Spotřeba a šetřící režimy jsou řízené nezávisle pro každou z dlaždic.
Čipletová konstrukce procesoru má nevýhody z hlediska energetické efektivity, kdy komunikace mezi čiplety zvyšuje spotřebu. Intel proti tomuto bojuje použitím pokročilého 3D pouzdření Foveros, kdy dlaždice jsou propojené křemíkem podkladové dlaždice, místo aby byly použité vodiče jdoucí substrátem pod křemíkem (v tomto je rozdíl proti čipletovým procesorům AMD Ryzen).
Jde o technologii Foveros Die Inerconnect. Hustota propojovacích kontaktů na Base Tile je velmi vysoká (rozteč 36 µm) a při frekvenci komunikace 2 GHz má rozhraní spotřebovávat jen 0,15–0,3 pJ na jeden přenesený bit.
4+1 dlaždice
Procesor Meteor Lake je složen ze čtyř hlavních dlaždic, které jsou osazené na pátou podkladovou dlaždici (Base Tile). Ta má v podstatě roli křemíkového interposeru.
Graphics Tile obsahuje výpočetní jednotky integrovaného GPU a je vyráběný 5nm procesem TSMC (pro jehož technologii je, zdá se, GPU architektura převzatá ze samostatných GPU optimalizovaná). Compute Tile obsahuje dvě až šest velkých jader (P-Core) a osm efektivních jader E-Core. Vyráběný je na 4nm procesu (Intel 4, v dřívějších dobách byl označený jako 7nm, ale to bylo v době, kdy byl Intel značením napřed a jeho 7 nm bylo zhruba srovnatelných s 5nm generací TSMC). Za pozornost stojí, že proces Intel 4 je první technologie Intelu používající EUV.
Tyto součásti pak propojuje SoC Tile, která obsahuje funkcionalitu čipsetu, řadiče pamětí a mnoho dalšího. Zejména také propojovací logiku NoC (Network-on-Chip), pomocí níž jsou komponenty v dalších čipletech propojené. Čtvrtá část, IO Tile, nemá stejnou roli jako IO čiplet u AMD (tuto roli má SoC Tile). Jde vlastně jen o jakési vytažení části PHY (PCI Expressu, Thunderboltu a USB4) mimo SoC Tile.
Důvod pro tuto komplikaci je, že po sestavení je SoC Tile v centrální části celého čipletového koláče a tím je omezen prostor po okrajích tohoto křemíku, použitelný k vyvedení různých rozhraní. Přidání SoC Tile (v hotovém procesoru je v rohu vedle Compute Tile) výrazně zvětšuje prostor po okrajích použitelný k vyvedení externí konektivity. IO Tile i SoC Tile by měly používat 6nm proces TSMC (N6).
CPU: die-shrink, nebo vylepšená architektura?
Meteor Lake dostal nová či aktualizovaná procesorová jádra, ovšem nebylo toho k nim mnoho sděleno. Architektura P-Core se označuje Redwood Cove a nemělo by asi jít o radikálně novou architekturu, ale o evoluci jádra Raptor Cove 7nm procesorů Raptor Lake, které samo bylo téměř beze změn (až na větší L2 cache) proti Golden Cove z Alder Lake.
Podle Intelu má jádro vyšší efektivitu, nejsou ale výslovně zmíněné změny IPC (výkonu na 1 MHz). Na schématu, které Intel ukázal, nelze identifikovat nějaké velké změny, zdá se, že se nezměnil počet ALU (pět), AGU (pět), dekodérů (šest) nebo portů.
Jádro má 2MB L2 cache jako Raptor Cove a 48KB datovou L1 cache. Je vyznačena kapacita L1 instrukční cache, která byla zvětšena z 32 KB na 64 KB. Toto asi nebude mít takový vliv, jako by dodalo zvětšení L1 datové cache, ale IPC tím stoupnout může.
Je pořád možné, že jádro bude mít například zvětšený Reorder Buffer (ROB), tedy hlavní frontu, v jejímž rámci probíhá Out-of-Order optimalizace provádění kódu, či další fronty. Opět možné, ale rovněž nepotvrzené jsou vylepšené prefetchery a prediktory větvení. Toto by zvýšilo IPC, ale je pravda, že kdyby mělo jádro takovéto změny, čekali bychom, že se Intel pochlubí. Je tak možné i to, že se na tyto aspekty architektury nesahalo a IPC se nezvedne.
Nabízí se i hypotéza, zda Redwood Cove není prostě jen 4nm verze jádra Raptor Cove. Od jeho vydání sice uplynul rok, ale je třeba si uvědomit, že Meteor Lake a jeho jádro mělo původně vyjít mnohem dříve. Intel například hlásil dokončení návrhu Compute Tile již před dvěma a půl lety, ale vydání asi muselo čekat, až bude zralý 4nm proces a související čipletová technologie a případně i ostatní čiplety. Možná tedy Redwood Cove reprezentuje stav vývoje CPU architektury už notný kus zpátky, stejný nebo ještě třeba o něco starší, než jádro Raptor Cove / CPU Raptor Lake (které by mohlo být sekundárním portem architektury na 7nm proces, a tedy paradoxně mladší).
Intel uvádí, že vylepšil Performance Monitoring Unit v procesoru a na ní navázanou technologii Intel Thread Director, která bude asistovat operačnímu systému s přiřazováním programů na velká či malá jádra.
Také E-Core mají novou či alespoň evolučně vylepšenou architekturu nazvanou Crestmont. Vycházet by měla stále z Gracemontu. V tomto případě již Intel ve slajdech slibuje zvýšené IPC (výkon na 1 MHz). Také zde má být vylepšené fungování technologie Intel Thread Director. A Intel pro Crestmont také výslovně uvádí vylepšený prediktor větvení.
Jádro má mít vylepšenou podporu instrukčních rozšíření a instrukce VNNI budou mít až dvojnásobný výkon (dokáže je zpracovat dvojnásobek portů/jednotek v jádře – toto by mělo zrychlit AI aplikace používající VNNI).
Low Power Island: úspornější úsporná jádra
Když už jsme u malých jader, jedna z největších zajímavostí procesoru Meteor Lake je, že přichází s tzv. Low Power Islandem, tedy částí, která má za cíl co nejvíce snížit spotřebu během nečinnosti a nízkých zátěží, aby se prodloužila výdrž notebooků na baterii. Je to realizováno tak, že v rámci SoC Tile jsou soustředěné komponenty, které systém neustále potřebuje – blok pro obrazový výstup, řadič pamětí, multimediální blok (který je třeba ne v nečinnosti, ale při přehrávání videa, kdy je také třeba šetřit energii).
V úsporném režimu procesor uspává či vypíná ostatní části. Díky vyčlenění výpočetních bloků GPU do Graphics Tile je možné odpojit je a vyčlenění jader CPU do bloku Compute Tile také umožňuje je odpojovat od energie. Problémem by ale bylo, že i při běhu v nečinnosti by jádra CPU a Compute Tile musela být pořád periodicky probouzena. Meteor Lake proto přidává dvě tzv. Low Power Island E-Core či LP E-Core do tohoto Low Power Islandu. Jsou fyzicky umístěna přímo v SoC Tile, a protože zůstanou aktivní a převezmou běh operačního systému i programů, lze CPU Tile kompletně uspat i na dlouhou dobu. Toto by bylo dost zajímavé i pro čipletové procesory AMD – uvidíme, zda firma jednou také něco podobného aplikuje.
Intel Thread Director se bude snažit procesy operačního systému a programy na těchto jádrech držet přednostně a až při potřebě vysokého výkonu bude aktivovat Compute Tile a posílat procesy na jeho velká a malá jádra.
Tato LP E-Core by měla běžet na nižších napětích a mají preciznější škálování napětí a frekvencí s využitím integrovaného digitálního lineárního regulátoru napětí (DLVR). Běh kódu na těchto jádrech by měl spotřebovat méně energie než při běhu na E-Core v Compute Tile, ačkoliv je použitý jen 6nm proces (TSMC N6).
GPU Xe LPG: Integrovaná verze grafik Arc i s ray tracingem
Zatímco u jader CPU jsou změny možná jen menší, dost významný je architektonický upgrade integrovaného GPU. Dosavadní procesory měly GPU založené ještě na „Gen12“ architektuře Xe LP, která měla premiéru v roce 2020 v procesorech Tiger Lake (rozebírali jsme ji v tomto článku). Meteor Lake přechází na novou architekturu, která je odvozená od nejnovějších samostatných GPU Intelu, generace Arc „Alchemist“. Zde má označení Xe LPG (Low Power Gaming).
Xe LPG proto už neuvádí počty jednotek EU, ale mluví se o Xe Core, kterých má grafika osm, což dává 128 Vector Enginů (ty odpovídají blokům EU) a 1024 shaderů. Jde tedy o GPU na úrovni samostatné grafiky Arc A380 (GPU ACM-G11), byť asi bude fungovat při nižší spotřebě a kvůli tomu bude výkon nižší. Intel neuvádí kapacitu L2 cache, ale GPU má mít 8 Pixel Backendů, 8 Samplerů a dvě geometrické pipeline (to vše výrazně navýšené proti grafikám v procesorech Alder Lake a Raptor Lake).
Xe LPG podporuje hardwarovou akceleraci raytracingových efektů, grafika v Meteor Lake obsahuje osm jednotek RTU (Ray Tracing Unit), tedy stejně jako karta Arc A380. Je to poprvé, co se akcelerace ray tracingu dostává do integrovaných GPU od Intelu (u AMD podporovaly ray tracing již RDNA 2 grafiky APU Ryzen 6000 „Rembrandt“ a Ryzen 7040 „Phoenix“, jenž už má grafiku RDNA 3).
Zdá se však, že grafika Xe LPG možná neobsahuje speciální jednotky pro akceleraci AI označené XMX (Xe Matrix Accelerator), které jsou v samostatných grafikách Arc Alchemist. Pokud je Intel jen v prezentaci omylem nezapomněl zmínit, je toto možná jedna z odlišností, kterou se bude Xe LPG vyznačovat oproti architektuře Xe HPG v samostatných GPU.
Výkon zatím není moc znám, ale podle Intelu má Xe LPG dosahovat vyšších frekvencí než předchozí architektura Xe LP v Alder Lake a Raptor Lake. Výkon tedy stoupne jak na základě přidaných jednotek, tak v přepočtu na jednu jednotku.
Neural Processing Unit
Je možné, že jednotky XMX byly vypuštěné, jelikož procesory Meteor Lake budou mít samostatný specializovaný akcelerátor AI. Intel jej označuje NPU (Neural Processing Unit). To je trošku překvapivé, protože ještě začátkem léta mluvil o VPU (Versatile Processing Unit) a není jasné, zda jde o totéž, nebo je NPU jednotka pro vysoký AI výkon a VPU nějaká pomocná další jednotka sloužící pro akceleraci AI s nízkou spotřebou při běhu na baterii a pro potřeby dlouhodobě běžících úloh na pozadí.
NPU bude akcelerátor neuronových sítí tvořený dvěma Neural Compute Enginy, které bude možné využívat pro různé aplikace současně, nebo oba pro jednu úlohu. Tyto enginy jsou tvořené blokem DSP a soustavou MAC jednotek pro neuronové sítě. NPU je určená pro inferenci (aplikaci hotových modelů), ne trénování umělé inteligence.
NPU se bude používat skrze softwarové frameworky a rozhraní jako OpenVINO, pyTorch, Caffe, TensorFlow nebo WinML a DirectML. Intel by měl spolupracovat na podpoře akcelerace na těchto procesorech s Microsoftem nebo Adobe.
Konektivita
SoC Tile a IO Tile procesoru Meteor Lake budou poskytovat konektivitu PCI Express 4.0, Thunderbolt 4 a USB4 (plus samozřejmě USB 3.2). Také je integrována bezdrátová konektivita (nebo aspoň její digitální část, asi bude stále třeba připojit samostatnou rádiovou část přes rozhraní CNVio). Digitální část v procesoru podporuje Bluetooth 5.4 a WiFi 6E. Intel dokonce zmiňuje jako možnost WiFi 7, ale není jasné, zda je na ni křemík už připravený a jen čeká na pozdější validaci, nebo zde Intel mluví o možnosti přídavného adaptéru a ne samotného procesoru.
Důležitá je také podpora nejnovějších obrazových výstupů: Meteor Lake umí jak HDMI 2.1, tak i DisplayPort 2.1. Zatím nevíme, jaké rychlosti UHBR přesně budou na DisplayPortu podporovány (minimálně UHBR 10 ale tedy asi bude možné používat). Maximální podporované rozlišení připojeného monitoru je 8K v HDR při 60 snímcích za sekundu, alternativně lze mít až čtyři 4K obrazovky při 60 Hz. Rozlišení 1080p a 1440p lze provozovat až při 360 Hz.
Jak už bylo zmíněno, kvůli optimalizaci spotřeby při přehrávání videa byly multimediální funkce odděleny od GPU a přesunuly se do SoC Tile na onen úsporný ostrov. Procesor podporuje přehrávání i enkódování 10bitového 8K videa včetně HDR a formátu AV1. Procesor obsahuje tyto enginy dva.
Reálná dostupnost v prosinci
Intel takto odprezentoval všechny možné aspekty těchto zajímavých procesorů, ale zatím nejde o jejich uvedení do prodeje. Tak jako nebylo řečeno nic o detailech jader CPU, Intel zatím nesděluje parametry konkrétních modelů procesorů, které chystá (nějaké modely 45W řady už ale nedávno unikly neoficiálně).
Samotné vydání procesorů, respektive notebooků s těmito procesory, nastane až v prosinci, a to prý 14. 12. Vydání v posledním měsíci roku nebývá obvyklé. Intel pro notebooky typicky preferuje srpen až říjen, což dovoluje zachytit předvánoční prodeje a ideálně ještě tzv. sezónu back-to-school. Podle data se zdá, že Meteor Lake se Intelu nepodařilo dotáhnout k vydání v těchto dřívějších měsících, ale alespoň dokázal zvládnout vydání před koncem roku 2023, což byl veřejně oznámený termín, a bylo proto důležité takový cíl splnit.
V souladu s neoficiálními drby, které doteď přicházely, zatím Meteor Lake přichází jen a pouze jako mobilní procesor pro notebooky v pouzdře BGA (tj. pájeném přímo na desku). O verzi pro desktopový socket Intel oficiálně mlčí, takže se zatím nic nemění na tom, že pravděpodobně byla zrušená – místo ní mají vyjít procesory Core 14. generace pro desktop, založené na refreshi 7nm čipů Alder Lake a Raptor Lake (ty se prý mají začít prodávat 17. 10.).