Intel na Computexu 2024 nyní představil extrémně zajímavé nové procesory Lunar Lake. Mají mít velmi vysokou mobilitu a efektivitu (údajně nejlepší mezi x86 procesory) a být jak konkurencí k čipům Applu, tak proti jiným ARM procesorům v Copilot+ PC, vedle konkurování AMD. Lunar Lake má velmi zajímavé architektury jak velkých jader P-Core, tak malých E-Core, ale novinek je v něm mnohem víc – v podstatě ve všem to bude to „nej“, co Intel má.
Lunar Lake má osm jader, čtyři velká P-Core s architekturou Lion Cove (bez HT) a čtyři malá a efektivní E-Core Skymont, přičemž jde o čipletový procesor stejně jako u předchozí generace Meteor Lake. K tomu má nové integrované GPU s 1024 shadery. A integrovaná je také výkonná jednotka NPU nové generace.
Intel Inside… Made in TSMC
Lunar Lake ale používá méně aktivních čipletů – místo čtyř jen dva, Compute a SoC Tile či také Platform Controller Tile, jelikož tento čiplet má podobnou funkci jako dosavadní čipsety neboli PCH (Platform Controller Hub). Tyto čiplety leží na pasivní interposerové base tile. Compute čiplet bude vyráběný 3nm procesem TSMC N3B jako Apple M3. Jde o první 3nm x86 procesor.
SoC čiplet používá 6nm proces TSMC. Lunar Lake je tedy procesor, kompletně vyráběný mimo továrny Intelu, dříve zcela nevídaná to věc, vzhledem k tomu, jak ve vlastních továrnách bývala spatřována kritická výhoda firmy. Linky Intelu provádějí jen pokročilé pouzdření křemíku vyrobeného v TSMC, pomocí technologie Foveros. Pravda, ještě pasivní základový čiplet pro propojení je vyráběný starým procesem Intel 22FFL, ale toto je dost podružná role.
Lunar Lake používá on-package paměť, tedy LPDDR5X připájenou místo na základní desku přímo na pouzdro procesoru. Nejde sice o pokročilou technologii nebo pouzdření, ale kratší cesta vodičů umožňuje použít nižší napětí a naopak eliminovat terminaci. Jde o stejné řešení, které používá Apple u procesorů řady M. Šířka paměti je 128bitů ve dvou pouzdrech, kapacita může být 16, nebo 32 GB.
Toto řešení snižuje spotřebu (ne však výkon, jak se někdy mylně traduje). Podle úniků se bude kapacita paměti lišit dle modelového čísla. Například stejný procesor Lunar Lake se bude jmenovat Core Ultra 5 238V ve verzi s 32GB integrovanou pamětí a Core Ultra 5 234V s 16GB pamětí.
Pozoruhodné nové architektury CPU
Lunar Lake má velmi zajímavá nová jádra CPU, a to jak v případě architektury velkého jádra P-Core (Lion Cove), tak malého jádra E-Core. Těm jsme se věnovali v samostatných článcích, které doporučujeme vaší pozornosti, zde stačí asi zmínit, že malá jádra v Lunar Lake mají mít IPC (čili výkon na 1 MHz frekvence) o 2 % lepší než předchozí velká jádra v procesorech Raptor Lake (ale asi výrazně nižší frekvenci) a velká jádra mají mít o 16 % vyšší IPC než jádro Redwood Cove v procesorech Meteor Lake (to by mělo mít stejné, nebo o něco horší IPC jako Raptor Lake).
Předělaný Low Power Island a vylepšený Thread Director
Malá jádra, či lépe řečeno E-Core (Skymont architektonicky malý není, byť plochu má asi o dost menší než hodně velká jádra „Cove“) prošla změnou. Intel je doteď umisťoval na prstencovou sběrnici a L3 cache procesoru, což mělo negativní vliv na spotřebu při jejich provozu.
V Meteor Lake část jader umístil mimo Compute čiplet na SoC čiplet. Tato jádra byla jen dvě a měla provozovat nízké zátěže na pozadí nebo třeba přehrávání videa, ale zdá se, že v Meteor Lake to nemělo zas tak blahodárný efekt, jak se čekalo, možná kvůli nedostatečnému výkonu jen dvou jader (s nízkým taktem).
U Lunar Lake jsou všechna jádra E-Core opět zpět na Compute čipletu, který je nyní také sídlem Low Power Islandu. Do toho patří všechna čtyři jádra E-Core, která tak jsou všechna mimo L3 cache (používají jen svou L2 cache) a prstencovou sběrnici velkých jader. Při provozu tak procesor typicky vypíná celou prstencovou sběrnici i L3 cache, pokud neběží na vysokých zátěžích, pro úsporu energie. A oportunisticky zřejmě vypíná i funkce SoC čipletu.
Pro Lunar Lake bude nasazená nová generace technologie Intel Director v operačním systému Windows 11, která by měla lépe ovládat rozdělení práce mezi jádra E-Core a P-Core. Nová verze je provázaná se řízením spotřeby, dává lepší zpětnou vazbu Windows a je dál optimalizovaná.
Ve výchozím režimu budou preferována jádra E-Core v Low Power Islandu. Systém se bude snažit všechnu práci udělat na něm, a to nejprve na jednom jediném E-Core, dokud to výkonem stačí. Až při vyšší zátěži se aktivuje více E-Core, dokud nedetekuje, že je aplikace tak náročná, že potřebuje jádro P-Core nebo úplně všechna jádra (u mnohovláknových aplikací). Samotné jedno jádro P-Core asi ale může být aktivováno i pro jednovláknové programy, pokud systém vyhodnotí, že potřebují maximální 1T výkon (benchmarky typu SuperPi, enkódování audia a podobně).
Podle Intelu by většina reálně používaných programů a zátěží měla zůstávat na Low Power Islandu, včetně aplikací používajících víc vláken, běžně tedy Lunar Lake může mít aktivní všechna čtyři jádra E-Core a žádné P-Core. To bude třeba případ aplikace Teams, kterou Intel použil pro dema efektivity Lunar Lake. Teams sice využívá čtyři jádra, ale zůstává čistě na E-Core a to snižuje spotřebu během videokonferencování až o 35 %. Je ale možné, že to závisí i na spolupráci autora aplikace, Microsoft možná program zvlášť optimalizoval.
SLC Cache
Zatímco Low Power Island a jádra E-Core nemají přístup do L3 cache velkých jader, benefitují z tzv. SLC (System Level Cache). Jde o něco jako L4 cache, která však neslouží jen jádrům CPU, ale i dalším blokům v procesoru, jako je NPU, GPU, multimediální blok.
Její kapacita je 8 MB a měla by asi být přidružená k paměťovému řadiči. SLC má za cíl udržení některých pracovních dat přímo v procesoru, aby se omezily energeticky náročné transfery dat z operační paměti. Jde o komponentu, kterou za těmito účely už dávno používají procesory ARM třeba v mobilech, a u Lunar Lake by měla prodlužovat výdrž počítače na baterii.
Nové NPU a 1,5× rychlejší grafika Battlemage i s XMX
NPU procesorů Lunar Lake má novou architekturu (NPU 4) oproti té v procesorech Meteor Lake. NPU 4 obsahuje 3× více maticových bloků (12 000 v 6 blocích NCE), má 12× výkonnější vektorové jednotky SHAVE než NPU 3 v Meteor Lake a podporuje výpočty s přesností FP16 (polovičním výkonem, 1024 FMAC operací za cyklus) a INT8 (2048 MAC operací za cyklus). Tato architektura má dosahovat 2× lepší energetické efektivity.
Celkově poskytuje výkon 48 TOPS v operacích INT8, což je o něco málo víc než 45 TOPS procesoru Qualcomm Snapdragon X Elite a o něco málo méně než 50 TOPS u procesoru AMD Ryzen AI 300. Nicméně rozdíly jsou to malé a výkon aplikací se bude asi lišit víc vlivem rozdílných architektur než dle těchto čísel. Microsoft stanovil 40 TOPS jako hranici pro použití funkcí Copilot+ PC, což tyto tři procesory všechny splňují.
Dalších 67 TOPS výkonu v INT8 v aplikacích umělé inteligence může poskytovat integrované GPU. To má proti Meteor Lake (i proti Arrow Lake) novou architekturu Xe2 LPG, která je odvozená od nadcházejících samostatných GPU Intel Arc druhé generace (Battlemage).
Jednotky GPU obsahují maticové jednotky XMX pro akceleraci AI, které jsou přítomné v architektuře grafik Arc Alchemist, ale odvozená mobilní varianta Xe LPG integrovaná v Meteor Lake je postrádala. Onen výkon 67 TOPS v AI je právě díky jednotkám XMX.
Tato grafika má 1024 shaderů, 128 jednotek XMX, 8 jednotek RTU (pro ray tracing) a velkou 8MB L2 cache, která by měla zlepšovat výkon se sdílenou pamětí RAM, což je jinak bolístka integrovaných GPU.
Obecně má být integrovaná grafika v herních a grafických aplikacích podle Intelu o 50 % výkonnější než také celkem schopné GPU procesorů Meteor Lake, které mělo rovněž 1024 shaderů. Otázka je, zda je to jen špičkový výkon, nebo to bude při nízkých TDP procesorů Lunar Lake při hraní udržitelná úroveň výkonu.
DisplayPort 2.1 a podpora videa ve formátu VVC
Vedle architektury Xe2 LPG / Battlemage má procesor Lunar Lake nový blok pro výstup na obrazovku s podporou HDMI 2.1, DisplayPort 2.1 a eDP 1.5. Zvládne tři monitory s rozlišením 4K při 60 Hz s HDR současně, nebo jeden 8K displej s HDR při 60 Hz. V herních zařízeních umí obsloužit 360Hz displeje s rozlišením 1080p nebo 1440p.
Nový je také multimediální blok, kde je nejzajímavější zlepšení hardwarové dekódování kompresního formátu VVC alias H.266, což je nový formát od MPEGu a ITU, tedy autorů standardu HEVC, který by měl být kvalitnější než AV1 vyvinutý zejména firmami Google a Netflix. Intel pro VVC uvádí, že dokáže stejnou kvalitu poskytnout se zhruba o 10 % menší velikostí souboru či datovým tokem.
Intel by měl s podporou VVC na trhu patrně být první mezi procesory pro PC. Multimediální blok podporuje kompresi i přehrávání až s rozlišením 8K a také přepínání rozlišení ve videu za běhu například při adaptivním streamování.
Thunderbolt a Wi-Fi 7
Počítače s Lunar Lake asi často budou obrazový výstup kombinovat s Thunderboltem v portu USB-C, protože přímo v procesoru je integrovaný řadič Thunderbolt 4 poskytující až tři 40Gb/s porty.
Podporována bude i technologie Thunderbolt Share.
Vůbec poprvé má Lunar Lake také integrovanou bezdrátovou konektivitu Wi-Fi 7 (a Bluetooth 5.4), její digitální část je přítomná přímo v SoC čipletu, ovšem jako obvykle bude potřeba připojit ještě externí rádiovou část přes rozhraní CNVi. Využití tedy bude svázáno s použitím CNVi modulu od Intelu (Intel BE201).
PCIe 5.0
SoC čiplet dále poskytuje konektivitu USB 2.0 a 3.0 pro běžné nethunderboltí porty, ale pozor – také řadič PCIe 5.0, což jsme tedy u procesoru optimalizovaného na spotřebu nečekali.
Až tedy přijdou na trh PCIe 5.0 SSD, která budou mít lepší energetickou efektivitu než PCIe 4.0 moduly, bude Lunar Lake připravené (konkurenční Snapdragon X Elite nebo AMD Ryzen AI 300 umí jen PCIe 4.0, i když velký problém to asi není). Je možné, že tato podpora bude využitelná například s moduly Samsung SSD 990 Evo.
SoC čiplet poskytuje i linky PCI Express 4.0, zatím ale nemáme informace o přesném počtu. Linky budou optimalizované na připojení jednoho SSD a případně bezdrátové konektivity. Je celkem pravděpodobné, že procesor nebude mít větší počet linek pro případné GPU. A pokud, tak asi jen třeba čtyři linky.
Vydání bude v třetím kvartálu
Vydání těchto procesorů má podle Intelu má nastat v třetím kvartálu, nyní na Computexu 2024 Intel zatím jen představil (hodně podrobně ovšem) jeho architektonické detaily a výbavu. Zatím však nesdělil nic o konkrétních chystaných modelech těchto procesorů, takže zůstává nejasné, jak vysoké budou frekvence.
Na těch bude záviset, zda procesor bude vynikat jen v efektivitě, nebo také bude mít výkon schopný konkurovat nejrychlejším CPU dneška, jako jsou ty zmíněné Snapdragony X Elite, Apple M3 a M4 nebo Ryzen AI 300 a Ryzeny 9000 od AMD.
Finální uvedení na trh má nastat v třetím kvartálu roku. Dříve se objevovaly informace, že notebooky s těmito procesory se patrně mohou do reálného prodeje dostat až pak ve čtvrtém kvartálu, ale nyní Intel mluví o tom, že by měly být už počínaje třetím kvartálem, takže mohou být již v srpnu či září.
Očekávat se pak dají modely asi od všech výrobců (Intel uvádí 20 partnerů a 80 modelů), často v rámci kategorie tzv. Copilot+ PC s AI funkcemi Microsoftu ve Windows 11.
Zdroje: Intel, AnandTech, Tom’s Hardware