V pondělí jsme tu měli odhalení Ryzenů 3000 s jádry Zen 2, včera jsme tu měli předběžné oznámení speciálního Core i9-9900KS. Včera Intel konečně také prezentoval svou keynote na Computexu a odhalil na ní své hlavní novinky – zejména 10nm procesory Ice Lake pro notebooky. Zatímco Ryzeny byly odhalené i s detaily o jednotlivých modelech, Intel zatím takové odhalení neučinil, ovšem také v podstatě předběžně procesory uvedl, jen ještě nesdělil jejich parametry. Poměrně podrobně ale byla prezentována architektura a jejich výbava.
Ice Lake/Sunny Cove má o 18 % lepší IPC
Začít můžeme tím nejdůležitějším: Intel poprvé řekl něco k výkonu jádra Sunny Cove, a odhalil, že by mělo přinést jedno z největších zlepšení tzv. „IPC“ za poslední dobu – pod IPC se myslí výkon, který CPU podává při určitém identickém taktu; zlepšení IPC jsou přitom asi nejcennější komponenta při zvyšování celkového výkonu, protože se násobí každým megahertzem frekvence.
A Sunny Cove má podle Intelu zvyšovat IPC typicky o nějakých 18 % v porovnání s jádrem Skylake (1GHz Ice Lake tedy má mít výkon jako 1,18GHz Skylake). Nemělo by přitom jít o nějakou „až“ hodnotu, ale o geometrický průměr z většího množství úloh: SPEC 2016, SPEC 2017, SYSmark 2014 SE, WbXPRT, Cinebench R15, v kterých by se nárůst IPC měl pohybovat od -1 % až po +40 %. Toto jádro tedy vypadá hodně dobře.
Připomeňme, že AMD u Zenu 2 uvádí pokrok jen o 15 % proti Zenu 1, přičemž tam je to číslo z jediné aplikace, a to SPECint_rate_base2006 (uvidíme, zda třeba průměrné zrychlení nebude nižší). Zlepšení IPC o 18 % by mělo být velmi dobré a u Intelu asi nejlepší v této dekádě, možná i vůbec od zlomového přechodu z Pentia 4/Netburstu na architekturu Core/P6. Za chvíli také uvidíme, že v některých věcech je Sunny Cove také jednou z největších změn jádra, minimálně asi od Sandy Bridge v roce 2011.
Architektonické podrobnosti
Už loni jsme tu měli částečné odhalení změn, které Intel v jádře udělal. Nyní jsme se dozvěděli nové podrobnosti, takže zrekapitulujeme předchozí poznatky a doplníme je o to nové. Ukazuje se, že přeorání architektury je v Sunny Cove opravdu hluboké a onen slib o 18 % lepšího IPC tudíž nebude pro nic za nic. L1 cache pro data je nově 48KB místo 32KB (toto je myslím první zvětšení od doby Pentia M!) a L2 cache bude také zvětšena na dvojnásobek z 256 KB (což byla stálice od Nehalemu v roce 2008) na 512 KB. Intel však uvádí, že velikost může záviset na produktu, takže je možné, že v některých segmentech trhu může být větší (servery), případně osekaná.
Kromě hlavních cache ale jádro zvětšilo také TLB druhé úrovně (z 1536 na 2048 4KB stránek a z 16 na 1024 1GB stránek, navíc je teď také 1024 položek pro 2MB a 4MB stránky). A pozor, také se zvětšila „L0“, respektive „uOP cache“. Ta měla dosud asi 1500 položek, nyní to bude o 50 % víc, okolo 2250 (shodou okolností je zvětšení uOP cache zlepšení, které bude paralelně aplikovat i Zen 2 od AMD). Větší cache znamenají, že procesor v nich častěji najde data a zkrátí si čekání na vyhledání v RAM. Větší uOP cache zase znamená, že procesor častěji najde dekódované instrukce v ní a vyhne se použití energeticky náročných dekodérů, které jsou zároveň často tzv. úzkým hrdlem výkonu.
Víc portů, druhá míchačka pro SIMD
Jádro bude celkově širší. Issue/retire se zvýší ze čtyř na pět instrukcí za takt. A současně Intel zvedl počet portů, na které se dělí výpočetní jednotky v jádře na deset z osmi. Nové porty P8 a P9 přibudou v load/store části procesoru a zvýší tak kapacitu pro načítání dat z paměti a jejich ukládání. Sunny Cove/Ice Lake díky nim bude schopné provádět dvě čtení a zároveň dva zápisy do paměti. CPU bude mít čtyři AGU místo tří a kapacita ukládání (propustnost do L1 cache) se tímto zdvojnásobila proti Skylake. to umí dvě čtení a jedno ukládání. Pro srovnání, Zen umí jen dvě načítání, nebo dvě ukládání, pokud se tedy tyto operace stanou úzkým hrdlem, má o dost nižší kapacitu.
U výpočetních jednotek ALU/FPU je to méně vidět, ale i zde došlo ke změnám. Jejich čtyři porty mají lepší schopnosti. Například všechny porty umí instrukce LEA (dříve jen dva), násobení budou umět dva porty místo jednoho. Na těchto stejných portech (respektive třech z nich) má Intel jako dosud navěšené také jednotky FPU/SIMD. Hlavní zlepšení by v jejich případě mělo být v tom, že nově umí operace shuffle dvě jednotky místo jediné: porty 1 a 5. Toto bylo slabé místo, protože port s instrukcemi shuffle býval v SIMD kódu přetížený (zvlášť s AVX-512), takže zdvojení jednotky shuffle by mělo zlepšit výkon SIMD operací například v multimédiích. Intel měl dvě jednotky shuffle už dřív do architektury Sandy/vy Bridge, ale Haswell a Skylake ji obětovaly. Takže zde jde vlastně o návrat, který si údajně přímo vyžádali zákazníci/programátoři.
Out of Order fronty: zvětšení o víc jak 50 %
Kromě těchto úprav zlepší výkon (IPC) v již existujícím kódu ještě jedna věc. A právě ta asi nejlépe ukazuje, jak moc je jádro Sunny Cove vylepšené a pokročilé proti Skylake. Intel zvětšil buffery spojené s out-of-order vykonáváním operací, čímž by CPU mělo být schopno optimalizovat provádění lépe, jelikož má pro něj větší „okno“, vidí delší část kódu. To není ještě nic výjimečného, ale mimořádná je míra, ve které k tomu u Sunny Cove došlo – nejde o žádné drobné krůčky.
Reorder Buffer v Sunny Cove má nově hloubku 352 operací, přičemž u Skylake to bylo jen 224 a u Haswellu 182, ovšem už to byly značně velké hodnoty. Jak se zvětšily fronty Reservation Stations jednotlivých portů, to nevíme. Ale fronty čtení z paměti a ukládání do paměti byly zvětšeny z 56 čtení na 72 a ze 72 zápisů na 128. Toto zvětšení front dovolí optimalizovat výpočetní a paměťové operace v mnohem větším měřítku a vymáčknout tak z kódu větší IPC. Podobné zvětšení (o víc jak 50 %) ale muselo být velmi náročné a ukazuje to míru práce, která na nové architekuře byla provedena. Kromě toho byla také prý snížena celková latence načítání dat (ovlivňovaná L1 cache a TLB) a také byl opět vylepšen prediktor větvení.
S tím souvisí, že jádro by mělo mít nové opravy proti útokům typu Spectre na spekulativní vykonávání kódu, jakož i opravy, které už jsou v posledních 14nm architekturách. Bezpečnost by také měla zlepšovat rozšíření umožňující šifrování paměti (Total Memory Encryption) a zabránění vykonávání instrukcí v usermode režimu. Paměťový řadič bude jinak také podporovat více bitů adresního prostoru, až 57 lineárního adresování. Fyzický adresní prostor bude zvětšen na 52 bitů.
Nové instrukce a schopnosti
Kromě architektonických změn, které budou obecně zlepšovat IPC plus minus všude, bude mít nové jádro také zlepšení jako jsou nová instrukční rozšíření, která také zlepší výkon, ale jen tehdy, pokud je programátoři využijí. Zaměřená budou na SIMD instrukce, strojové učení, kryptografii a podobné účely.
Sunny Cove bude jako jádro Cannon Lake podporovat instrukce AVX-512, byť spotřebitelská verze asi s nižším výkonem než Xeony (pro 512bitové operace budou pravděpodobně kombinovány 256bitové jednotky FMA na portu 0 a 1, nebude přítomna další samostatná 512bitová FMA). Sunny Cove přidá také podporu pro instrukce IFMA které se hodí pro aritmetické a kryptografické operace. A nově se objeví také vektorové instrukce pro šifrování (AES, SHA, bezpřenosové násobení/CLMUL, instrukce pro operace Galoisových těles) a instrukce DL Boost pro zrychlení tzv. inference, tedy běh neuronových sítí pro různé „AI“ úlohy.
Nové schopnosti
Nejen přímo v jádře CPU (a grafice) jsou ovšem změny. Výstup na monitor bude konečně umět DisplayPort 1.4 a HDMI 2.0b (s HDCP 2.2) s podporou 4K obrazovek se 120Hz frekvencí nebo 5K s 60 snímky za vteřinu – výstupy mohou být až tři. Integrovaný čipset (ten je 14nm) podporuje poprvé nejen USB 3.1 Gen2, ale i Thunderbolt 3 (až čtyři porty) včetně muxování s obrazovým signálem DisplayPort. Integrovaný dekodér bude umět dekódovat a enkódovat 10bitové video s rozlišením až 8K (HEVC a VP9) s 30 snímky za vteřinu, v 4K zvládne 60 snímků a ještě i vzorkování 4:4:4.
Ice Lake má ale také mít novou jednotku pro zpracování obrazu z kamery, který má zvládat až 16 megapixelů a video až v 4K při 30 snímcích za vteřinu. A v čipsetu je také integrované Wi-Fi 6 (802.11ax). Ovšem jen digitální část, která bude potřebovat externí analogový RF čip.
Dynamic Tuning 2.0
Nějaká vylepšení mají být také v napájení. Ice Lake by mělo mít integrované regulátory napětí druhé generace (proti první generaci v Haswellu), což by mohlo vylepšit efektivitu, ale také dovolí zmenšit napájecí kaskádu a tím i PCB notebooku. Stejnému účelu má posloužit technologie Dynamic Tuning 2.0, která řídí napájení pro maximální výkon a je založená na principu strojového učení, kdy by se řízení mělo postupně zlepšovat tím, že se naučí predikovat chování uživatele. Ovšem bude to potřebovat software (ovladač) běžící v systému.
Máme hrubé parametry, ale Intel neodhalil jednotlivé modely
Intel zatím neprozradil, jaké modely budou uvedené, ale sdělil hrubé společné parametry. Ice Lake bude mít modely Core i3, i5 a i7 pro notebooky. Budou mít tři různé třídy spotřeby: 9 W (to by měla být řada Y), 15 W a 28 W (řada U). Maximální konfigurací je čtyřjádro s HT, které obsahuje až 8 MB L3 cache. A pozor: máme údaj o tom, na jaké se Ice Lake dostane frekvence. Maximální turbo boost má podle Intelu být až 4,1 GHz. Zatím ale z notebooků víme jen o procesorech s maximální frekvencí 3,9 GHz. Je možné, že 3,9 GHz je maximum pro 15W modely a na 4,1 GHz se dostanou jen 28W verze. Mimochodem, pokud bychom na 4,1 GHz aplikovali ono 18% zlepšení IPC paušálně, pak by výkon měl být jako se Skylake na 4,72 GHz. Až se Sunny Cove nebo jeho plánovaní vylepšení následníci dostanou i do desktopu a poběží na vyšších frekvencích, mělo by to přinést docela velké nárůsty absolutního výkonu i efektivity.
Jak už víme z dřívějška, procesory budou mít grafiku Gen11 s až 64 EU (nižší modely mají mít 32 nebo 48 EU), ta ponese označení Iris Plus. Vedle toho je zmíněno také „Intel UHD Graphics“, což by možná mohlo být jméno pro horší ořezané verze. Takt GPU jinak bude až 1,1 GHz. Důležitým doplňkem pro integrované GPU bude pokročilý paměťový řadič, který mu dodá dostatečnou paměťovou propustnost: umí paměti LPDDR4 a LPDDR4X se šířkou 4×32 bitů a s efektivní frekvencí až 3733 MHz. U běžné DDR4 bude moci být provozována frekvence až 3200 MHz, klasicky s dvoukanálovým zapojením.
Toto bude nesporně výhoda proti APU Ryzenům, které v 15W–25W verzi podporují maximálně 2400MHz DDR4 (jen 35W modely podporují 3200MHz DDR4). Intel už ukázal nějaké benchmarky, podle kterých by jeho integrované GPU mělo ve hrách porážet i Radeon Vega 10 v nejrychlejších 15W notebookoých Ryzenech.
Tip: Preview výkonu GPU a AI operací na procesorech Intel Ice Lake (Computex 2019)
Přímo parametry modelů (těch by mělo být okolo devíti) Intel sdělí v momentě, kdy přijdou notebooky s čipy na trh. To se má stát někdy v druhé polovině roku, ovšem už teď se asi nějaké informace dostnou ven díky exemplářům, které jsou vystavené na Computexu. Mezitím tu ovšem máme uniklé parametry, které podle aktuálního vědění vypadají jako pravdivé, ale nemáme čísla pro 9W a 28W modely. Mimochodem, značení bude jako „10. generace“, takže názvy budou začínat desítkou.
Tip: Uniklé parametry procesorů Ice Lake-U pro notebooky
10nm čipy se budou prosazovat pomalu
Intel jinak očekává přes 30 návrhů notebooků s těmito procesory (každý v různých konfiguracích). To je na Intel poměrně malé číslo, například také o dost nižší, než počet notebooků s mobilními Ryzeny. Tím se asi potvrzuje, že 10nm procesory budou alespoň prozatím omezená záležitost. Toto číslo říká, že v následujícím roce bude většina přístrojů s procesory Intel vybavena různými 14nm CPU – staršími i nově vydanými (Comet Lake), jak jsme skepticky hádali z nedávno uniklých roadmap.
Jako první by se údajně měly čipy Ice Lake obejvit v Aceru Swift 5, Dellu XPS 13 2in1, HP Envy 13 (v dřeveném designu) a v Lenovu Yoga S940. Ice Lake vypadá na velice zajímavé procesory, což by pak mohlo platit i o těchto nepočetných vyvolených laptopech. Samozřejmě ještě musíme počkat na recenze, aby se ukázalo, jak se papírový potenciál přetaví do reálných pokroků ve výkonu, provozních vlastnostech a výdrži na baterii, ale tyto čipy (a CPU architektura) by určitě měly být jednou z nejzajímavějších hardwarových věcí letošního roku.