Na jaře vydala firma Apple překvapivě krátce po generaci M3 z podzimu novou generaci procesorů M4 a získala s ní doteď existující rekord ve výkonu, pokud se měří jednovláknovým benchmarkem Geekbench. Zprvu byla vydána jen základní verze M4 s omezenou dostupností (jen v tabletech). Teď ale Apple generaci procesorů M4 vydává i v počítačích s macOSem a uvádí i výkonné modely M4 Pro a M4 Max s více jádry.
M4, M4 Pro a M4 Max jsou 3nm procesory, používají už dokonce zdokonalenou verzi procesu TSMC, nazvanou N3E, která je o něco lepší než N3B používaná v procesorech řady M3 a v 3nm procesorech Intelu (Core Ultra 200). To bude jeden ze zdrojů jejich výkonu a energetické efektivity, vedle samotné architektury, která také přináší lepší výkon na 1 MHz díky přepracovaným jádrům.
Nová jádra, přece jen
Původně to vypadalo, že M4 nemá novou architekturu proti M3, protože většina výkonu se zdála být důsledkem zvýšených frekvencí. To byl ale omyl. Analýzy například čínského recenzenta Geekerwana říkají, že výkonné jádro v procesorech M4 skutečně nové je a je o něco širší než to v M3 (Apple ale bohužel podrobnosti moc neuvádí).
Také IPC (výkon na 1 MHz frekvence) se s touto architekturou o něco zvýšil, byť jen o jednotky procent. Celkově není zlepšení IPC, které dohromady přinesly architektury M3 a M4 nad rámec IPC jádra používaného v čipech M1 a M2, úplně velké. Ale Apple to vykompenzoval výrazným navýšením frekvencí – což je trochu ironické, protože v době M1 fanoušci vynášeli IPC do nebes a frekvence poněkud hanili.
Teď Apple potvrdil, že výkonné (velké) jádro má zvětšený ReOrder Buffer (prý až o 40 %) a rovnou 10 paralelních instrukčních dekodérů. Zlepšena má být také predikce větvení. Také malé/efektivní jádro má mít přepracovanou architekturu, možná ale s menšími změnami.
Apple uvádí dvojnásobnou propustnost ve fázi fetch (tedy schopnost načíst z instrukční L1 cache 2× víc bajtů kódu za jeden cyklus) a také zlepšenou predikci větvení. Údajně má být posílen výkon SIMD jednotek, které mají mít větší šířku a nižší latenci instrukcí, ale zřejmě jen ve floating-point kódu, ne v běžnějších celočíselných výpočtech.
Apple také uvádí, že M4 má novou generaci akcelerátorů pro aplikace umělé inteligence. Nemyslí se tím asi NPU, ale koprocesorové jednotky SME, protože toto je uvedeno jak u velkých, tak u malých jader. Jednotka SME (vzniklá z dřívějšího akcelerátoru pojmenovaného AMX – neplést s odlišnou technologií AMX od Intelu) není přímo součástí jader. Procesor má jen jednu na každý klastr jader, například u M4 by měly být dvě: jedna je tedy v klastru velkých jader, jedna v klastru malých jader.
To, že se podařilo Applu vydat další novou architekturu tak brzo, není pravděpodobně tím, že by firma najednou přecházela na takto extrémní tempo vývoje a inovací s novými procesory třeba jednou za tři čtvrtě roku. Důvod je pravděpodobně v tom, že procesor M3, který jako první používal 3nm proces, byl výrazně zdržen tím, že tato výrobní technologie nebyla připravená k reálnému nasazení (ale jeho architektonický design už byl hotový dávno a „ležel v šuplíku“). Původně Apple možná chtěl mít M3 venku už třeba o rok a půl dříve, nejspíše měl původně tvořit generaci M2. Naproti tomu dnešní M4 už takto dlouho odkládaný patrně nebyl. Původně byl vyvíjen třeba v jedenapůl až dvouletém odstupu za M3, ale většinu této mezery pak eliminovalo opožděné vydání M3, a proto firma pak mohla M4 vydat takto rychle.
M4: Základ má 4+6 jader
Základní verze procesoru M4 (bez přívlastků) má stále čtyři velká (výkonná) jádra, k tomu je ovšem šest malých (či přesněji efektivních) jader, celkem tedy 10 vláken. Takt velkých jader by zřejmě měl být až 4,5 GHz.
Procesor má rovněž GPU s 10 „jádry“ (přesnější by asi bylo říkat výpočetních jednotek), což dává 1280 „shaderů“. GPU v procesorech M4 podporuje hardwarový ray tracing (údajně s 2× lepším výkonem než u M3) a mesh shadery.
Procesor by měl podporovat maximálně 32 GB paměti LPDDR5X-7700 (s propustností 120 GB/s a 128bitovou šířkou) osazené na substrátu pouzdra procesoru hned vedle křemíku CPU, což dovoluje snížit spotřebu. Apple oznámil dostupnost M4 v MacBoocích Pro 14, přičemž se zdá, že se dají koupit konfigurace s 16, 24 a 32 GB paměti (v tabletové podobě byly kapacity 8 až 24 GB). M4 se také bude dát pořídit v Macu Mini.
M4 Pro serióznější než v předchozí generaci
A nyní už k novým výkonnějším verzím. Varianta M4 Pro doznala upgrade proti předchozí generaci, kde Apple osekal paměti na jen 192bitovou šířku a procesor měl jen šest velkých jader, zatímco M2 Pro mělo osm. Po tomto zakopnutí se Apple vrátil ke zvyšování výkonu a M4 Pro má 10 velkých jader plus čtyři malá/efektivní. Frekvence by zřejmě měla být stejná jako u základního M4 (4,5 GHz).
Apple se také vrátil k širším 256bitovým pamětem, v tomto případě ale uvádí propustnost již 273 GB/s (efektivní takt pamětí by měl zřejmě být 8533 nebo ještě vyšší). Kapacita paměti začíná na 24 GB, maximum je 64 GB.
M4 Pro má dvakrát „širší“ GPU s 2560 shadery (20 výpočetními jednotkami), architektonicky by mělo být stejné jako u M4. Vedle plnotučné konfigurace s 10+4 jádry CPU a 20 jádry v GPU je ale na prodej také ořezaná verze, která má 8 velkých jader a 4 malá a GPU s jen 16 jádry (2048 shadery). Apple tento procesor nabízí v MacBoocích Pro 14 a 16 a také v Macu Mini.
Apple bohužel klasicky neuvádí nic o spotřebě či „TDP“ žádného z těchto procesorů. Jedno velké jádro podle testů může mít spotřebu až 7–8 W, takže s deseti jádry by spotřeba měla při plné zátěži jít výš, než by odpovídalo dejme tomu 65W třídě TDP.
M4 Max
Současně byla opět uvedena i varianta Max. Tím, jak byla varianta M4 Pro opětovně posílena, není po stránce výkonu CPU model Max už o tolik výše. Tento procesor má v plné verzi 12 velkých jader a stále 4 malá. Předpokládáme, že opět s frekvencí až 4,5 GHz.
Ovšem kde se M4 Max odlišuje, je grafický výkon a s ním související paměťová propustnost. GPU má u tohoto čipu 40 výpočetních jednotek, neboli 5120 shaderů a teoreticky by mohlo mít až dvojnásobný výkon proti M4 Pro (spotřeba grafické části ale asi také lineárně naroste), byť nevíme, zda je jeho takt zachovaný – Apple sám žádné frekvence neuvádí.
Spolu s GPU jsou dvakrát širší také paměti, které by zřejmě měly být 512bitové a používají stejně rychlé paměti jako na M4 Pro, takže dodávají dvojnásobnou propustnost 546 GB/s. Maximální kapacita paměti je 128 GB.
M4 Max bude v nabídce v MacBoocích Pro 14 a 16 (v Macích Mini ne). Kromě plnotučné verze bude v nabídce ještě ořezaná konfigurace. Ta má o dvě velká jádra méně, tedy jen 10 jader jako M4 Pro v plné verzi, a 4 malá jádra. Grafika je u tohoto modelu osekaná na 4096 shaderů (32 výpočetních jednotek) a paměťová sběrnice je zřejmě také zredukována na 384 bitů, protože Apple uvádí propustnost už jen 410 GB/s.
V prodeji od pátku
Ke koupi by zařízení s novými procesory měla být tento týden, od 8. 11. Poté by snad mělo být k mání i více nezávislých testů těchto procesorů. V tuto chvíli zatím běží jen předobjednávky.
Jedním z taháků těchto počítačů jsou také různé funkce umělé inteligence (Apple tradičně musí všemu říkat po svém, takže mluví o „Apple Intelligence“), které teď firma podobně jako před ní Microsoft chce do systému zanášet. Jejich příchod je také důvodem, proč Apple zvedl minimální kapacitu pamětí, s kterou se dají počítače objednat, na 16 GB. Doteď prodával jako základ dnes už dost nedostatečné 8GB konfigurace. AI funkce mají 16GB RAM vyžadovat, nebo minimálně potřebovat k dobrému výkonu, takže na starších přístrojích s 8GB pamětí AI asi nemusí fungovat moc dobře. Je třeba pamatovat, že aby AI dávala nějaké přijatelné výsledky, potřebuje co největší model, který je třeba natáhnout do paměti a jeho velikost je ve vyšších jednotkách, náctkách, nebo dokonce desítkách gigabajtů. U počítače, který má 8 GB RAM na všechno včetně OS a dalších běžících aplikací, trochu problém.
Ve zmíněném testu Geekbench 6.3 mají tyto procesory nejvyšší výkon ze všech, které jsou na trhu, v databázi se dokonce už objevily i některé výsledky se skóre 4000 bodů (zda je to ale typicky dosažitelný výkon, není jisté, ten asi může být nižší a toto mohou být šťastné výjimky vlivem rozkolísanosti výsledků, typické pro Geekbench).
Geekbench 6.3 v jednojádrovém testu mimo jiné těží ze zmíněných specializovaných instrukcí SME, zatímco na platformě x86, zdá se, taková péče nemusí být optimalizacím vždy věnována (AVX-512 například prakticky vůbec nepomáhá, ačkoliv jde o obecněji aplikovatelné SIMD instrukce). Takže toto rekordní skóre nemusí znamenat, že je Apple ve výkonu až tak extrémně napřed, byť se zdá, že aspoň o něco nyní před nejvýkonnějšími jádry AMD (Zen 5) a Intelu (Lion Cove) být může.