Apple uvádí M1, prý nejvýkonnější procesor na světě. První ARMové Macy s ním jsou tady

11. 11. 2020

Sdílet

 Autor: Apple
Je tu první procesor Applu pro Macy. Apple Silicon M1 staví na architektuře z A14. má až osm jader a firma se chlubí, že má nejvyšší výkon CPU i GPU vůbec.

Tak je to tady. Přichází chvíle, kdy Apple, jenž už pěknou řádku let vyrábí vlastní procesory pro mobily a tablety, přináší svá jádra architektury ARM do počítačů Mac(Book) s operačním systémem MacOS. Včera firma představila první z nich. Nakonec se skutečnost trošku odchýlila od drbů a první na řadě jsou 13palcové MacBooky Air a Pro a malé desktopové PC Mac Mini.

V nich je ve všech stejný procesor pojmenovaný Apple M1 – první „Apple Silicon“ s architekturou ARM pro počítače typu PC, který Apple navrhl.

Apple M1: ARMová revoluce je tu (pro Macy)

Procesor M1 není ještě zas tak „velké CPU“, jako jsou třeba výkonné desktopové procesory, stále jde charakterem trošku o mobilní SoC. Ale pod tím „mobilní“ už teď nerozumíme SoC pro telefony, nýbrž pro notebooky. Procesor je to asi srovnatelný s tím, co Intel a AMD produkují pro počítače v řadách U a H, jde tedy o čip v pouzdru BGA pájený přímo na desku.

TDP zatím Apple neprozradil, ale je potvrzeno, že jde o SoC, který má vše v jednom – nepotřebuje čipset navíc, GPU je integrované a dokonce používá i paměti DDR4 či asi LPDDR4X integrované na pouzdru čipu (ty tedy nebudou upgradovatelné) – šířka sběrnice by nejspíš měla být 128 bitů, tedy ekvivalent dvoukanálové DDR4. Také dosavadní prostředí „Secure Enclave“ se svým vyhrazeným řídícím čipem Apple T2 je nyní přímo integrované do procesoru.

Architektura procesoru M1 není nová – Apple zdá se převzal jádra CPU z posledního mobilního čipu A14, totéž asi platí pro GPU. Procesor M1 je tedy asi vlastně výkonnějším derivátem procesoru A14 s přidanými jádry a lepší konektivitou. Stejně jako M1 je také A14 vyráběný na 5nm procesu TSMC. Toto bude pro Apple velká výhoda, protože konkurence je a ještě rok až dva bude jen na 7nm nebo 10nm (Intel) procesu. Čip obsahuje 16 miliard tranzistorů – pro srovnání, 7nm AMD Renoir/Ryzen 4000 má jen 9,8 miliardy tranzistorů.

O podrobnostech svých architektur bývá Apple velmi nesdílný, bohužel. Něco ale oficiálně víme. Procesor M1 je big.LITTLE osmijádro se čtyřmi výkonnými jádry „Firestorm“ a čtyřmi úspornými jádry „Ice Storm“.

Apple vůbec nesděluje, jaké jsou frekvence, jen že výkonná jádra mají 192KB L1 cache pro instrukce a 128KB L1 cache pro data, což je až šílená kapacita (například Zen 3 má 32+32 KB), která se jistě podílí na velmi vysokém IPC. Jádra pak sdílí 12MB L2 cache (to je navýšen proti telefonnnímu A14, kde je L2 jen 8MB). Úsporná jádra mají 128KB L1 pro instrukce a 64KB L1 pro data a dohromady sdílí svou 4MB L2 cache.

Ultraširoké jádro s vysokým IPC

Víc Apple o architektuře nesděluje. Pokud vám nevadí neoficiálně zjištěné či vyanalyzované podrobnosti, najdete rozbor toho, jak asi jádro Firestorm vypadá, na AnandTechu (jde o v některých věcech lehce nekriticky obdivný rozbor, nicméně hodnotný). Jádro by podle něj mělo mít 8-wide instrukční dekodér, tedy schopnost dekódovat osm instrukcí za cyklus (proti Zenu 3 je to dvojnásobek, nicméně Apple nemá zřejmě vůbec uOp cache, která tuto nevýhodu zmírňuje – z této cache dokáže Zen 3 také posílat osm instrukcí za cyklus).

Reorder buffer sloužící k přehazování instrukcí má mít až kolem 600 položek oproti 352 v Ice Lake od Intelu a jen 256 v Zenu 3 od AMD (Zen 2 má hloubku 224). Jádro obsahuje 6 ALU a jednu jednotku pro větvení v celočíselné části, čtyři AGU (lze provést tři čtení a 2 zápisy za cyklus, dohromady však maximálně čtyři operace) a jeho FPU má čtyři pipeline. Oproti tomu Zen2/3 má jen čtyři ALU a Intel Ice Lake/Tiger Lake také. SIMD část je ale u Applu slabší, protože každá pipeline má jen 128bitovou šířku, kdežto procesory x86 už umění AVX/AVX2 s 256bitovými vektory, které dávají dvojnásobný výkon.

Architektura Apple Firestorm AnandTech Architektura Apple Firestorm, dle AnandTech (Zdroj: AnandTech)

Jádro Applu má tedy mnohem hlubší out-of-order fronty (ty umožňují přehazování operací, CPU má tedy větší okno, s nímž může pracovat) a zároveň je mnohem širší co do paralelismu instrukcí, které může zpracovávat současně. Má i mnohem větší cache s agresivním časováním. Toto procesoru dodává výrazně, o desítky procent vyšší výkon na 1 MHz (IPC). Nevýhoda je, že zabírá víc tranzistorů a nedosáhne na tak vysoké frekvence.

V dosažitelných frekvencích má zase výhodu přístup AMD/Intelu. Protože výkon je zjednodušeně řečeno IPC krát frekvence, nakonec může reálná rychlost takto rozdílných CPU architektur ovšem být stejná či podobná. 2×1 se rovná totéž co 1×2…

Integrovaná grafika Apple

Také integrované GPU je v procesoru M1 vlastní od Apple (i když v poslední době se opět někde uvádí, že je to mix vlastního vývoje a licencovaného grafického IP PowerVR od Imagination Technologies – ono odstřižení se Applu tedy možná nebylo až tak radikální). V procesoru M1 má grafika osm jader (128 výpočetních jednotek), je tedy dvojnásobně široká proti čtřjádrové v A14. Tedy vlastně – maximálně osm jader. V některých konfiguracích bude GPU oříznuté jen na sedm jader.

Podle Apple má GPU teoretický výpočetní výkon 2,6 TFLOPS, ale nevíme, zda je to v přesnosti FP32 nebo v mobilní FP16. Texturovací výkon je 82 gigatexelů za sekundu a pixel fill rate 41 gigapixelů za sekundu. Pro srovnání: grafika Iris Xe v Tiger Lake má v FP32 výkon 2,07 TFLOPS, v FP16 pak 4,16 TFLOPS. Apple uvádí, že Apple M1 má vůbec nejvýkonnější integrované GPU, jaké existuje, takže je možné, že ono 2,6 TFLOPS je v FP32.

AI, USB4/Thunderbolt, PCIe 4.0

Mimo grafiku bude mít čip také akcelerátor pro aplikace umělé inteligence/neuronových sítí, tedy něco ve stylu tensor jader v grafikách Nvidia. Jde o specializovaný akcelerátor s 16 jádry (stejně jako v A14).

Součástí procesoru M1 je také integrovaná konektivita pokrývající vše, co by měly notebooky a PC potřebovat (tedy alespoň ty od Apple). Je k dispozici rozhraní PCIe 4.0 s neupřesněným počtem linek. Není jasné, zda se k nim připojuje i SSD – řadič pro SSD je možná přímo součást samotného čipu. Zde to, že si navrhuje SoC sám pro vlastní produkty, dovoluje takovouto šikovnou úsporu. Ovšem SSD zase bude nevyměnitelné a zejména neupgradovatelné.

Pro externí periférie pak je integrován řadič Thunderboltu 3 – respektive USB4, také navržený přímo Applem a podporující rychlost až 40 Gb/s. Přes Thunderbolt bude k počítači poháněnému procesorem M1 a jeho integrovanému GPU možné připojit monitor s rozlišením až 6K (Pro Display XDR přímo od Apple).

Aktualizováno: zdá se, že zatímco 40Gb/s Thunderbolt je podporován, M1 ve skutečnosti nepodporuje celé USB4 v tom smyslu, že neumí 20Gb/s USB 3.2 Gen 2x2 (SuperSpeed USB 20Gpbs). Řadič dle specifikací podporuje jen 10Gb/s USB 3.2 Gen 2 (SuperSpeed USB 10Gpbs).

Výkon dost nejasný

Výkon CPU architektury Firestorm už bylo možné naměřit v telefonech (čip A14), ale Apple bohužel neříká, jaké je TDP procesoru, ani jaké jsou frekvence. Odhadnout výkon je proto těžké (kromě vyšší přípustné spotřeby mu mimochodem asi může pomoci nahoru větší L2 cache). Apple tvrdí, že procesor M1 je až 3,5× výkonnější CPU než „nejlepší procesory x86 pro notebooky“, má až 6× lepší integrovanou grafiku a 15× vyšší výkon v umělé inteligenci. Jinde zase uvádí až 2× lepší výkon CPU při omezení spotřeby na 10W a až 3× lepší energetickou efektivitu.

Ale v jakých programech je to testováno a proti jakému procesoru, to není nikde řečeno. Takže počítejte s tím, že tu nejspíš byla vyzobaná ta nejlépe vycházející čísla, a podobné marketingové triky. Obvykle varujeme, že oficiálním benchmarkům není radno moc věřit a je třeba počkat na nezávislé recenze. Tady to asi platí obzvlášť, protože ani nevíme, o jakých testech vlastně Apple mluví.

Podle Apple je prý M1 vůbec nejvýkonnější procesor. Vzhledem k tomu, že má výhodu 5nm procesu a asi také mnohem větších rozpočtů na vývoj, není vůbec nemyslitelné, aby to byla pravda. Podle testování AnandTechu v benchmarku SPEC2006 byl už telefonní Apple A14, který běží až na taktu 3,1 GHz (aktualizováno: podle jiných zdrojů je to zdá se spíš 3,0 GHz), schopen v jednom vlákně dosáhnout výkon někde mezi Intel Core i7-1185G7 (Tiger Lake na 4,8 GHz) a Ryzenem 9 5950X (Zen 3 na 4,9–5,0 GHz). Podle toho, jakou frekvenci bude notebookový procesor M1 dosahovat, by mohl v jednojádrovém výkonu Ryzen 9 5950X překonat. V SPEC2006 by mu zřejmě k vítězství stačilo jen nějakých 300, 400 MHz navíc. Ale opět, raději počkejme na benchmarky.

Vzhledem k tomu, že budou porovnávány dva různé operační systémy na různé instrukční sadě, ovšem i nezávislé benchmarky budou komplikované. Applu například ve výkonu také může pomoci, že může vyladit operační systém a knihovny pro své CPU a naopak. iOS a ARM MacOS používají 16KB stránky paměti, což měřitelně zvyšuje výkon, zatímco na x86 (Windows a typicky i Linuxu) se pro zpětnou kompatibilitu a univerzálnost používají 4KB stránky. S většími stránkami se sice vyplýtvá nějaká operační paměť, ale jsou lépe využité cache a TLB. A jsou asi i další věci, v nichž bude srovnávání trošku jabko-hruškové.

Prvních tři počítače: MacBook Air 13

Apple procesor M1 vypouští ve třech různých počítačích, které se začínají prodávat již příští týden. První z nich je 13,3" MacBook Air, v němž bude procesor pasivně chlazený a cena bude začínat na 999 $. TDP asi bude poměrně nízké, takže výkon bude omezen. Počítač bude mít displej s gamutem DCI-P3 (kolik přesně procent z DCI-P3, není řečeno).

Galerie: Apple MacBook Air 2020/procesor M1

Mac Mini

Druhý přístroj je Mac Mini, kde už je použito aktivní chlazení notebookového typu a výkon by tedy měl být vyšší. Tato krabička bude mít port HDMI 2.0, dva USB-C (USB4/Thunderbolt 3), dvě USB-A a 3,5mm jack plus gigabitový Ethernet. Víc konektivity už ne, tedy kromě Wi-Fi 6. Cena začíná na 699 dolarech.

Galerie: Apple Mac Mini 2020/procesor M1

MacBook Pro 13

Třetím a zatím posledním přístrojem je 13,3" Macbook Pro. Také zde už to je s aktivním chlazením. Také bude mít displej s gamutem DCI-P3 a Touch Bar. Apple také tvrdí, že trojice mikrofonů, které jsou zabudované, mají „studiovou kvalitu“ (na druhou stranu, webcamera je pořád jen 720p). Tento model stojí 1299 $.

Galerie: Apple MacBook Pro 2020/procesor M1

Maximálně 16 GB RAM

Všem třem počítačům Apple umožňuje osadit až 2TB SSD, za které ale asi hodně připlatíte – výchozí konfigurace za výše uváděné ceny má jen 256GB úložiště. Stejně tak RAM má za citovanou cenu kapacitu jen 8 GB. To se dá upgradovat na 16 GB – a víc už ne. U Mini a Airu to možná tak nevadí, ale u modelu Pro už to nadzvihuje obočí. Zde by určitě slušela možnost osadit 32 GB.

Zda jde o omezení hardwaru, není jasné, ale je možné, že na vině je ono osazení čipů LPDDR4X přímo na pouzdro procesoru. To skýtá omezený prostor, zřejmě jen pro dvě multičipová pouzdra.

Pořídili byste si počítač Apple s procesorem ARM (M1)?

Začátek dvouleté cesty

Další modely v nabídce zatím ARM ještě nepostihl. Je možné, že pro třeba 16" MacBook Pro má Apple další procesor třeba rovnou s osmi velkými jádry – a podporou pro vyšší kapacitu RAM. Ten by pak mohl být třeba i v iMacu. Firma uvádí, že celkový přechod na vlastní procesory bude trvat až dva roky, takže toto je skutečně jen začátek.

bitcoin školení listopad 24

Jak se to bude vyvíjet a jaké budou síly a slabiny této de facto nové platformy počítačů, to se teď budeme postupně dozvídat z recenzí a zkušeností uživatelů…

Galerie: ARM procesor Apple Silicon M1

Zdroje: Apple (1, 2), AnandTech