Jádro, které se dříve v mediálních
výpadech ARMu nazývalo Artemis, bylo včera oficiálně odhaleno
a dostalo jméno ARM Cortex-A73. Toto číslo evidentně
navazuje na Cortex-A72,
což byla dosud nejvýkonnější architektura britskou firmou
vyprodukovaná. Cortex-A73 jej má nahradit v nejvýkonnějších
a dražších (marketingovým argotem „prémiových“)
spotřebitelských zařízeních, a to v roli „big“ jádra. Jednak má přinést lepší výkon,
zejména ale lepší efektivitu (tedy více výkonu na jednotku
spotřeby), která je v mobilech nejkritičtější, neboť
chlazení a kapacita baterie jsou hlavním limitem pro absolutní
výkon.
64bitová evoluce Cortexu-A17 se vyšvihává vysoko
Cortex-A73 jde na zvýšení výkonu
paradoxně ne posílením, ale určitým zeslabením jádra. Nejde
totiž o následníka linie A15, A57 a A72 (ta se údajně
interně označuje „Austin“), což jsou nejvýkonnější
a „nejširší“ jádra, ovšem trpící horší efektivitou
a spotřebou, čímž bylo jejich nasazení v mobilních
zařízeních vždy problematické. Mnoho SoC právě kvůli spotřebě
raději zůstávalo u linie mnohem efektivnějších pomalejších
in-order jader A7 a poté A53 (interně „Cambridge“). ARM
však v posledních letech zavedl ještě třetí linii,
započatou Cortexem A12/A17, která se neformálně jmenuje „Sophia“.
ARM uvádí jádro Cortex-A73 (Zdroj: AnandTech)
Cortex-A73 patří právě do této
linie, která má jádra výkonnější než Cambridge, ale stále
optimalizovaná na spotřebu. Sophia se vzdává některých rysů,
které používá highendová linie Austin k dosažení
maximálního výkonu na takt, její výkon je ale přes užší
jádro ještě docela blízko. Spotřeba ovšem u ní klesá
více než výkon, takže takováto architektura je ve výsledku pro
zařízení omezené spotřebou lepší – CPU může běžet
na vyšším taktu a tak se může stát, že celkovým výkonem
širší jádro Austin předežene. A přesně takováto
strategie by měla být cílem jádra Cortex-A73: při stejné
spotřebě vyšší výkon, než má Cortex-A72. Do telefonů to má
přinést vyšší dlouhodobě udržitelný výkon.
Optimalizované 2-issue místo žravého 3-issue
Cortex-A73 tak má do jisté míry být
64bitovou evolucí Cortexu-A17 se stejnou filozofií. Místo jádra
staveného na zpracovávání tří instrukcí („3-issue“ dle tří
dekodérů) jako u A15–A72 tedy používá jen dva dekodéry
(„2-issue“) a soustředí na to, aby z menší šířky
jádra vyždímal co nejvíce. Jádro má kratší pipeline a také
jen dvě ALU místo tří (podrobné srovnání má
ve svém článku AnandTech). Výkon FPU a SIMD by měl být
podobný jako u A72, použity jsou dvě pipeline.
Schéma jádra Cortex-A73 (Zdroj: AnandTech)
Jádra se opět
budou sdružovat do klastrů po jednom až čtyřech a při
implementaci lze zvolit různé velikosti cache (na rozdíl od
větších jader ale není možnost mít u L1 ECC). Kromě toho
má jádro různá zlepšení zvyšující výkon při stejném
taktu, například v predikci větvení, v L1 cache
a paměťovém subsystému, který má být jedním z hlavních
zdrojů zlepšení IPC.
Cortex-A73 nemá mít výrazně nižší IPC než A72, některé úlohy i zrychlí (Zdroj: AnandTech)
ARM už s tímto jádrem počítá
i s výrobou na 10nm procesu, který již může být
v době uvedení čipů realitou, A73 má pak být schopen
dosáhnout na takty až 2,8 GHz. Kromě nových FinFETových
technologií ale pro levnější zařízení bude možná
i implementace na 28nm technologii, v tomto případě by
mohlo CPU podle ARMu stále běžet ještě na 2,0 GHz.
Podstatné
je, že na stejném procesu a frekvenci má Cortex-A73 mít
o 25–30 % nižší spotřebu, ale také menší velikost,
dle velikostí paměti cache může být A73 až o čtvrtinu
menší než A72. Podle ARMu by prý v některých případech
mohl dvoujdrový klastr Cortexů-A73 zabírat stejné místo jako
čtyři Cortexy-A53, což by otevřelo dveře pro značně výkonnější
procesory pro levnější mobily.
Z povahy jádra Cortex-A73 také
vyplývá, že zřejmě širší Cortex-A72 nenahradí všude. Tam,
kde je pro větší TDP prostor, například v serverech, bude
nejspíše A72 používána dále. Nicméně podle ARMu by údajně
neměl výkon většiny úloh zeštíhlením jádra příliš utrpět
(v prezentaci dokonce ukazuje nárůsty IPC například v SIMD
kódu díky lepšímu paměťovému subsystému). Úplně zadarmo ale
asi zjednodušení nebude, design linie A15–A72 má samozřejmě
svá opodstatnění.
Mali-G71: GPU od ARMu opouští VLIW a chystá se na heterogenní výpočty
ARM zároveň představil i nová
grafická jádra, nazvanou Mali-G71, nahrazující předchozí
Mali-T880. Mělo by jít o poměrně významný upgrade, neboť
jde o novou architekturu GPU, nikoliv jen evoluci. Ta se nazývá
Bifrost a je zatím třetí od doby, co ARM s grafikami
začal (první dvě byly Utgard a Midgard, jenž přinesl
unifikované shadery). ARM s tímto GPU přejde z architektury
VLIW na skalární architekturu, půjde tedy o podobnou změnu
jako přechod z VLIW4/5 Radeonů HD 6000 na architekturu GCN
u AMD. Zároveň je GPU také připraveno na heterogenní
výpočty ve spolupráci s CPU.
ARM uvádí GPU Mali-G71 (Zdroj: AnandTech)
Bifrost a Mali-G71 mají být
optimalizovány pro Vulkan a další moderní grafická API.
Integrovat bude možno až 32 jader a ARM uvádí, že toto GPU
ve svých čipech použije HiSilicon, Samsung a MediaTek, což
jsou první velcí klienti, kteří jej „nakoupili“. Konkrétní
výkon je těžko odhadnout, neboť procenta zlepšení uváděná
ARMem obvykle pokrývají ideální scénáře nebo míchají
architekturu a nový proces (to platí i pro Cortexy). Detailní
popis Bifrostu opět nabízí
web AnandTech, pokud máte zájem o nízkoúrovňovější
pohled.
Architektura GPU ARM Bifrost (Zdroj: AnandTech)
Chcete vlastní CPU? ARM nabízí
úpravy Cortexů na míru
Na začátku jsem nadhodil, že ARM
také přichází s jednou významnou změnou v tom, jak se
bude tato instrukční sada uplatňovat v čipech dalších
výrobců. Ti mohli doposud buď licencovat hotová jádra Cortex,
nebo si licencovat jen samotnou instrukční sadu a poté
navrhnout od základu vlastní jádra – což dělá Qualcomm,
Samsung, Apple, ale nyní také Broadcom, Cavium, Applied Micro
(serverové čipy X-Gene) a výhledově AMD s architekturou
K12.
ARM ovšem nyní otevře jakousi třetí
cestu. Půjde o specifické licencování Cortexů, tedy jader
navržených v ARMU, ale s možností provést na zakázku
určité změny, čímž si zákazník bude moci Cortex přizpůsobit.
Tyto změny mu implementuje přímo ARM a klient tedy dostane
opět celé hotové jádro, ovšem dostupné budou jen zadavateli,
nikoliv jeho konkurentům. Z marketingového hlediska je pak
důležité, že takto upravené jádro si bude moci výrobce čipu
sám pojmenovat a chlubit se pak ve specifikacích vlastním,
„negenerickým“ jádrem. Ze asi čekat, že tato možnost řadu
výrobců mobilních čipů zaujme práv z tohoto důvodu
a čistých Cortexů o něco ubude.
Výrobci by ale údajně
neměli mít možnost zcela zapřít původ jádra, pokud půjde
o upravený Cortex dle této licence, má být někde ve
specifikacích uvedeno „Built on ARM Cortex Technology“. Nemělo by tedy možné vydávat takto vzniklé architektury za regulérně vlastní práci.
Model Built on ARM Cortex Technology kombinuje možnost úprav s licencováním hotových jader (Zdroj: AnandTech)