Huawei má jeden z nejrychlejších čipů ARM, 16nm Cortex-A72 na 2,3 GHz

9. 11. 2015

Sdílet

 Autor: Redakce

Když se před pár roky odehrávalo něco jako „ARMová horečka“, mnoho společností se v době boomu chytrých telefonů a tabletů rozhodlo navrhovat si vlastní SoC. Čínská společnost Huawei, respektive její dceřinný podnik HiSilicon, je jedním z úspěšných případů. Nyní tato firma odhalila svůj poslední počin ve formě čipu Kirin 950, kterým se vyšvihla na samou špičku mobilních SoC. Tento procesor je vyráběn na 16nm procesu s FinFETy, používá nová jádra Cortex-A72 a parametry by mohl být jedním z nejvýkonnějších ARMů dneška.

HiSilicon vyrábí čip na 16nm procesu u TSMC, a to na zdokonalené variantě 16FF+. Firma je vůbec prvním hráčem s takovýmto čipem po Apple (Samsung má ovšem 14nm čip v podobě Exynosu 7420), Kirin 950 by měl přitom být již brzy na trhu, telefony s ním se údajně mohou objevit ještě letos. Zároveň jde o první čip s Cortexem-A72 určený pro telefony. Toto 64bitové jádro je při stejném taktu podle HiSiliconu o 11 % rychlejší než Cortex-A57, přitom ale bude také mít poměrně vysokou frekvenci.

SoC HiSilicon Kirin 950
SoC HiSilicon Kirin 950

Kirin 950 je osmijádrový čip koncepce big.LITTLE. Cortexy-A72 má celkem čtyři v klastru, který může běžet maximálně až rychlostí 2,3 GHz. Úsporný klastr pro kontinuální zátěž je tvořen Cortexy-A53, rovněž nastavenými na relativně vysoký takt – 1,8 GHz. Nicméně je třeba mít na paměti, že v telefonním SoC s omezeným TDP a chlazením neříkají obvykle maximální takty vše. Až reálné testy ukáží, jak moc SoC v praxi „throttluje“ a zda jej nezpomaluje špatné řízení spotřeby, což je metla architektury big.LITTLE.

HiSilicon na zajímavém slajdu ukazuje hodnoty spotřeby, které použitá jádra na 16 nm vykazují při různých úrovních výkonu. Cortexy-A53 si mohou vzít až 200 mW, což by měl být dlouhodobě udržitelný výkon (a příkon). Cortexy-A72 mají dlouhodobě udržitelný příkon/výkon někde okolo 300 mW, což je však při taktech stažených na nízké hodnoty. V boostu trvajícím po dobu jedné sekundy mohou jít až asi na 600 mW, to ale stále není plný takt.

Průběhy spotřeby jader Cortex-A53 a Cortex-A72 pro různé úrovně výkonu
Průběhy spotřeby jader Cortex-A53 a Cortex-A72 pro různé úrovně výkonu

Jak na grafu vidíte, horní spektrum frekvencí Cortexů-A72 čip neudrží ani tu sekundu. Spotřeba jádra může jít až k 1,45 W. Zatížení celého klastru „big“ na oněch maximálních 2,3 GHz tedy bude možné jen na velmi krátké okamžiky a za podmínky, že čip má teplotní rezervu. Pro pořádek je ale třeba říct, že takto to funguje v telefonech obecně, jen se tím výrobci raději moc nechlubí a ve specifikacích se snaží mít takty co nejvyšší.

 

 

GPU na 900 MHz, hybridní řadič pamětí, DSP po OMAPu

Ambiciózní jsou i další komponenty čipu – GPU ARM Mali-T880MP4 má běžet až na 900 MHz. Má však méně jader, než někteří konkurenti, takže v grafickém výkonu SoC lídrem nebude. Zajímavé je vůbec první použití duálního řadiče pamětí, který podporuje jak LPDDR3, tak LPDDR4. Má dva 32bitové kanály a HiSilicon si jej navrhl sám na míru.

Komponenty v SoC pak propojuje logika ARM CCI-400. V čipu je dále integrován ovladač senzorů i5 založený na Cortexu-M7 a nově vyvinutá DSP a ISP (obvod pro zpracování a filtrování obrazu z kamery) IVP32 a PrimISP, která zřejmě duchovně vycházejí z technologií Texas Instruments. HiSilicon totiž od firmy předloni koupil část její divize OMAP, která tyto bloky vyvíjela ve Francii. SoC má také mít dekodér pro 4K video formátu HEVC (o 30 snímcích za vteřinu), enkodér ale bude zvládat jen 1080p v H.264. Navíc je integrován také datový modem řady Balong, který by měl podporovat 300MB/s LTE kategorie 6.

Vývojová deska s běžícím Kirinem 950
Vývojová deska s běžícím Kirinem 950

V AnTuTu je prý dosažitelných 82 220 bodů
V AnTuTu je prý dosažitelných 82 220 bodů

 

Efektivnější architektura: Cortex-A72 zabírá méně místa, než Cortex-A57

Výroba na procesu 16FF+ není nijak malým úspěchem, HiSilicon má údajně dokonce až 80% výtěžnost (pokud si marketing nevymýšlí). Je to díky tomu, že firma prý spolu s Applem byla jedním z hlavních vývojových partnerů TSMC při ladění tohoto procesu, takže čipy pokusně vyráběla už od ledna. Proces s FinFETy má údajně hlavní výhodu v snížené energetické hustotě. Zatímco v minulosti stále rostla koncentrace spotřeby a tepla v nejaktivnějších částech čipu, u 16FF+ se situace údajně konečně zlepšila, proti 20nm procesu, jenž byl sám o 43% horší než 28nm. prý i na polovinu.

16nm proces TSMC přináší snížení energetické hustoty čipů proti 20nm, ale i 28nm procesu
16nm proces TSMC přináší snížení energetické hustoty čipů proti 20nm, ale i 28nm procesu

Díky tomu nemusí být čip tak opatrně stavěn a „vycpáván“ méně aktivními či úplně neaktivními částmi a i výkonné jádro jako A72 se může zmenšit mnohem více, než kolik by dovolovalo prosté škálování procesu. Na Kirinu 950 prý celý klastr se čtyřmi Cortexy-A72 zabírá jen 8 mm². Zajímavé je, že toto jádro je údajně prostorově méně náročné než Cortex-A57, byť má o 11% lepší výkon a o 20 % nižší spotřebu. V 14nm Exynosu 7420 by čtyři Cortexy-A57 přes proces s vyšší hustotou měly měřit 8,88 mm². Výkonná jádra tak na čipu Kirin 950 zabírají překvapivě málo místa, což Hisiliconu ušetří něco na výrobě.

ICTS24

Srovnání plochy a vlastností Cortexu A57 a A72 dle HiSiliconu
Srovnání plochy a vlastností Cortexu A57 a A72 dle HiSiliconu

Zdroje: AnandTech, CNX Software