Tegra s architekturou Pascal, modul Jetson na Computexu 2016 (Zdroj: 4Gamer)
Nvidia 16nm Tegru pojmenovala Parker
(mělo by to být podle Spidermana), což je kódové označení,
které se objevovalo už
na značně starých roadmapách, eventuálně ale čip nejspíše
dostane ještě klasické jméno, možná Tegra P1. Tento SoC není
ovšem mobilním čipem, jako dřívější předchůdci, Nvidia jej
podává jako procesor uzpůsobený čistě pro oblast automobilového
průmyslu. Patrně tedy bude mít vyšší TDP než čipy pro tablety
či dokonce telefony. Ostatně Parker jsme již v této roli
viděli, bude totiž tvořit základ výpočetního modulu
Drive PX 2, který Nvidia nabízí pro samořídící
vozidla.
Parker je po stránce CPU asymetrické
šestijádro, nikoliv ale obvyklého typu big.LITTLE. Nvidia používá
blok čtyř Cortexů A57, což jsou v portfoiu ARMu výkonná
a relativně žravá jádra, a k nim dvojici vlastních
jader Denver 2.0 (či také Denver 2). Vše je 64bitové
a propojené koherentně logikou HMP. Nvidia píše, že toto
uspořádání umožňuje pružně používat pro danou úlohu vždy
nejvhodnější jádra a mít optimální vícevláknový výkon.
Ve slajdech se objevuje označení „Big + Super“, což by asi
naznačovalo, že Denver 2.0 je zde v roli výkonnějšího
jádra s vyšším jednovláknovým výkonem.
Nvidia Tegra Parker (Hot Chips 28)
Nvidia neuvádí mnoho podrobností
k architektuře Denveru 2, základ ale zdá se zůstal
stejný, čip má superskalární výpočetní část umožňující
zpracovat až 7 operací, nad nímž je softwarová vrstva pro
dynamickou optimalizaci kódu s cachováním (jednou přeložený
kód je tedy možno opakovaně spouštět rychle a úsporně). Jádro
má 128KB L1 cache pro instrukce a 64KB pro data, což odpovídá
první generaci; obě jádra sdílejí 2MB L2 cache.
Denver 2 je údajně nejvýkonnější ARM
Podle Nvidie má
Denver 2 výrazně zlepšený poměr výkonu a spotřeby
a celkově má Parker být „nejvýkonnější procesor
architektury ARM“. To je zřejmě na základě benchmarku
SpecInt2K-Rate, který můžete vidět na slajdu. V tom Parker
poráží dvoujádro A9x od Applu, nicméně si nejsem jist, zda je
to zrovna při srovnatelné spotřebě.
Podle Nvidie je Parker nejvýkonnější ARM, či jeden z nejvýkonnějších
Grafické jádro Parkeru má stále 256
stream procesorů, což není navýšení proti čipu X1 generace
Maxwell. Nicméně použita je už architektura Pascal a tospolu
s 16nm procesem zřejmě dovolilo zvýšit takty o polovinu,
jelikož Nvidia nyní uvádí výkon až 1,5 TFLOPS. Ovšem číslo
udává poloviční přesnost (FP16), ve standardní přesnosti FP32
(pokud bychom chtěli srovnávat s GPU pro PC) by tedy čip měl
tedy výkon 750 GFLOPS.
Tuto grafiku živí poměrně silný
paměťový subsystém. Parker používá mobilní paměti LPDDR4,
ale s ECC a čtyřkanálovým (tedy celkově 128bitovým)
zapojením, což má celému čipu dávat teoretickou propustnost 50
GB/s.
Pro auta má Parker implementovanou
hardwarovou virtualizaci na CPU i GPU (podporuje až osm VM)
a bezpečnostní funkce, které mají zajistit spolehlivou
detekci případných chyb a vyrovnat se s nimi. Čip by
měl mít vyšší spolehlivost (ISO 26262) a uzpůsobené jsou
i periférie, SoC podporuje 12 kamer a speciální rozhraní
CAN. Dostupný je také gigabitový Ethernet a multimediální
blok pro dekódování i kompresi 4K videa při 60 snímcích za
sekundu ve formátech VP9 a HEVC.
Nvidia zatím tento SoC používá ve
zmíněném modulu Drive PX 2, o němž píše, že jej
zkouší už 80 zákazníků buď z automobilového průmyslu
nebo univerzit (experimentálním uživatelem je Volvo, jiné
konkrétní automobilky jmenovány nejsou). Užití mimo automobily
asi nebude vzhledem k uzpůsobení pro tuto roli moc časté,
nicméně by měl být opět dostupný alespoň vývojářský modul
Jetson. Nedávno se také objevily zprávy o tom, že by
nějakou Tegru mělo používat Nintendo v nové
konzoli NX, ta však bude částečně mobilní. Parker zatím
vypadá spíš na SoC z vyšší váhové kategorie, takže
nasazení v NX u něj asi moc pravděpodobné není –
v čemž se ale pochopitelně můžu mýlit.
Zdroje: Nvidia,
ComputerBase