Nový AI čip Nvidie pro auta Orin má výkon 200 TOPS. Konec vlastních jader Denver?

30. 12. 2019

Sdílet

Nvidia už nějakou dobu nevyrábí procesory ARM pro mobilní zařízení a podobná určení – SoC pro konzole Nintendo Switch je několik let starý 20nm čip. Ovšem tato linie pořád žije, jenom ji Nvidia předělala na procesory pro akceleraci umělé inteligence (neuronových sítí) v autech. Právě teď koncem roku Nvidia oznámila nejnovější z těchto ARM procesorů, který nese kódové označení Orin – jméno Tegra u totiž Nvidia přestala používat, tomuto čipu a na něm založeném modulu pro vozidla říká prostě Orin a Drive AGX Orin.  

(Drive AGX) Orin

Orin – což je opět jako u předchůdců komiksové jméno, snad by to mohl být Aquaman, ale popravdě tady už se ve světě trikotů ztrácím – já následníkem 12nm čipu Xavier. Ten měl osm jader Carmel přímo z designové dílny Nvidie, a GPU architektury Volta s tensor jádry, která poskytovala výkon 30 TOPS pro akceleraci neuronových sítí. Xavier byl prvně oznámen už v roce 2016, takže následník už byl na čase.

Orin bude již zřejmě 7nm (pokud ne rovnou 5nm) čip a přinese velké navýšení výkonu. Obsahovat bude 12 procesorových jader architektury ARM. Jde o jádra označená kódově Hercules, která ještě nebyla oficiálně oznámena. To proto, že Nvidia čip oznamuje v hodně velkém předstihu před reálnou výrobou – reálně mají výrobci aut Orin využívat až ve vozidlech uvedených od roku 2022 (ovšem čip by byl k dispozici v předstihu před tím). Podle roadmapy ARMu by Hercules měl být následníkem nynějšího jádra Cortex-A77 (to mělo kódové jméno Deimos). Mohlo by tudíž jít o Cortex-A78 – či jak se bude jmenovat – který asi ARM oznámí v roce 2020.

AI procesor Nvidia Drive AGX Orin prezentace1 Prezentace na odhalení Nvidia Drive AGX Orin (Zdroj: Hexus.net)

Už žádná vlastní CPU jádra Nvidie?

Použití Cortexu-A78 je pro Nvidii celkem podstatná změna, protože předchozí generace používaly její vlastní jádra „Project Denver“ provádějící softwarově překlad instrukcí ARM na interní VLIW architekturu, kterou pak zpracovávaly samotné hardwarové jednotky. V druhé výkonnější generaci přítomné v Xavieru se pak jmenovala Carmel. Použití Herculů možná znamená, že Nvidia svůj vlastní vývojový program těchto hybridních jader ukončuje a podobně jako třeba Qualcomm nebo nedávno Samsung přejde na licenční jádra ARM Cortex.

Tip: Nvidia poprvé poodhalila projekt Denver. 64bitový ARM je potomkem Transmety

Je to škoda, protože tento druh architektury už asi nikdo další nepoužívá, takže technologická diverzita se zase sníží. Ovšem šlo současně o komplikovaný design, takže by nebylo překvapující, pokud by se ukázal jako dlouhodobě nekonkurenceschopný proti nativním out-of-order jádrům. Pravda, ústup Nvidie od vlastních jader nemusí být nutně definitivní. Teoreticky se mohou vrátit v některé další generaci. I když třeba nemusí jít o Denverovskou VLIW architekturu, ale o něco konvenčnějšího, jen mířícího výkonem výš, než Cortexy. Nicméně CPU jádra nejsou v AI čipech Nvidie tak důležitá, takže je pravděpodobnější, že firma přesouvá investice na samotnou GPU a AI architekturu, kterou se odlišuje od konkurence. A pro CPU bude raději používat to, co vyvine ARM.

AI procesor Nvidia Drive AGX Orin AI procesor Nvidia Drive AGX Orin (vizualizace)

Vyšší výkon (a spotřeba)

Hlavní výpočetní sílu bude asi ale opět místo jader ARM obnášet velké množství specializovaných tensor jader. Čip má údajně mít okolo 17 miliard tranzistorů, což by na 12nm procesu asi zabíralo skoro 700 mm² (obří 754mm² Turing TU102 má 18,6 miliard), takže počet jednotek bude určitě značný. Pro neuronové sítě (AI výpočty) má Orin poskytovat teoretický výkon až 200 TOPS ve výpočtech s hodnotami INT8, zatímco Xavier nabízel „jen“ 30 TOPS, jde tedy o skoro 7× zvýšení výkonu (zejména asi) tensor jader. Protože jde o 7nm čip, měl by Orin také používat novou generaci GPU (Ampere?), kterou teprve vyhlížíme, ale než Nvidia čip vydá, už by měla dávno být na světě. Nicméně přímo GPU jednotky v klasickém smyslu budou mít v tomto čipu menší důležitost než tensor jádra pro AI.

bitcoin_skoleni

Stejně jako Nvidia při odhalení ani nesdělila jméno GPU architektury, zatím zamlčuje také většinu dalších podrobností. Víme ještě, že čip bude mít paměť s 200GB/s propustností, ale už ne kapacitu nebo její typ. Ve výbavě bude schopnost dekódovat 8K video (H.264, VP9 i HEVC) a enkódovat 4K video při 60 snímcích za sekundu, integrované budou čtyři 10Gb/s adaptéry Ethernet pro propojení.

AI procesor Nvidia Drive AGX Orin prezentace2 Prezentace na odhalení Nvidia Drive AGX Orin (Zdroj: Hexus.net)

Podobně také není sděleno TDP. Ale vypadá to, že Orin poběží na větších spotřebách než zhruba 30W Xavier a Nvidia míří na vyšší relativní úroveň výkonu proti minulosti. Protože zatímco plánovaný výkon je uváděn jako sedminásobný oproti Xavieru, energetická efektivita, tedy poměr mezi výkonem a spotřebou, má podle Nvidie narůst jen 3×. TDP by tedy mělo být o něco vyšší než dvojnásobné, patrně někde okolo 70 W či 65 W.

Galerie: Křemíkové firmy, které vyrábějí procesory s technologií ARM