Nvidia uvádí modul Jetson Xavier pro AI: osm jader Carmel, GPU Volta, PCIe 4.0

4. 6. 2018

Sdílet

 Autor: Redakce

Na Tchaj-wanu se tento týden koná každoroční veletrh počítačů a spřízněné elektroniky Computex. Nvidia si už stihla odbýt svou úvodní prezentaci a ač se opakoval už zaběhnutý scénář, kdy na těchto akcích firma prezentuje jen obecně své technologie a klíčové věci jako uvedení nových grafik si schovává na vlastní „event“, něco nového vypuštěno bylo. Firma vydala novou generaci v sérii desek Jetson, založených na ARM procesorech Tegra. Nejnovější Jetson Xavier staví právě na stejnojmenném procesoru s integrovaným GPU generace Volta.

Jetson Xavier slouží jako vývojová deska pro čip Tegra Xavier či jen Nvidia Xavier (zdá se, že firma značku Tegra opouští), případně jako modul sloužící přímo pro řízení hotových zařízení. S použitím se počítá ve vývoji aplikací umělé inteligence, ale také pro roboty – Nvidia pro tento trh uvedla SDK pojmenované Isaac.

Deska Jetson Xavier má rozměr 100 × 87 mm, přičemž toto PCB se osazuje do sekundární desky Carrier Board, na které jsou vyvedené konektory a další prvky. K té ale zatím informace nemáme, takže ani nevíme, zdar referenční deska třeba bude mít opět formát Mini-ITX. Samotný modul Jetson obsahuje SoC Xavier vybavený 16 GB paměti LPDDR4x, která má 256bitovou sběrnici a dodává propustnost 137 GB/s. Dále je přítomno 32GB úložiště eMMC pro systém.

350 mm² čip s osmi jádry, PCIe 4.0

Čip Xavier obsahuje osm CPU jader, které by měly používat vlastní architekturu vyvinutou Nvidií. Pojmenovaná je Carmel a víme o ní to, že implementuje 64bitovou instrukční sadu ARMv8.2. Pravděpodobně by mohlo jít o evoluci architektury Denver, jádro je údajně „10-wide superskalární“, což se podobá oficiální charakteristice Denveru. Carmel by však byl širší s více jednotkami a měl by tedy potenciálně vyšší výkon na 1 MHz. CPU má zřejmě 1MB L2 cache pro každé z jader a 4MB sdílenou L3 cache. Kromě hlavního CPU uvádí Nvidia ve specifikacích ještě pomocný „Vision Accelerator“, což má být „7-way VLIW“ procesor.

GPU používá architekturu Volta z čipu GV100 (Xavier je vyráběný na stejném výrobním procesu 12FFN od TSMC). V čipu je 512 stream procesorů s výkonem 1,3 TFLOPS. GPU obsahuje i tensor cores, jejichž výkon má být 20 TOPS. Ve specifikacích jsou uvedeny i dva akcelerátory strojového učení NVDLA, přičemž není úplně jasné, zda jsou nezávislé, nebo zda používají tensor cores (duplikace hardwaru se ale nezdá úplně pravděpodobná). Výkon těchto akcelerátorů má dělat 5 TFLOPS s daty typu FP16 nebo 10 TOPS s 8bitovými celočíselnými hodnotami (INT8). Dekodér a enkodér videa podporuje až dva současné streamy ve formátu HEVC s rozlišením 4Kp60, přičemž dekódování je podporováno i v 12bitovém profilu Main 12.

Slajd k procesoru Xavier z Computexu (Zdroj: AnandTech) Slajd k procesoru Xavier z Computexu (Zdroj: AnandTech)

Celý čip zabírá na 12nm procesu plochu 350 mm², což odpovídá výkonnému GPU nebo highendovému procesoru (10jádrové Skylake-X má plochu zhruba 325 mm²). Návrh používá 9 miliard tranzistorů, čip ale míří na relativně nízké spotřeby, podporuje režimy s 10W, 15W a 30W TDP.

bitcoin školení listopad 24

Na Jetsonu Xavier je z procesoru vyvedena trojice výstupů eDP/DisplayPort nebo HDMI 2.0 (s podporou 4K při 60 Hz), 40Gb/s rozhraní CSI-2 pro až 16 kamer, 8 linek SLVS-EC, dále UFS, I2S, I2C, SPI, CAN, GPIO, UART a SD. Dostupné jsou tři porty USB 3.1, čtyři USB 2.0 a jeden gigabitový Ethernet. Hodně zajímavé je, že Xavier má zdá se integrovaný řadič PCI Express 4.0, který poskytuje rozhraní ×8, ×4, ×2 a po dvou ×1.

nvidia-robot-isaac-sdkCena tohoto zařízení je poměrně vysoká – nebo minimálně vyšší než u předchozích generací. Vývojářský kit stojí 1299 dolarů, což by při momentálním kurzu s DPH představovalo sumu 34 500 Kč. V rámci „early access“ programu budou první kusy k dispozici počínaje srpnem.