Obě karty používají čipy
architektury Pascal: GP102 a GP104. Jsou určené pro běh
v rackových serverech, takže se chladí pasivně průtokem
vzduchu ve skříni. Obě karty jsou místo trénování neuronových
sítí určené k jejich aplikaci po vytrénování na jiných
procesorech či GPU (Nvidia pro tento účel zamýšlí Teslu
P100).
Pro tento účel mají obě GPU
aktivovánu podporu operací s 8bitovými číselnými
hodnotami, kde by (v některých operacích) měly mít až
čtyřikrát větší teoretický výkon než v FP32. Toto je
novinka proti předchozím architekturám a výhoda právě pro
běh již natrénovaných algoritmů, které nevyžadují vysokou
přesnost (s 8bitovými celočíselnými hodnotami pracuje
i speciální
akcelerátor TPU vyvinutý v Googlu). Na herních GeForce je
podpora pro tyto instrukce jen omezená.
První model Tesla P40 je
výkonná karta s chladičem na dva sloty a TDP 250 W.
S čipem GP102 je tak trochu ukázkou toho, co by mohlo být,
kdyby byl Titan X
trošku jiný. Karta má plně aktivovaný čip GP102 s 3840
stream procesory, jenž má běžet na 1303 MHz v základu
a 1531 MHz v boostu. Také paměťová sběrnice je
384bitová jako u Titanu X, ale je osazená nikoliv pamětí
GDDR5X, ale jen GDDR5, a to na efektivní frekvenci 7,2 GHz
(propustnost 346 GB/s).
Ukazuje se tedy, že GP102 umí
pracovat s oběma typy paměti, což dává smysl i jako
pojistka pro případ, že by se Micron zpozdil s výrobou
nového typu. Kapacita pamětí je celkem 24 GB, tedy dvojnásobek
proti Titanu X, dosaženo by to mělo být zapojením 8Gb čipů
stylem „clamshell“. Karta má mít teoretický výkon až 12
TFLOPS v jednoduché přesnosti (FP32).
Nízkoprofilový bráška GTX 1080 bez
přídavného napájení
Nicméně zajímavější je zde slabší
model Tesla P4, který je určen pro uživatele, mínící do
serveru dostat GPU s co nejvyšší mírou integrace. Je založen
na plně aktivním (2560 stream procesorů) čipu GP104 z GeForce
GTX 1080, avšak značně podtaktovanému. Díky tomu se tato karta
má vejít do spotřeby 75 W, což uživatelé mohou volitelně
ještě snížit ještě dál na pouhých 50 W. Díky tomu je
její chlazení jen jednoslotové a dokonce nízkoprofilové! Že
je možné nižší highendové GPU dostat do tohoto formátu
(a spotřeby) je pozoruhodné. Škoda, že asi nikdy nevznikne
karta GeForce s takovýmto PCB a jednoslotovým
nízkoprofilovým chladičem, která by měla i obrazové
výstupy a dalo by se na ní hrát.
Nvidia Tesla P4: nízkoprofilová, jednoslotová karta na bázi GP104 se spotřebou 75 W
Tato redukce rozměrů a spotřeby
samozřejmě má svoji cenu. Karta údajně běží jen na 810 MHz
v základu a boostem 1063 MHz (zde bych ale čekal, že
dosáhnout jej při plné zátěži nebude snadnou věcí jako na
desktopových kartách). Pravděpodobně by to měly být hodnoty pro
75W spotřebu a teoretický výkon má být při těchto
parametrech až 5,5 TFLOPS. Paměti byly také podtaktovány na 6,0
GHz a karta používá stejně jako žravější model jen
GDDR5, ne GDDR5X. Jejich kapacita je 8 GB a využívají
vzdor nízkoprofilovému PCB celou 256bitovou sběrnici (osm čipů),
což dává propustnost 192 GB/s – stejné číslo jako u GTX
1060.
Jako obvykle Nvidia neuvádí žádné
oficiální ceny, obvykle se ale tyto modely pohybují v řádech
tisíců dolarů. Karty se budou prodávat skrze různé OEM
partnery, obvykle zároveň výrobce serverů. Tesla P40 má být
k mání od října, nízkoprofilová P4 pak údajně od
listopadu.