Intel chystá speciální Xeon Phi pro strojové učení a AI, proti Teslám Nvidie

22. 8. 2016

Za poslední rok jste si asi všimli, že Nvidia v oblasti výpočetního využití svých GPU začalo místo oblasti HPC (kde je důležitý výpočetní výkon v dvojité přesnosti) klást největší důraz na „umělou inteligenci“ založenou na neuronových sítích, pro což se razí termín „Deep Learning“. Zdá se ale, že i do tohoto nového zelí jí rychle začne lézt Intel, který začal výpočetním GPU konkurovat koprocesory Xeon Phi (nezdá se to, ale už jsou zde skoro čtyři roky). Na IDF nyní firma odhalila plány vydat pro obor strojového učení speciální verzi Xeonů Phi, nazvanou Knights Mill.

Toto kódové označení vypadá trochu
jako slovní hříčka, protože v roadmapě by již měl být
„Knights Hill“, což je údajně 10nm následník letos
uvedených Kights Landingů. Knights Mill má ale být uveden již
příští rok, takže je docela reálná možnost, že stále jde
o 14nm čipy. V takovém případě by tento procesor mohl
být také založen na stejném křemíku jako Knights Landing, jen
optimalizovaném na jiné parametry a využití. Knights Landing
je pro připomenutí složen ze 72 jader odvozených od Atomu
Silvermont, ale obohacených o čtyřcestné SMT a silnou
vektorovou jednotku s podporou AVX(2) a AVX-512, která
zajišťuje hrubý výkon přes 3 TFLOPS v dvojité
přesnosti.

Intel o čipu Knights Mill zatím
mnoho neprozradil. Má údajně mít vylepšenou podporu pro výpočty
s různou přesností, neuronové sítě totiž pracují pro
vyšší výkon s nižší přesností (FP16) nebo 16bitovými
či dokonce jen 8bitovými celočíselnými hodnotami (to je případ
třeba speciálního
procesoru TPU uvedeného Googlem). SIMD architektura instrukcí
AVX2 či AVX-512 by pro tyto účely měla být vhodná, jelikož
automaticky umožňuje s nižší přesností zpracovat více
hodnot. Nicméně Knights Landing by zatím ještě neměl mít
podporu pro celočíselná rozšíření AVX-512, na což by Intel
patrně potřeboval novou architekturu FPU. Na slajdu nicméně Intel hovoří jen o výkonu v klasické jednoduché přesnosti (FP32), takže je možné, že podpora nižších formátů ještě v Knights Mill nepřijde.

Xeon Phi Knights Mill pro umělou inteligenci (Zdroj: The Register)

Kromě toho má být čip optimalizován
pro masovější servery (scale-out) a nabídnout vyšší
energetickou efektivitu, tedy lepší spotřebu při stejném výkonu.
Intel dále slibuje pružnou architekturu pamětí a velkou
kapacity, což ale možná není nová vlastnost, jako spíše
srovnání se stavem současných GPU, proti nimž je již Knights
Landing výrazně napřed. Knights Mill tak možná jen nabídne
totéž – tedy kombinaci velmi rychlé integrované paměti
podobné HBM v pouzdře, která má podobnou kapacitu jako
u GPU, ale navíc ještě podporu pro velký paměťový prostor
tvořený konvenční pamětí DDR4, osazenou ve slotech DIMM ve
volitelném množství. Tato kombinace propustnosti GPU a kapacity
serverového CPU by mohla být opět diferencující vlastností
Xeonu Phi Knights Mill, čipy budou lépe schopné pracovat nad
velkými objemy dat.

Pokud pomineme zcela speciální
akcelerátory jako TPU či různé aplikace na FPGA, které by pro
tyto účely možná začnou preferovat velké firmy, pak Intel čipem
Knights Mill bude konkurovat zejména GPU Tesla od Nvidie, jak jsme
již zmínili v úvodu. Proti těm bude kromě výhody
snadnějšího programování a využití potenciálu
architektury (oproti výpočtům na GPU) moci uplatnit ještě jednu
věc – Xeony Phi dokáží samy spustit a provozovat
operační systém, takže klastrový uzel s nimi nepotřebuje
další CPU, které by koprocesor řídilo. V klastrech by tedy
bylo možno dosáhnout lepší hustoty čipů a výhoda je
i v ceně a spotřebě.

Přesnější obrysy produktu nebo
třeba cenové zařazení Intel již nezmínil, stejně jako bližší
určení uvedení – o tom víme toliko, že by čip měl
přijít v roce 2017. Půjde samozřejmě o produkt pro trh
enterprise, nic pro nás spotřebitele, trénovat své „AI“
algoritmy na nich zejména velké firmy.

Zdroje: The
Register, AnandTech,
Intel