Nvidia vydává výpočetní karty Tesla M40 a M4. Do serverů už jde i s čipem GM206

13. 11. 2015

Sdílet

 Autor: Redakce

Když se ukázalo, že grafická architektura Maxwell ani ve svém „velkém“ příslušníku GM200 nebude mít podporu pro výpočty s dvojitou přesností (a kromě toho jí chybí také třeba ECC u pamětí cache a RAM), počítalo se, že ji Nvidia nebude uplatňovat v oblasti výpočetních akcelerátorů Tesla. Ovšem ne všechny úlohy, v kterých se firma snaží „GPGPU“ prosazovat, potřebují matematické výpočty v FP64. Teto týden tak Nvidia uvádí výpočetní serverové verze hned dvou GPU architektury Maxwell: Teslu M40 s čipem GM200 a Teslu M4, v níž je GM206 z poměrně levných karet GeForce GTX 960 a GTX 950.

Tyto karty mají sloužit pro úlohy jako je umělá inteligence, aplikace neuronových sítí a tzv. strojového učení (nebo také „deep learning“, což je v poslední době snad nejpopulárnější „buzzword“ ve slovníku firmy). Výkonnější model M40 by měl podle představ Nvidie sloužit hlavně k jejich trénování, kdežto karta M4 pak spíše k aplikaci předtím vytrénovaných algoritmů.

Tesla M40 má plně aktivovaný čip GM200 s 3072 jádry a jde vlastně do jisté míry o převlečený GTX Titan X, ovšem opatřený jiným chladičem (pasivním pro osazení do rackové skříně se silným průtokem vzduchu). GPU karty běží v boostu až na 1140 MHz, základní takt uveden není. Paměti jsou typu GDDR5 na 384bitové sběrnici s kapacitou 12 GB, byla nicméně snížena jejich frekvence na 6,0 GHz efektivně. Karta má stejně jako herní protějšek TDP 250 W.

Nvidia Tesla M40
Nvidia Tesla M40 

Teoretický výkon je dle Nvidie 7 TFLOPS ve výpočtech s jednoduchou přesností (FP32). Výkon ve výpočtech s dvojitou (FP64) je jak již bylo zmíněno vlivem architektury nízký, propadá se na 1/32 teoretického výkonu v FP32. Pro Teslu M40 to znamená 210 GFLOPS.

 

 

GM206 se spotřebou 50–75 W

Tesla M4 je přes mnohem nižší výkon v některých směrech možná zajímavější. Obsahuje plně aktivované GPU GM206 se 1024 stream procesory, které v boostu běží na 1075 MHz. Také zde je použito pasivní chlazení pro rackové skříně, v tomto případě je ovšem karta nízkoprofilová. Pozoruhodné je, že TDP je zde mnohem nižší než na desktopu – údajně má být nastavitelné v rozsahu 50–75 W (pokud by Nvidia vydala takový herní model, mohl by běžet bez přídavného napájení). Je ale velmi pravděpodobné, že tato nízká spotřeba je daná tím, že základní takt GPU je značně nižší, než udávané turbo 1075 MHz.

Nvidia Tesla M4
Nvidia Tesla M4

Karta má opět o něco pomalejší paměťový subsystém než herní verze. Na 128bitové sběrnici jsou osazeny 4 GB paměti GDDR5 na efektivním taktu 5,5 GHz. Pro tuto kartu Nvidia udává teoretický výkon ve výpočtech s jednoduchou přesností až 2,2 TFLOPS (což asi bude při boostu), v FP64 je pak opět propad na 1/32, udávaný výkon je jen 70 GFLOPS.

 

ICTS24

Tyto karty zatím ještě nejsou na trhu, Nvidia Tesly obvykle vydává „papírově“ v předstihu před reálnou dostupností. Model M40 by nicméně měl být k mání ještě do konce roku. Úsporná Tesla M4 pak má na trh dorazit v prvním čtvrtletí roku 2016. Ceny nikde uvedené nejsou, jelikož pro karty Tesla Nvidia žádné oficiální sumy nezveřejňuje.

Zdroje: Nvidia, AnandTech