Nvidia uvádí nové GPU generace Kepler, GK210. Běží v duální kartě Tesla K80

18. 11. 2014

Sdílet

 Autor: Redakce

Ačkoliv po nedávném úniku (údajných) specifikací „velkého Maxwellu“ GM200 jsou příznivci Nvidie či obecně grafických čipů asi natěšení na toto GPU, vypadá to, že v highendovovém segmentu má firma připravenou docela jinou záležitost. Nvidia totiž uvádí nové výpočetní GPU patřící do generace Kepler, a na něm založenou kartu Tesla K80.

Tesla K80 je duální kartou; po té, co přišel GeForce Titan Z se asi podobná Tesla dala čekat, byť asi každý předpokládal, že bude použito původní GPU GK110. Karta má ovšem poněkud jiné parametry. Oba čipy GK210 mají aktivních po 2496 stream procesorech a takt 562 MHz. Karta by ale měla mít plně dynamické turbo (GPU boost), s kterým může frekvence vyhnat až na 875 MHz. Pokud jí to ovšem povolí TDP, které Nvidia stanovila na 300 W (pro srovnání, loňská jednočipová špička nabídky, tedy Tesla K40, má TDP 235 W).

Nvidia Tesla K80
Nvidia Tesla K80

Na těchto taktech má Tesla K80 dosahovat až 8,74 TFLOPS teoretického výkonu ve výpočtech s jednoduchou přesností. V přesnosti dvojité pak má teoreticky dávat 2,91 TFLOPS. Pokud ale běžící úloha nebude nechávat tepelný prostor pro turbo, bude samozřejmě potenciál nižší. Co se chlazení týče, karta je pasivní a o odvod tepla se tedy musí postarat adekvátní průtok vzduchu serverem.

Nvidia Tesla K80

Čip GK210 má 384bitovou paměťovou sběrnici a každé z obou GPU k ní má připojených 12 GB paměti GDDR5. Celkově se tedy jedná o 24 GB, což Nvidia podává jako rekordní kapacitu. Jelikož je ale tento příděl rozdělen mezi dvě GPU, nejde vlastně o skutečný pokrok, neboť 12 GB na GPU už měla Tesla K40 a AMD s kartou FirePro W9100 nabízí dokonce 16 GB. Paměti mají efektivní frekvenci 5,0 GHz, což je méně než u jednočipové Tesly K40. Je možné, že Nvidia takty snížila, aby zkrotila spotřebu zdvojeného paměťového subsystému. Každé GPU by takto mělo mít k dispozici propustnost 240 GB/s.

 

Karty Tesla s čipy GK210/GK110
 Model Stream procesory
GPU - takt Paměť Sběrnice Paměť - takt TDP Výkon SP / DP
Tesla K80 2×2496 562–875 MHz 2×12 GB GDDR5 2×384 bitů 5,0 GHz 300 W 8,74/2,91 TFLOPS
Tesla K40 2880 745 MHz 12 GB GDDR5 384 bitů 6,0 GHz 235 W 4,29/1,43 TFLOPS
Tesla K20X 2688 732 MHz 6 GB GDDR5 384 bitů 5,2 GHz 235 W 3,95/1,31 TFLOPS
Tesla K20 2496 706 MHz 5 GB GDDR5 320 bitů 5,2 GHz 225 W 3,52/1,17 TFLOPS

 

GK210: Velký Kepler s více registry a větší cache

Co se samotného GPU GK210 týče, podle dostupných informací by se mělo velmi podobat čipu GK110, od něhož má být přímo odvozeno – ovšem s některými podstatnými změnami. Bohužel nevíme, kolik nativně obsahuje bloků SMX a stream procesorů. Bylo by logické, kdyby jich bylo stejně jako u GK110 2880 (15 bloků SMX), nicméně potvrzeno to není. Čip má stejně jako GK110 propad výkonu při dvojité přesnosti v poměru 3:1. Architektura samotných stream procesorů by měla být stále stejná (Kepler) a také bloky SMX by měly mít stejnou stavbu (192 stream procesorů, 16 texturovacích jednotek).

 

GK210 ale dostal větší paměti cache a více registrů, což by mělo zefektivnit výpočty, jelikož GPU by mělo z nezměněného počtu výpočetních jednotek a stejné paměťové propustnosti vymáčknout více výkonu. Register file pro každý blok SMX se zvětšil na 512 KB z 256 KB u čipu GK110, takže celkově by měl být počet dostupných registrů dvojnásobný. Dvojnásobná je také sdílená L1 cache, ta má nyní 128 KB (u GK110 to bylo 64 KB). Kvůli těmto změnám by měl celý čip být fyzicky větší než GK110, neboť Nvidia novinku stále vyrábí na 28nm procesu u TSMC.

Nvidia Tesla K80

ICTS24

Karta Tesla K80 by měly být fyzicky k mání již velmi brzo. Nvidia udává, že už ji v tuto chvíli dodává svým distributorům a výrobcům serverů. V nabídce ji budou mít například firmy jako Cray, HP, Dell, SuperMicro, Tyan, Bull, Inspur, Penguin, Cirrascale, Quanta, Sugon a Inspur. Nvidia u karet Tesla neuvádí oficiálně ceny, nicméně to vypadá, že se karty budou prodávat za sumu okolo 5000 USD (okolo 130 000 CZK).

Zdroje: Nvidia, AnandTech