Tesla K80 je duální kartou; po té, co přišel GeForce Titan Z se asi podobná Tesla dala čekat, byť asi každý předpokládal, že bude použito původní GPU GK110. Karta má ovšem poněkud jiné parametry. Oba čipy GK210 mají aktivních po 2496 stream procesorech a takt 562 MHz. Karta by ale měla mít plně dynamické turbo (GPU boost), s kterým může frekvence vyhnat až na 875 MHz. Pokud jí to ovšem povolí TDP, které Nvidia stanovila na 300 W (pro srovnání, loňská jednočipová špička nabídky, tedy Tesla K40, má TDP 235 W).
Na těchto taktech má Tesla K80 dosahovat až 8,74 TFLOPS teoretického výkonu ve výpočtech s jednoduchou přesností. V přesnosti dvojité pak má teoreticky dávat 2,91 TFLOPS. Pokud ale běžící úloha nebude nechávat tepelný prostor pro turbo, bude samozřejmě potenciál nižší. Co se chlazení týče, karta je pasivní a o odvod tepla se tedy musí postarat adekvátní průtok vzduchu serverem.
Čip GK210 má 384bitovou paměťovou sběrnici a každé z obou GPU k ní má připojených 12 GB paměti GDDR5. Celkově se tedy jedná o 24 GB, což Nvidia podává jako rekordní kapacitu. Jelikož je ale tento příděl rozdělen mezi dvě GPU, nejde vlastně o skutečný pokrok, neboť 12 GB na GPU už měla Tesla K40 a AMD s kartou FirePro W9100 nabízí dokonce 16 GB. Paměti mají efektivní frekvenci 5,0 GHz, což je méně než u jednočipové Tesly K40. Je možné, že Nvidia takty snížila, aby zkrotila spotřebu zdvojeného paměťového subsystému. Každé GPU by takto mělo mít k dispozici propustnost 240 GB/s.
Model | Stream procesory |
GPU - takt | Paměť | Sběrnice | Paměť - takt | TDP | Výkon SP / DP |
Tesla K80 | 2×2496 | 562–875 MHz | 2×12 GB GDDR5 | 2×384 bitů | 5,0 GHz | 300 W | 8,74/2,91 TFLOPS |
Tesla K40 | 2880 | 745 MHz | 12 GB GDDR5 | 384 bitů | 6,0 GHz | 235 W | 4,29/1,43 TFLOPS |
Tesla K20X | 2688 | 732 MHz | 6 GB GDDR5 | 384 bitů | 5,2 GHz | 235 W | 3,95/1,31 TFLOPS |
Tesla K20 | 2496 | 706 MHz | 5 GB GDDR5 | 320 bitů | 5,2 GHz | 225 W | 3,52/1,17 TFLOPS |
GK210: Velký Kepler s více registry a větší cache
Co se samotného GPU GK210 týče, podle dostupných informací by se mělo velmi podobat čipu GK110, od něhož má být přímo odvozeno – ovšem s některými podstatnými změnami. Bohužel nevíme, kolik nativně obsahuje bloků SMX a stream procesorů. Bylo by logické, kdyby jich bylo stejně jako u GK110 2880 (15 bloků SMX), nicméně potvrzeno to není. Čip má stejně jako GK110 propad výkonu při dvojité přesnosti v poměru 3:1. Architektura samotných stream procesorů by měla být stále stejná (Kepler) a také bloky SMX by měly mít stejnou stavbu (192 stream procesorů, 16 texturovacích jednotek).
GK210 ale dostal větší paměti cache a více registrů, což by mělo zefektivnit výpočty, jelikož GPU by mělo z nezměněného počtu výpočetních jednotek a stejné paměťové propustnosti vymáčknout více výkonu. Register file pro každý blok SMX se zvětšil na 512 KB z 256 KB u čipu GK110, takže celkově by měl být počet dostupných registrů dvojnásobný. Dvojnásobná je také sdílená L1 cache, ta má nyní 128 KB (u GK110 to bylo 64 KB). Kvůli těmto změnám by měl celý čip být fyzicky větší než GK110, neboť Nvidia novinku stále vyrábí na 28nm procesu u TSMC.
Karta Tesla K80 by měly být fyzicky k mání již velmi brzo. Nvidia udává, že už ji v tuto chvíli dodává svým distributorům a výrobcům serverů. V nabídce ji budou mít například firmy jako Cray, HP, Dell, SuperMicro, Tyan, Bull, Inspur, Penguin, Cirrascale, Quanta, Sugon a Inspur. Nvidia u karet Tesla neuvádí oficiálně ceny, nicméně to vypadá, že se karty budou prodávat za sumu okolo 5000 USD (okolo 130 000 CZK).