Překvapivě brzy, už v dubnu, představila loni Nvidia první GPU 16nm generace Pascal. Ta poté úspěšně pokračovala čipy GP104, GP106 a GP107 v grafikách GeForce, ale první čip GP100 byl speciální. Nese integrované paměti HBM2 a objevil se jen ve výpočetních koprocesorech Tesla. Dokonce panovaly pochybnosti o tom, zda má součásti fixní grafické pipeline jako texturovací jednotky a může vůbec jako GPU fungovat. Odpověď na tuto otázku je ale nakonec taková, že může a bude. Nvidia totiž nyní vydala první skutečnou grafickou kartu, která je na GP100 a pamětech HBM2 založená.
Velký Pascal, HBM2, FP64, FP16...
Ačkoliv je 610 mm² velký čip GP100 primárně určený pro výpočty, Nvidia na něm nyní postavila profesionální grafickou kartu Quadro GP100 pro pracovní stanice. Ta má představovat špičku nabídky a stát ještě nad modelem Quadro P6000, v němž je plně aktivní čip GP102 (3840 stream procesorů na boostovém taktu zhruba 1560 MHz a 9,0GHz paměti GDDR5X o kapacitě 24 GB). Quadro GP100 bude mít sice o něco nižší hrubý výkon v běžných výpočtech FP32, nabídne ale vysokou rychlost operací s dvojitou přesností FP64 v poměru 1:2 k jednoduché přesnosti. A také rychlé 16bitové výpočty s poloviční rychlostí (FP16, dvojnásobný výkon proti FP32), což žádný jiný Pascal neumí. Výhodou tohoto modelu budou také paměti s ECC.
Konfigurace je takováto: čip GP100 má aktivních 3584 stream procesorů a jeho takt při boostu by měl být okolo 1430 MHz – mělo by to znamenat 10,3 TFLOPS hrubého výkonu v FP32. GPU by zřejmě mělo mít 224 texturovacích jednotek a možná 128 rasterizačních jednotek, to ale není potvrzeno. Pokud je to pravda, měl by zde GP100 třetinovou výhodu proti GP102. Čip je osazen na interposeru s čtyřmi čipy HBM2 o efektivním taktu 1,4 GHz, což by mělo při 4096bitové sběrnici dávat propustnost 720 GB/s. Kapacita pamětí je 16 GB. TDP grafiky je 235 W, tedy o něco málo nižší, než u 250W modelu P6000.
Karta má zcela klasické provedení pro osazení do grafických stanic: dvouslotový chladič s radiálním ventilátorem, který je převzat z generace grafik Maxwell, nemá tedy ostrý „kubistický design“ Pascalovských GeForce. Na záslepce jsou pak konvenční video výstupy – jedno digitální DVI a čtveřice DisplayPortů 1.4.
NVLink na desktopové kartě – místo konektorů SLI
Co je na tomto modelu velmi zajímavé, je využití speciální propojovací logiky NVLink, která slouží k přímé komunikaci jednotlivých GPU (v serverech s architekturou IBM Power pak i k propojení s CPU). Nvidia tato rozhraní na Quadru GP100 vyvedla ven na hřbet karty tam, kde jsou normálně konektory pro SLI. Karta má dva tyto konektory a pomocí speciálních můstků můžete dvě Quadra GP100 spárovat. Mělo by to přinášet výhodu komunikace s nízkou latencí a rychlejšího sdílení obsahu pamětí obou GPU. Fotografie dvou Quader spojených s můstkem asi nejen mě vnukává myšlenku, zda Nvidia v budoucnu nezačne NVLink používat i pro propojení herních grafik GeForce.
Quadro GP100 má jít na trh v březnu. Cena údajně ještě není přesně rozhodnuta a Nvidia ji u profesionálních grafiky běžně ani neuvádí. Karta má však být dražší než Quadro P6000, které stojí okolo pěti tisíc dolarů (v přepočtu momentálně okolo 153 000 Kč).
Nové profi grafiky s čipy GP104, GP106 a GP107
Nvidia zároveň s tímto těžkotonážním highendem aktualizovala i nabídku nižších modelů grafických karet pro profi segment a pracovní stanice, do kterých se tím pádem také dostávají 16nm čipy generace Pascal. Nová architektura by tak už měla krýt celý rozsah modelů Quadro.
Quadro P6000 a P5000 už Nvidia má, nyní k nim přibude Quadro P4000, které má ořezaný čip GP104. Aktivních je v něm jen 1792 shaderů z 2560, což při taktu Boostu okolo 1480 MHz dává výkon 5,3 TFLOPS v FP32. Karta má 8 GB paměti GDDR5 na 256bitové sběrnici, jednoslotové chlazení a TDP 105 W. Poté následuje model Quadro P2000, což je pro změnu GP106 ořezané na 1024 shaderů, s výkonem okolo 3,0 TFLOPS při taktu 1470 MHz. Karta má poměrně kuriózní kapacitu paměti 5 GB na 160bitové sběrnici (jeden z šesti 32bitových kanálů řadiče je nevyužit) a TDP 75 W.
Ještě o kus níž (nicméně jako profesionální GPU budou ceny pořád relativně vysoké) má Nvidia tři nové modely založené na 14nm čipu GP107 z GeForce GTX 1050/1050 Ti a používající nízkoprofilové provedení. Quadro P1000 má čip ořezaný na 640 stream procesorů (výkon má být 1,8 TFLOPS při až 1400 MHz), TDP 47 W a 4 GB paměti. Quadro P600 má GPU okleštěno jen na 384 shaderů (1,1 TFLOPS), 2GB paměti GDDR5 a TDP 40 W. A konečně nejlevnější Quadro P400 si zachovalo dokonce jen 256 shaderů, což je třetina čipu. Výkon je udáván 0,6 TFLOPS (takt okolo 1170 MHz), paměti jsou opět 2GB a tato karta má mít TDP jen 30 W.
Také tyto grafiky by měly být dostupné během března. Podle Nvidie by jejich ceny měly být podobné, jako u předchůdců generace Maxwell, které budou těmito 16 a 14nm kartami nahrazeni.