Specifikace Titanu X jsme zde měli už předevčírem a podle všeho se na nich nic nezměnilo – GPU GM200 má 3072 stream procesorů na taktu 1002 MHz. Ačkoliv někteří výrobci uvádějí takt boostu 1089 MHz, přímo v oficiálních specifikacích stojí 1075 MHz, takže počítejte raději s touto hodnotou. Čip o výměře 602 mm² má mít údajně 8 miliard tranzistorů a podle Nvidie jde o zatím nejvýkonnější GPU vůbec. Tedy s jednou výjimkou. Hrubý výkon v jednoduché přesnosti (FP32) je sice 7 TFLOPS, ale potvrdila se bohužel zvěst ze začátku roku a GPU GM200 skutečně nemá výbavu pro rychlé výpočty s dvojitou přesností (FP64). Při těch se výkon propadá jen na 0,2 TFLOPS, tedy hluboko pod GPU s plnohodnotným FP64 jako je GK110, Tahiti nebo Hawaii. Propad výkonu je zřejmě na 1/32 stejně jako u GM107 a GM204).
CEO Nvidie uvádí Titan X na GTC 2015. Čip GM200 je podle Nvidie nejrychlejší GPU světa, postrádá ale výkon v FP64
Jak už jsme věděli, Titan X bude mít 12 GB paměti GDDR5 na taktu 7,0 GHz a s 384bitovou paměťovou sběrnicí. TDP je 250 W, platí také, že se karta bude napájet pomocí osmipinu a šestipinu a nabídne stejné výstupy jako GTX 980: HDMI 2.0, DVI a tři DisplayPorty 1.2. Zdá se, že budou opět existovat jen referenční karty s již dobře známým chladičem. Ovšem na trh by zřejmě měly přijít kompatibilní vodní bloky od EK Waterblocks a měla by také existovat karta v provedení Hydro Copper od Evga.
Karta samotná nakonec bude stát přesně totéž, co předchozí jednočipové Titany: 999 USD. Mimochodem – přímo na prezentaci se údajně Jen-Hsun Huang vyjádřil v tom duchu, že si tuto sumu na sebe vydělá za jedno odpoledne. (No neberte to, když je to skoro zadarmo.) Podle aktuálního kurzu by toto odpoledne u nás mělo vycházet na minimálně 31 000 CZK, podle vyhledávačů cen ale ještě Titany X v tuzemských cenících nejsou. Dle Nvidie by nicméně karty už měly být fyzicky dostupné.
Pascal s HBM v roce 2016, Volta 2018. FP16 pro vyšší výkon
Jelikož o Titanu X bylo (až na potvrzení pomalého FP64) už předem známo vše, jsou pro nás na vystoupení Nvidie zajímavější informace o její roadmapě GPU. Do té se především vrací kódové jméno Volta, oznámené před dvěma lety, jež z ní ale loni zase vypadlo. Nyní už je Volta v plánech napevno zpátky – přijít má v roce 2018. Už na podzim se s ní však Nvidia chlubila v souvislosti se zakázkami na superpočítače, takže se úplně o překvapení nejedná. Volta je nicméně v plánu až druhá na řadě. Před ní přijde v roce 2016 architektura Pascal, takže po loňském Maxwellu bude zachován přibližně dvouletý interval mezi generačními výměnami.
Roadmapa GPU Nvidia z GTC 2015 (Zdroj: AnandTech)
Pascal byl oznámen na loňském GTC, takže částečně budeme rekapitulovat. GPU této architektury přinesou v příštím roce rozhraní Nvlink určené k přímé komunikaci GPU a CPU v systému – podporovat by jej výhledově měly procesory IBM Power. Potvrzen je také příchod „3D pamětí“, tedy RAM s velmi širokou sběrnicí a tedy také vysokou propustností, jež bude integrována přímo v pouzdře čipu. Ačkoliv z „grafů“ na slajdech asi není moc radno něco vyvozovat, zdá se, že pro Pascal počítá Nvidia s propustností okolo 700–750 GB/s.
Připomenu, že AMD zřejmě nasadí tento typ pamětí už letos v Radeonu R9 390X. Nvidia nejspíše také použije HBM od Hynixu, bohužel ale z prezentace není jasné, zda se ze začátku dostanou také na herní grafiky. Teoreticky by je Nvidia z počátku mohla vyhradit jen pro výpočetní Tesly, doufejme ale, že se tak nestane. V prezentaci padlo, že by karty s GPU Pascal mohly nést 32 GB paměti (řeč byla o 2,7× současné kapacity), to už ale asi skutečně bude případ Tesly či Quadra, maximálně pak řady Titan.
Takto by měl vypdat Pascal s HBM (kompaktní modul GPU pro sektor HPC)
Pascal má být údajně až dvakrát lepší co do poměru spotřeby a výkonu než Maxwell – do toho jsou ale nejspíše zahrnuty i pokroky na straně výrobního procesu. Dalším číslem, které Nvidia prozradila, je čtyřnásobný absolutní výpočetní výkon při použití takzvané „mixed precission“. Pod tímto označením se ale podle všeho neskrývá nic jiného, než výpočty s poloviční přesností, tedy jen 16 bitů (FP16), na něž se už Nvidia zaměřila u Tegry X1. Vtip je v tom, že výpočet s poloviční přesností je proti FP32 mnohem méně náročný, což také umožnilo ohlásit u Tegry X1 výkon 1 TFLOPS. Nicméně užitečnost této kapacity bude minimálně pro negrafické výpočty dost omezená, neboť přesnost FP16 je už docela problematická.
Nvidia nesdělila, do jakých segmentů trhu s architekturou Pascal počítá. Nicméně vzhledem k důrazu na výkon v FP16 se s ní určitě setkáme v budoucích Tegrách. V kartách GeForce a Quadro je asi použití dané. Vzhledem k přítomnosti technologie Nvlink by ale tato GPU měla mít zastoupení také ve výpočetních kartách a serverech. Nejspíš by tedy od Pascalu mělo existovat alespoň jedno GPU s vysokým výkonem v FP64, jaké nyní v generaci Maxwell chybí.