Nvidia oficiálně odhalila GPU Turing. Obří 12nm čip, GDDR6, ray tracingové jednotky

14. 8. 2018

Sdílet

 Autor: Redakce

Velké odhalení nové generace grafických karet Nvidie jsme čekali až 20. srpna dle této zprávy, ale je tu překvapení. Nová architektura totiž nebyla představena v rámci herních grafik GeForce, ale v rámci profi řady Quadro. A k tomu se šéfovi Nvidie Jen-Hsun Huangovi hodila konference Siggraph, která se právě nyní koná. Poprvé na ní prezentoval architekturu Turing, první karty, které na ní budou založené, a horké novinky této nové generace GPU. Nová architektura se opravdu jmenuje Turing, což je nyní už definitivně potvrzeno. Jak brzo uvidíte z architektonických podrobností, Turing do značné míry vychází z architektury Volta, pravděpodobně představuje její přímou evoluci. Jak široká bude rodina těchto GPU, zatím není jasné, takže nevíme, jak velkou část karet GeForce pokryje. Siggraph zatím odhalil jen jedno konkrétní highendové. Ale to ještě nemusí znamenat, v rodině Turingů nebude víc i menších a levnějších čipů.

Turing je 12nm

Jméno či označení čipu zatím nemáme, ale tento dejme tomu „Turing 1“ má plochu 754 mm² a obsahuje 18,6 miliardy tranzistorů. Pokud to srovnáme s čísly pro čip Volta GV100 (815 mm² a 21,1 miliardy tranzistorů), vychází z toho ani ne o 5 % vyšší hustota tranzistorů, na základě čehož je asi třeba udělat závěr, že toto GPU používá stále 12nm výrobní proces. Jedna z hlavních otázek je tedy asi rozřešena.

Parametry křemíku GPU Turing. 14 GHz je zřejmě frekvence podporovaná řadiči paměti GDDR6 Parametry křemíku GPU Turing. 14 GHz je frekvence podporovaná řadiči paměti GDDR6

4608 shaderů, 16 TFLOPS

Čip má dosahovat – alespoň v konfiguraci, která půjde na trh v rámci řady Quadro, o níž se tu bavíme – teoretický výkon 16 TFLOPS ve výpočtech se standardní přesností FP32, což je více, než u Volty (GV100), pro níž se uvádí 15 TFLOPS. Mělo by to být při 4608 stream procesorech, ale nevíme, zda je toto plný počet fyzicky přítomný na čipu. Pro tuto úroveň výkonu by frekvence měla být 1,7 GHz, pokud tedy číslo není nějak výrazně zaokrouhlené dolů, pak by musela být ještě o to vyšší. Pro srovnání, GeForce GTX 1080 Ti má teoretický výkon 11,3 TFLOPS, tato novinka by proti ní tedy čistě v hrubém FP výkonu měla mít náskok minimálně 40 %.

Takto má čip Turing vypadat Takto má čip Turing vypadat. Pokud je reálný, pak by 4608 shaderů mohlo být plné množství fyzicky přítomné na čipu

Architektura shaderů má podporovat tzv. „Variable Rate Shading“, což by snad mělo znamenat, že bude možné zpracovávat výpočty s nižší přesností s vyšším výkonem. FP16 poběží dvojnásobně rychle, jako je to na architektuře Vega od AMD. Výkon ve FP16 by pak byl 32 TFLOPS. Zároveň je však přejatý také prvek architektury Volta, kdy mají shadery vedle ALU pro floating-point výpočty zároveň separátní jednotku ALU pro celočíselné operace, přičemž obojí může být aktivní naráz. Nvidia tedy uvádí, že výkon je 16 TFLOPS + 16 „TIPS“ (tera integerových operací za sekundu).

Tensor Cores od Volty

Od Volty Turing přejímá také technologii tensor cores, tedy speciálních bloků zpracovávajících maticové operace pro strojové učení (jde o akcelerátor podobný speciálním ASICům pro AI). Tensor jader by mělo být na čipu 576, tedy jedno na osm stream procesorů (pro konfiguraci se 4608 shadery). Jejich celkový výkon v AI výpočtech je teoreticky až 125 TFLOPS (FP16), ale dokáží zároveň počítat i v osmibitových celočíselných hodnotách INT8 (250 TOPS) nebo dokonce čtyřbitových INT4 (až 500 TOPS). Datové typy s takto redukovanou přesností jsou jednou z cest, jak zvýšit výkon neuronových sítí a plánují je aplikovat i další hráči v oboru, takže toto by mělo být docela důležité. Pro herní využití asi na tensor cores záleží o dost méně. Ale teoreticky by se mohla uplatnit třeba v anti-aliasingu používajícím interpolaci pomocí neuronových sítí.

Ray tracing je tady: RT jádra

To nejlepší jsem si ovšem nechal nakonec. V Turingu nebudou vedle klasických shaderů (o ovšem i texturovacích a rasterizačních jednotek) jen Tensor Cores z Volty. Nově tato architektura přidává hardwarovou podporu pro Ray Tracingovou grafiku (která se nyní pomalu chystá do DirectX). A ray tracing mají údajně také počítat separátní výpočetní RT jádra, uzpůsobená zcela pro tyto operace. I když co přesně to znamená a jaká je jejich povaha, nebylo nijak blíže vysvětleno.

Nvidia ale každopádně tvrdí, že GPU Turing dokáže s těmito jednotkami zpracovávat 10 miliard paprsků za sekundu. Údajně by to měl být výkon 25× lepší než na Pascalu. Ale těžko teď říct, zda je to realistické srovnání, nebo do něj nějak zasahuje magie marketingu (podceněním výkonu dosažitelného běžnými GPU výpočty). Ray tracingový hardware má být kompatibilní s DXR (DirectX ray tracing) a také Vulkanem, který by asi také tedy měl mít ray tracingové rozšíření.

Project Pica Pica, demo DirectX Raytracingu od SEED Project Pica Pica, demo DirectX Raytracingu od SEED

Na bázi této podpory pro ray tracing tedy grafiky ponesou ono nové jméno GeForce RTX a Quadro RTX. Podle Nvidie má ray tracing přinést zcela nové možnosti a kvalitu. Ovšem vzhledem k tomu, že bude vyžadovat kompletně nové enginy, metody vykreslování a vše okolo, je dost otázka, jak rychle se taková revoluce ve hrách může udát. Ze začátku bude mít grafiky s podporou ray tracingu jen malé množství uživatelů, takže vývojáři budou podobně jako u VR brýlí omezeni omezenou velikostí potenciálního trhu.

Slajd s popisem čipu Turing (Zdroj: VideoCardz) Slajd s popisem čipu Turing (Zdroj: VideoCardz)

384bitová sběrnice s GDDR6

Co o GPU Turing dále víme? Má mít 384bitovou paměťovou sběrnici a paměti GDDR6. V tiskových materiálech Nvidia uvádí, že Turing jako první používá až 16GHz paměti GDDR6, ale podle slajdů je propustnost pamětí pro toto GPU 672 GB/s. To by znamenalo, že frekvence je nižší, 14,0 GHz efektivně. Paměťový subsystém dále obnáší 6MB L3 cache. První specifikace mluví jen o PCI Express 3.0, takže pokud už GPU mají podporovat i verzi 4.0, zatím to firma tají.

Turing dále obsahuje konektivitu NVLink s propustností až 100 GB/s pro propojení více GPU. Hardwarový dekodér má být schopen enkódování 8K videa ve formátu HEVC v reálném čase (tedy asi minimálně 24–30 FPS) a také máme potvrzeno, že je podporováno nové rozhraní pro VR brýle VirtualLink a tím i video výstup USB-C. Spotřeba není zatím známá. Jen-Hsun Huang ukazoval na Siggraphu kartu, který měla dva napájecí konektory a dvouslotový chladič s jedním radiálním ventilátorem. Asi by tedy patřila do TDP kategorie modelů jako GTX 1080 Ti nebo Titan Xp.

Jen-Hsun Huang s kartou s GPU Turing na Siggraphu Jen-Hsun Huang s kartou s GPU Turing na Siggraphu (Zdroj: VideoCardz)

Karty: zatím jenom Quadro

Nvida oznámila první tři grafiky Quadro RTX, které budou čipy Turing používat: modely Quadro RTX 5000, RTX 6000 a RTX 8000. O jejich podobě toho nevíme mnoho. Quadro RTX 6000 má mít oněch 4608 stream procesorů a 24 GB paměti GDDR6, Nvidia pro něj uvádí výkon 10 giga paprsků za vteřinu v ray tracingu, který byl udán i pro samotné GPU. Koncová cena této grafiky bude podle Nvidie 6300 dolarů (172 tisíc korun). Quadro RTX 8000 má mít stejný výkon a stejný počet jednotek, ale liší se tím, že má dvojnásobek paměti, 48 GB GDDR6. A jeho cena bude ještě pevněji v kategorii osobních aut. Údajně má stát 10 000 $ (273 tisíc korun).

nvidia-quadro-rtx-5000-turingVedle těchto dvou bude ale uvedena ještě i o něco levnější grafika Quadro RTX 5000 za 2300 $ (63 tisíc korun). Ta má obsahovat 3072 shaderů, jen 384 tensor jader a dosahovat výkonu jen 6 giga paprsků za sekundu. Hrubý výpočetní výkon by asi mohl být 9–10 TFLOPS. Tato karta také bude mít jen 256bitovou paměťovou sběrnici a 16 GB paměti GDDR6 (propustnost 512 GB/s). Teoreticky by už asi při těchto parametrech mohlo jít o další, menší čip Turing.

nvidia-quadro-rtx-turing-modely

bitcoin školení listopad 24

Kdy bude v obchodech?

Tato Quadra mají podle Nvidie být reálně dostupná až v čtvrtém kvartálu roku. To ovšem neznamená, že se tato GPU neobjeví dříve. Jde totiž o termín pro grafiky Quadro, které většinou jdou na trh později než herní GeForce. Pokud tedy Nvidia chystá i herní Turingy, pak by se s nimi mohla vytasit dřív. Třeba už během pár týdnů, jak se teď spekulovalo či tradovalo.

nvidia-quadro-rtx-6000-turingOtázka je, zda se do herních karet, jak je dnes chápeme, dostane onen velký čip s 4608 stream procesory. Toto GPU by nemělo být až tak drahé, jako GV100 používající HBM2 a křemíkový interposer. Ovšem stále bude nákladné kvůli své enormní ploše, dříve se i nejhighendovější čipy držely mezi 550–600 mm². Takže se zdá nejisté, zda by se tento čip mohl objevit v kartách stojících okolo 600–700 $, což je dnes běžné pro highend. Ono hypotetické druhé GPU s 256bitovou sběrnicí z Quadra RTX 5000 ale už zní dost reálně. Na druhou stranu větší čip by se také mohl do karet GeForce dostat, ale třeba s vyšší cenou. Ať už by to bylo 1200 $ jako za Titan Xp, nebo míň.