Unikly další detaily Turingu. 8K, lepší komprese paměti, GeForce RTX 2070 má čip TU106

12. 9. 2018

Sdílet

 Autor: Nvidia

V rámci novinek o přicházejících grafických kartách Nvidia GeForce RTX s čipy architektury Turing jsme tu už dnes měli zprávu o tom, že se mírně pozdrží jejich recenze, jelikož zdá se vázne zásobování médií vzorky hardwaru. Současně se na webu VideoCardz ale objevila ještě jedna věc, která stojí za pozornost. A to informace ze zatím nezveřejněné prezentace Turingu o nových vlastnostech této architektury a o čipech, z nichž budou karty GeForce RTX tvořené. V prezentaci se mluví o některých věcech, které už prosákly, nebo je Nvidia sama nakousla. Sem patří to, že Turingy budou podporovat připojení monitorů o rozlišení 8K při 60 Hz na rozhraní DisplayPort 1.4a. Ale stále to nejspíš bude potřebovat buď dva kabely nebo kompresi DSC kvůli přenosové kapacitě. Turing takovéto obrazovky utáhne dvě najednou. V rozlišení 8K má také GPU být schopno dekódovat nebo enkódovat video, enkodér má zvládnout dva 8K streamy v HEVC při 30 fps. Dekodér bude podporovat 8K ve formátech HEVC, H.264 (VP9 není úplně jasné). U VP9 a HEVC je podporována 10 a 12 bitová hloubka s HDR, u HEVC snad i vzorkování YUV 4:4:4.

Mesh shadery, variable rate shading

Pokud jde o výpočetní jednotky, hlavní změnou je unifikování L1 cache shaderů a přidání separátních ALU pro celočíselné operace, o čemž už také víme. Podle Nvidie prý nová celočíselná ALU může zvednou výkon floating point operací až o 36 % tím, že celočíselné operace přestanou zabírat primární FP jednotku v shaderu.

Schéma jednoho bloku SM se shadery, RT a tensor jádry u architektury Nvidia Turing (Zdroj: VideoCardz) Schéma jednoho bloku SM se shadery, RT a tensor jádry u architektury Nvidia Turing (Zdroj: VideoCardz)

Turing má podporovat nový model shaderového programu pojmenovaný Mesh shader, který bude fungovat na vertexech, teselaci i výpočtech geometrie (jako u geometry shaderů). Má to dovolit zpracovat více objektů na scéně. Zda jde o něco podobného jako o Primitive shader u GPU Vega, nebo něco jiného, zatím těžko soudit.

Už v první prezentaci Turingu se objevila zmínka o Variable Rate Shading. Tato technika je zřejmě koncepčně podobná foveated renderingu. Jde o funkci, s kterou vývojář hry může ovládat kvalitu/množství shader efektů, které se budou aplikovat v určité oblasti obrazu. Redukcí těchto výpočtů se ušetří výkon (za cenu horší kvality obrazu), což by se dalo využít třeba ve VR pro vykreslování periferních částí obrazu. S VR souvisí i další vylepšení – Multi-View Rendering (MVR). Toto umožňuje výstup více úhlů pohledu na vypočítávanou scénu v jednom průchodu. Jde o rozšíření techniky Single Pass Stereo u Pascalů na více jak dva pohledy.

PCB karty GeForce RTX 2080 s čipem TU104 (Zdroj: Chiphell) PCB karty GeForce RTX 2080 s čipem TU104 (Zdroj: Chiphell)

Turing má opět vylepšenou kompresi pamětí

GPU Maxwell a Pascal hodně těžila z barevné komprese dat v paměti. Je proto hodně zajímavé, že v Turingu má být tento aspekt ještě vylepšen. Lepší komprese v Turingu prý dokáže efektivně poskytnout jádrům až o 50 % více paměťové propustnosti (zřejmě se stejnou frekvencí a šířkou pamětí) než na Pascalu. Toto číslo by ale asi mohlo být výsledkem ve speciálních případech, kdy jsou barevný data pixelů příhodně komprimovatelná. U Pascalu už totiž byla komprese hodně dobrá a tím pádem by logicky mělo být těžké kompresní poměr dál dramaticky zvyšovat. Jde o bezeztrátovou kompresi, takže její účinnost má také určité „fyzikální“ limity. Asi bychom tedy měli čekat, že průměrné zlepšení pravděpodobně bude nižší než těch 50 %.

Pro pořádek připomeňme, že bezeztrátová komprese se týká dat ve framebufferu, tedy barev pixelů, s nimiž GPU pracuje. Textury uložené v paměti jsou oproti tomu předem komprimované ztrátovými algoritmy a tato bezeztrátová komprese na ně už tedy aplikována není. Podobně by komprese neměla ovlivňovat obecné výpočty běžící na GPU.

Tři čipy: TU102, TU104 a TU106

VideoCardz odhalil, že Nvidia přichystala minimálně tři čipy Turing. První dva už známe. TU102 je čip v GeForce RTX 2080 Ti, který má plochu 754 mm² a 18,6 miliardy tranzistorů. Obsahuje 4608 shaderů, 96 ROP, 288 texturovacích jednotek, 6MB L2 cache a 384bitovou sběrnici pamětí GDDR6. Čip má 576 tensor cores a 72 RT cores pro ray tracing, skládá se celkově z šesti GPC. GPU má mít dvě linky NVLink pro SLI, ale podporováno bude jen propojení dvou karet.

Schéma GPU Nvidia TU102 (Zdroj: VideoCardz) Schéma GPU Nvidia TU102 (Zdroj: VideoCardz)

Také TU104 se skládá z šesti GPC, ale v každém je o třetinu méně shaderů, celkem tedy 3072. Tensor jader je 384, RT jader 48, ROP 64 a texturovacích jednotek 192, sběrnice je 256bitová a L2 cache 4MB. Až na použití šesti GPC místo čtyř jde tedy skoro přesně o dvě třetiny čipu TU102. Plocha je s 13,6 miliardami tranzistorů 545 mm². Toto GPU má jen jednu linku NVLink pro SLI.

Schéma GPU Nvidia TU104 (Zdroj: VideoCardz) Schéma GPU Nvidia TU104 (Zdroj: VideoCardz)

Zcela nová informace je, že GeForce RTX 2070 nebude tvořena osekaným čipem TU104, ale vlastním GPU označeným TU106. To by implikovalo mainstream (GTX 960/1060), ale jde stále o hodně velký čip – s 10,6 miliardami tranzistorů zabírá 446 mm². Stále tak jde spíš o highendové GPU, čemuž ale ostatně odpovídá i cena karty GeForce RTX 2070. Je ještě třeba dodat, že v modelu RTX 2070 bude toto GPU neosekané v plné síle, na rozdíl od TU102/104 v kartách RTX 2080/2080 Ti. Na druhou stranu nebude mít vůbec konektivitu NVLink pro SLI.

bitcoin_skoleni

Schéma GPU Nvidia TU106 (Zdroj: VideoCardz) Schéma GPU Nvidia TU106 (Zdroj: VideoCardz)

TU106 obsahuje jen tři GPC a 2304 shaderů, 144 texturovacíh jednotek, 288 tensor cores a 36 RT cores. To z něj dělá do značné míry polovinu čipu TU102. Ovšem paměťový subsystém je stejný jako u GPU TU104 – 256bitová sběrnice, 64 ROP, 4MB L2 cache. Výkon mezi GeForce RTX 2070 a RTX 2080 proto asi nebude škálovat právě lineárně. Levnější model bude mít stejný či podobný výkon pamětí, ale výrazně méně hrubé síly. Všechna tři GPU jsou jinak vyráběna na procesu 12FFN, což by měla být stejná pro Nvidii optimalizovaná varianta 12nm procesu TSMC, jaká byla použita pro čipy Volta.

VideoCardz publikoval i schémata těchto čipů, která můžete vidět výš. Ta údajně ale nejsou přímo původní z prezentace. Byla zeditovaná, ale měla by prý sedět s tím, co publikuje Nvidia.