DirectX 12 Ultimate a DLSS 2.0: proč chtít grafickou kartu GeForce RTX

24. 7. 2020

Sdílet

 Autor: Aorus.com

V posledních dvou letech se ve hrách rozšiřují technologie ray tracingové grafiky, které jako první přinesla v roce 2018 generace grafických karet GeForce RTX 2000 s architekturou Turing. Ty ale současně obsahují i další nové technologie a když letos Microsoft uvedl DirectX 12 Ultimate, novou verzi nejrozšířenějšího API pro herní grafiku, staly se tyto speciální technologie jeho součástí. Znamená to, že se v budoucích hrách budou objevovat čím dál častěji a hráči s grafikami GeForce RTX budou díky nim mít výhodu lepšího výkonu a kvality.

Co vlastně DirectX 12 Ultimate přináší?

Nejzásadnější, ale ne jedinou novinkou je to, že tato verze DirectX poprvé zahrnuje jako povinnou součást ray tracingové efekty nebo i celkové vykreslování obrazu touto metodou. Grafiky GeForce RTX 2000 podporují tzv DirectX Ray Tracing jako první už od uvedení a v rámci DirectX 12 Utimate již mají i jeho vylepšenou verzi DXR 1.1.

Ray tracing (DXR): dokonalejší metoda grafiky pro hry

Ray tracing je pokročilejší technika vykreslování proti tradičnímu postupu, tzv. rasterizaci. Ray tracing simuluje reálné chování světla na scéně, kdy analyzuje zpětně paprsky dopadající do pomysleného oka hráče („kamery“) a vypočítává jejich odrazy až k světelným zdrojům, které je vyslaly. Tato metoda dovoluje obecně realističtější grafiku než méně fyzikálně věrná rasterizace.

Zejména ale ray tracing řeší některé problematické efekty, které jsou rasterizací jen velmi těžko zvládnutelné. Jsou to právě efekty světla. Jakékoli stíny a realistické globální osvětlení se implementuje jen velmi těžko a pomocí různých triků. Z povahy svého fungování ale ray tracing stíny a správné úrovně iluminace vykresluje přímo sám od sebe, takže scéna vypočítaná kompletně tímto způsobem je velkým pokrokem ve fotorealističnosti hry. Proto se také ray tracing využívá ve filmech nebo pro profesionální vizualizace.

DirectX 12 Ultimate DXR11 DXR 1.1 v DirectX 12 Ultimate (Zdroj: Nvidia)

Vedle realistického osvětlení včetně třeba efektu zářícího ohně, explozí či zášlehů od zbraní viditelných na okolních objektech ray tracing dovoluje realisticky podat odrazy v zrcadle a podobných površích, kdy odražený předmět skutečně věrně kopíruje svůj zdroj a odraz může být komplexní, včetně třeba odrazu celé scény. Toto je u rasterizace prakticky nemožné vyrobit, takže odrazy bývaly ve hrách dosud jen málo kvalitní a při pohybu bylo patrné, že nekopírují pohyb objektů správně.

Ray tracingové efekty pomocí DXR na kartách GeForce RTX konečně umožnily odrazy dělat velmi atraktivně, jak ukázala například první implementace v Battlefieldu V, která byla svého druhu demem toho, co DXR do her přináší.

Efekt, kdy se plameny zrcadlí nebo zabarvují okolní objekty, je bez ray tracingu těžko dosažitelný

Protože ray tracing je výpočetně mnohem náročnější, potřebuje speciální akceleraci, kterou právě poskytují karty GeForce RTX díky integrování tzv. RT jader v GPU Turing. RT jádra akcelerují analýzu paprsků světla, takže poprvé dovolují ray tracingové efekty ve hře vypočítávat v reálném čase. V budoucnu by měla být tato technika používána čím dál víc a z DXR se stane základ pro next-gen herní grafiku, kdy výkon jednotek pro ray tracingové efekty dost možná bude představovat i nejdůležitější výkonnostní měřítko.

cyberpunk 2077 night city wire june 2020 nvidia geforce rtx exclusive screenshot 001 Ray tracing v očekávané pecce letošního roku Cyberpunk 2077

Momentálně je sice možné emulovat výpočet raytracingových efektech na GPU bez RT jader (GeForce GTX), ale výkon je několikanásobně nižší než s akcelerací, takže touto cestou dlouhodobě cesta nevede. V praxi tak GPU schopná akcelerace ray tracingu tak ve hrách dovolí efekty, které na ostatních GPU budou muset být vypnuté. Pro maximální požitek proto bude nutné mít GPU podporující technologie DirectX 12 Ultimate (a mezi nimi DXR).

Nové hardwarové funkce zahrnuté pod DirectX 12 Ultimate ovšem přináší podstatná zlepšení i pro hry, které raytracing nevyužívají. Jsou to nové technologie Variable Rate Shading, Mesh Shaders a Sampler Feedback, které zvyšují výkon i v tradičních hrách bez ray tracingu. GeForce RTX 2000 jsou opět první GPU, které tyto technologie již v hardwaru podporují od svého vydání.

AORUS GeForce RTX 2080 SUPER 8GDirectX 12 Ultimate, ray tracing DXR 1.1 a DLSS 2.0 nabízí grafická karta AORUS GeForce RTX 2080 SUPER 8G (CZC.cz, Alza.cz)

Použité je léty osvědčené a vylepšované tiché chlazení WINDFORCE 3x. Prostřední ventilátor se otáčí v protisměru oproti zbylým dvěma, což zajišťuje lepší průtok vzduchu při nižší hlučnosti.
Model má 3072 Cuda jader s taktem 1860 zvýšeným proti referenčním 1815 MHz a 8 GB paměti GDDR6 na taktu 15,5 GHz. Karta poskytuje rovnou 7 video výstupů a 12+2fázové napájení.

Variable Rate Shading: víc výkon z hardwaru

Již používaná ve hrách je technologie Variable Rate Shading. Ta umožňuje získat vyšší výkon se stejným počtem hardwarových jednotek díky inteligentnímu nastavení kvality shadingu. Místo toho, aby se efekty počítaly standardně pro každý pixel, je s technologií Variable Rate Shading možné přizpůsobit kvalitu povaze scény a tam, kde to nevadí (například v jednolitých plochách, v neostrých nebo vzdálených objektech), aplikovat shadery místo na každý pixel s redukovaným rozlišením – na 2×2, 2×1 nebo 2×4 či 4×4 pixely. Při použití této redukce rozlišení na takové oblasti, kde je výsledek stejný při vysokém i sníženém rozlišení, se uspoří výkon při zachování obrazové kvality.

Variable rate shading dokáže měnit kvalitu shaderů po jednotlivých blocích obrazu

Rozhodnutí, které části obrazu je možné zpracovat s redukovaným rozlišením, může záviset na jejich vizuální povaze (pak se hovoří o Context Adaptive Shadingu), nebo také na tom, zda se pohybují či stojí (Motion Adaptive Shading). V druhém případě se využívá toho, že lidské vidění neregistruje sníženou kvalitu na pohybujících se objektech, takže snížení jejích kvality je bez dopadu na vizuální vjem.

V obou případech ušetřený výkon shaderů pak znamená vyšší snímkovou frekvenci hry, nebo možnost v citlivých oblastech použít více výkonu pro lepší vzhled. Hry využívající tuto novinku tedy na grafikách podporujících DirectX 12 Ultimate poběží s lepším výkonem než na kartách bez podpory.

Mesh Shading

Podobný efekt dosahuje také technologie Mesh Shaders, která ovšem má složitější charakter. V jejím případě jde také o to, dostat z přítomných hardwarových jednotek více výkonu inteligentnějším využitím jejich potenciálu. Ovšem místo shaderů se zaměřuje na také kritický geometrický výkon. Mesh Shading je vlastně nový pokročilejší a mocnější způsob zpracování geometrie scény – tedy objektů, polygonů, jejich teselace a překrývání, kdy je možné část objektů nezpracovávat.

Díky pokročilejšímu plně programovatelnému způsobu mohou hry, které Mesh Shading využívají, vykreslit na scéně mnohem více objektů, než narazí na limity výkonu. Toto znamená bohatší scénu hlavně v exteriérech a volných prostorech – například ve vesmírném simulátoru zobrazení až stovek tisíc objektů, jako jsou asteroidy . Bez této technologie by musel být počet objektů na scéně výrazně snížen, protože by zpracování geometrie nestíhalo.

Sampler Feedback a Texture-space shading

DirectX 12 Ultimate funkce podporované grafikami GeForce RTX zahrnují také technologii Sampler Feedback, která podobně zefektivňuje práci s texturami. Poskytuje enginu hry zpětnou vazbu o využití textur ve hře, což dovoluje pracovat s vyšším množstvím rozličných textur a zkvalitnit tak grafické podání hry.

Součástí je i technika Texture-space shading, kterou lze opět využít pro zvýšení výkonu ve hře. Spočívá v tom, že grafika může provést výpočet určitých efektů nikoliv jen pro konkrétní zobrazený objekt, ale udělat z nich jakýsi polotovar tím, že je vykreslí do textury uložené v paměti. Pokud se na scéně nějaký objekt opakuje (třeba i v různém čase), pak je možné výpočty zopakovat prostě tím, že se na objekt aplikuje připravená textura, aniž by bylo třeba znovu zaměstnávat výpočetní jednotky.

Nvidia DirectX 12 Ultimate Sampler Feedback Sampler Feedback v DirectX 12 Ultimate (Zdroj: Nvidia)

Použití této techniky tedy můžu ušetřit hodně výkonu, čímž se buď zvýší snímková frekvence, nebo se získá prostor pro další efekty či objekty na scéně navíc, nemožné bez této optimalizace. Kart podporující DirectX Ultimate při využití této techniky opět budou mít výhodu.

GeForce RTX 2070 SUPER WINDFORCE OC 3X 8GDirectX 12 Ultimate, ray tracing DXR 1.1 a DLSS 2.0 nabízí grafická karta Gigabyte GeForce RTX 2070 SUPER WINDFORCE OC 3X 8G (CZC.cz, Alza.cz)

Grafika je opatřená léty osvědčeným tichým chlazením WINDFORCE 3x, jehož prostřední ventilátor se otáčí v protisměru oproti zbylým dvěma, což zajišťuje lepší průtok vzduchu při nižší hlučnosti.
Model má 2560 Cuda jader s taktem 1785 zvýšeným proti referenčním 1770 MHz a 8 GB paměti GDDR6 na taktu 14 GHz.

DLSS: desítky procent FPS navíc

GPU řady GeForce RTX ovšem hráčům vedle DirectX 12 Ultimate přinášejí ještě jinou možnost, jak dosáhnout vysokého výkonu: technologii DLSS 2.0, která využívá speciální jednotky pro akceleraci AI v GPU Nvidia k pokročilému inteligentnímu upscalingu kombinovanému s vyhlazováním. Při použití DLSS hry dosahují o desítky procent (v některých případech až o 75 % vyšší) snímkovou frekvenci – výkon je totiž jako při hraní na nižším rozlišení, ale díky použití tensor jader v GPU k postprocessingu je kvalita obrazu vyšší – blízká či srovnatelná vyššímu rozlišení, v některých případech může díky vyhlazování být i lepší.

Asi víte, že když se vaší grafice nedostává výkonu, je řešením snížit rozlišení a FPS tím díky nižší náročnosti skočí nahoru. DLSS přináší díky internímu zpracování na nižším rozlišení podobný efekt, ale rozdíl je, že negativní dopad na vizuální kvalitu je výrazně eliminovaný.

DLSS 2.0: desítky procent FPS navíc

GPU řady GeForce RTX ovšem hráčům vedle DirectX 12 Ultimate přinášejí ještě jinou možnost, jak dosáhnout vysokého výkonu: technologii DLSS 2.0 založenou na umělé inteligenci, která využívá speciální jednotky pro akceleraci AI v GPU Nvidia k pokročilému inteligentnímu upscalingu kombinovanému s vyhlazováním. Při použití DLSS hry dosahují o desítky procent (v některých případech až o 75 % vyšší) snímkovou frekvenci – výkon je totiž jako při hraní na nižším rozlišení, ale díky použití tensor jader v GPU k postprocessingu je kvalita obrazu vyšší – blízká či srovnatelná vyššímu rozlišení, v některých případech může díky vyhlazování být i lepší.

Asi víte, že když se vaší grafice nedostává výkonu, je řešením snížit rozlišení a FPS tím díky nižší náročnosti skočí nahoru. DLSS přináší díky internímu zpracování na nižším rozlišení podobný efekt, ale rozdíl je, že negativní dopad na vizuální kvalitu je výrazně eliminovaný.

Na rozdíl od běžného upscalingu provádí zvětšení snímků neuronová síť umělé inteligence. Ta je trénovaná na obrovském korpusu snímků z her, aby ze snímků s nízkým rozlišením produkovala obraz, který se co nejvíce blíží ekvivalentním snímkům ve vysokém rozlišení (16K) s nejkvalitnějším vyhlazením. Po dlouhém trénování síť získává schopnost vyšší kvalitu aproximovat, takže při hraní produkuje z nízkého rozlišení výstup o vyšší kvalitě.

Od letošního roku má DLSS novou generaci DLSS 2.0, která přináší velká vylepšení. Neuronová síť je nově trénovaná univerzálně pro všechny hry, takže už odpadá trénování samostatně pro každou novou hru, které bylo nutné u DLSS první generace. Díky tomuto budou hráči moci DLSS 2.0 využít ve více hrách než dříve, jelikož vývojáře bude přidání této možnosti stát jen malé úsilí navíc. Současně je tato nová verze dvakrát výkonnější a lépe škáluje na všech grafikách GeForce RTX, což umožňuje pružnější výběr rozlišení ve hrách.

Pro hráče možná nejužitečnější změna je, že se DLSS 2.0 dá nově nastavit na tři různé úrovně výkonu, zatímco dříve měla jediný režim. Jsou podporovány tři režimy – Kvalita, Rovnováha a Výkon – kde první má nejkvalitnější obraz a třetí zase nejvíce zvyšuje snímkovou frekvenci. Režim výkon používá 4× zvýšení rozlišení, takže dovoluje hrát například na 4K monitoru, zatímco GPU interně zpracovává jen FullHD.

deliver us the moon nvidia dlss 2 0 performance boost Nvidia DLSS 2.0 v Deliver Us The Moon: zvýšení FPS v režimu Kvalita

Temporální stabilizace pro lepší kvalitu

Zásadní novinkou pod kapotou je, že DLSS 2.0 využívá data z více snímků jdoucích po sobě a využívá tím jejich temporální redundanci. Pomocí pohybových vektorů z enginu gry (technika kompenzace pohybu) DLSS 2.0 dokáže filtrovat pixely objektů mezi jednotlivými snímky a obnovit tak detail, který se při vykreslování na nižším rozlišení ztratil.

Toto temporální filtrování zároveň stabilizuje obraz a předchází artefaktům známým jak shimmering. Vedle spatiálního vyhlazení odstraňujícího aliasing, který již zajišťuje samotné upscalování pomocí neuronové sítě, dodává temporální stabilizace navíc i vyhlazení pohybu. Díky této kombinaci může být obrazová kvalita dokonce vylepšená proti nativnímu rozlišení bez temporálního vyhlazování.

nvidia dlss 2 0 architecture Temporální stabilizace v DLSS 2.0

Výkon navíc pro vyšší rozlišení, FPS nebo víc ray tracingu

Kombinace těchto technologií v DLSS 2.0 dovoluje hrát hry na mnohem vyšších rozlišeních při zachování hratelných snímkových frekvencí, než co by bylo možné při klasickém vykreslování na nativním rozlišení. Nebo hráč alternativně může se stejně výkonnou kartou a stejným rozlišením hrát na mnohem vyšších FPS, například má li 144Hz nebo 240Hz monitor.

Díky využití DLSS je ale také možné mít ve hře aplikované efekty ray tracingu s vyšší kvalitou, kterou by GPU přímo na nativním rozlišení neutáhlo. DLSS tak může být ideální doplněk pro hraní s efekty DXR 1.1.

GeForce RTX 2060 SUPER WINDFORCE OC 8GDirectX 12 Ultimate, ray tracing DXR 1.1 a DLSS 2.0 nabízí grafická karta Gigabyte GeForce RTX 2060 SUPER WINDFORCE OC 8G (CZC.cz, Alza.cz)

Použité je léty osvědčené a vylepšované tiché chlazení WINDFORCE 2x. Ventilátory se otáčí v protisměru oproti sobě, což zajišťuje lepší průtok vzduchu při nižší hlučnosti.
Model má 2176 Cuda jader s taktem 1680 zvýšeným proti referenčním 1650 MHz a 8 GB paměti GDDR6 na taktu 14 GHz.

Technologie grafických karet Nvidia ve stále se zvětšujícím množství her

Technologie DirectX 12 Ultimate jako ray tracing, ale také DLSS 2.0 coby speciální technologie grafik GeForce RTX teď bude přítomná v čím dál větším počtu nadcházejících her. V průběhu letošního roku už vyšle patch přidávající DLSS 2.0 do kriticky cenění hry Control, kde byla tímto ještě vylepšené stabilizace pohybu.

DLSS 2.0 je také od svého uvedení dostupné ve hře MechWarrior 5: Mercenaries a ve hře Deliver Us The Moon. V těchto titulech technologie DLSS 2.0 v režimu Výkon dokáže zvýšit FPS až o 60–75 %, umožňujíc tak hraní v rozlišení 4K.

DLSS 2.0 je také podporováno ve hře Minecraft s ray tracingovými efekty, kde dodává výkon potřebný k této náročné grafice.

Integrace v Unreal Engine znamená více her s DLSS 2.0

Technologii DLSS 2.0 se také podařil důležitý úspěch, když ji integroval Unreal Engine 4. Ten slouží jako základ pro množství her, jejichž vývojáři tak budou moci snadno DLSS 2.0 integrovat do svých titulů. Protože její druhá generace zároveň nevyžaduje specifické trénování pro danou hru a je mnohem jednodušší ji do programu integrovat, najde si tato novinka cestu do výrazně vyššího počtu přicházejících her a vlastníci grafik GeForce RTX budou mít čím dál častěji možnost tuto funkcionalitu využít.

Nejnověji pak přichází DLSS 2.0 v také velmi ceněné hře Death Stranding od Hideo Kojimy, jejíž verze pro PC vyšla teď 14. července. Díky této technologii je hra schopná běžet ve výsledném rozlišení 2560 × 1440 s více než 100 FPS a rozlišení 4K mohou hráči používat s plynulou frekvencí přes 60 snímků za sekundu, s maximálními nastaveními kvality.

DLSS 2.0 bude i v další netrpělivě očekávané hře Cyberpunk 2077, která má vyjít v listopadu a půjde nejspíš jeden z nejdůležitějších titulů letoška. Tento titul byl vyvíjen v partnerství s Nvidií a dostal čtyři typ ray tracingových efektů: dynamické osvětlení, odrazy světla/obrazu na površích a také realistické stíny a efekt Ambient Occulusion, vše používající techniku ray tracingu.

ICTS24

Pro zachování dostatečného výkonu s těmito efekty bude Cyberpunk 2077 také mít integrovanou technologii DLSS 2.0, takže uživatelé s kartami GeForce RTX budou moci tento potenciál využít.