Hlavní navigace

Správný příklad, jak implementovat umělou inteligenci. Rozbor NVIDIA DLSS

Zdroj: Se svolením autora článku / CD Project Red
Nvidia patří mezi největší hráče na poli umělé inteligence. Čipy od této společnosti pohání servery s AI po celém světě a načerpané zkušenosti firma převádí i do herního segmentu, kde ukazuje, jak koncovému uživateli naservírovat strojové učení v dokonale funkčním balení.
Komerční sdělení
22. 7. 2024

Sdílet

Slovíčka umělá inteligence jsou dnes tak rozšířená, že je potkáváme i mimo technicky zaměřené weby. ChatGPT, Apple Intelligence, Midjourny, Copilot a další služby usnadňují každodenní život i práci. Alespoň se tak tváří. Jenže všechny tyto platformy jsou i po letech vývoje stále v plenkách. ChatGPT vám občas zalže, nebo nezná aktuální informace. Midjourny vykouzlí nesmyslný obrázek a takto bychom mohli pokračovat. Jenže najde se i AI, které pracuje spolehlivě do takové míry, že vlastně zapomenete, že se řadí do stejné kategorie.

Příchod DLSS a RTX

Řeč je konkrétně o Nvidii, která byla v masovém nasazení AI u her průkopníkem. Naštěstí nejde o nahrazení umělců a programátorů strojovým učením. K tomu snad ani nedojde. Umělá inteligence od Nvidie sice slouží k šetření, ovšem nikoliv lidských zdrojů, ale výkonu vašeho počítače.

S příchodem řady GeForce RTX v září roku 2018 Nvidia představila dva klíčové druhy výpočetních jader. Šlo o RT jádra a Tensor jádra. V případě RT jader je jejich účel celkem zřejmý – pomáhají s hardwarovými výpočty Ray Tracingu. V době představení RTX 20 šlo o nosný bod karet. Jenže karty se pomalu otáčejí a Tensor jádra jsou stále důležitější.

První generace DLSS uměla jen pokročilý AI Super Sampling a byla složitá na implementaci. Umělá inteligence se musela naučit, jak hra vypadá, což pro vývojáře znamenalo dost práce navíc. Mezi prvními podporovanými hrami byl třeba právě vydaný Battlefield V nebo Metro Exodus. Nešlo v té době o velký úspěch a neoficiální verze DLSS 1.9, která se nacházela ve hře Control, využívala CUDA jádra. S DLSS 2.0 v dubnu 2020 se ale mnohé změnilo.

DLSS 2.0 opět využívalo Tensor jádra, která najdeme ve všech kartách GeForce RTX. Umělá inteligence už nemusela být specificky cvičena na každou hru samostatně. Nvidia navíc zajistila snadnou implementaci do masově rozšířených enginů jako Unity a Unreal Engine. Výsledkem bylo masové rozšíření DLSS, které ve své druhé generaci přinášelo i mnohem lepší výsledky po vizuální a výkonnostní stránce.

Díky optimalizaci zmizela řada grafických glitchů, rozmazání a chyb. Hráči si tak DLSS 2.0 oblíbili nejen díky nárůstu FPS, ale i slušné kvalitě obrazu. V herní hantýrce šlo o win-win.

DLSS 2.0 se tak dostávalo oficiální cestou do velké řady her a technologie se brzy v popularitě vyrovnala ray tracingu, jehož efekt je na první pohled viditelnější. Využití umělé inteligence v Nvidia grafikách bylo přesto stále na začátku.

Zřejmě největší zlom přineslo DLSS 3.0, tedy verze obsahující Frame Generation. Nvidia tuto technologii uvedla v září roku 2022 a šlo asi o největší skok v rámci AI na poli her. Frame Generation vytváří snímky tak, že mezi dva přirozeně vyrenderované snímky vloží třetí, kompletně vytvořený od AI. Samozřejmě za přispění strojového učení a řady složitých algoritmů.

Autor: NVIDIA

Frame Generation je exkluzivní pro sérii GeForce RTX 40. Při tvorbě snímků se totiž používá Optical Flow Accelerator, který je zesílený právě u aktuální řady grafik. Pokud tedy chcete aktuální technologie ve hrách využít na maximum, sáhněte po nejnovější řadě. GIGABYTE GeForce RTX 4080 SUPER AERO OC 16G, na které si níže demonstrujeme vliv DLSS Super Resolution, Frame Generation a Ray Reconstruction. Poslouží nám k tomu dnes již klasika v podobě Cyberpunku 2077 a detektivky Alan Wake II s novým rozšířením Night Springs.

Zdroj: Youtube.com

Krátce bychom se rádi zastavili u samotné grafické karty. Grafů a čísel vidíte všude mnoho, zkrátka se jedná o smysluplnou výkonnou kartu. My upozorníme na propracované chlazení Windforce se třemi 110mm ventilátory s unikátním 3D designem, zajímavostí je, že prostřední se otáčí v opačném směru, kvalitní kompozitní teplovodivé trubice a velký teplovodivý plát spojený s GPU čipem a další speciality vedoucí k zajištění efektivního odvodu tepla. K dispozici jsou také režimy OC a Silent, které uživateli poskytnou nejlepší možný výkon resp. tichý provoz. Pro nadšence do estetiky a RGB podsvícení lze využít individuální nastavení prostřednictvím aplikace Gigabyte Control Center.

Autor: GIGABYTE

Ještě před testy je potřeba uzavřít kapitolu vývoje DLSS. Poslední významnou aktualizaci technologie obdržela v září minulého roku. DLSS 3.5 přináší Ray Reconstruction, který nahrazuje odšumovací algoritmy jedním pod vedením AI modelu. Na závěr vstupuje na scénu path tracing, tedy kompletně nasvícený herní svět pomocí plného Ray Tracingu. Bez uvolněného výkonu ze všech DLSS odnoží by aktuální grafiky na plný Ray Tracing neměly dostatek výkonu. Zde se tedy DLSS a Ray Tracing technologie opět střetávají a vytvářejí aktuálně nejlepší dostupnou videoherní grafiku. To vše s velkým přispěním umělé inteligence.

Implementace v Cyberpunk 2077 a Alan Wake II

Nyní už k testům. Jak by vypadal Cyberpunk 2077, kdyby do něj umělá inteligence v podobě DLSS nesměla vstoupit?

Hru nastavujeme na předvolbu Ray Tracing: Overdrive a pro úvodní měření máme zapnuté DLSS Super Resolution, Ray Reconstruction a Frame Generation. Zapnutý je také Path Tracing. To vše při 4K rozlišení. Výsledkem je stabilních 90 FPS mimo centrum a 64 FPS v samotném centru na GIGABYTE GeForce RTX 4080 SUPER AERO OC 16G.

Autor: Se svolením autora článku / CD Project Red

Na 90 snímků za sekundu ve 4K a maximálních detailech je radost hrát. Žádné kompromisy, krásný obraz a vše maximálně plynulé. Nyní začneme AI trochu stříhat křidélka. Jako první přijde na řadu Ray Reconstruction. Tato technologie má vliv nejen na světelné efekty, ale i výkon.

Autor: Se svolením autora článku / CD Project Red

Vpravo vidíme snímek z centra při zapnutém DLSS Super Resolution, Frame Generation, Path Tracingu a Ray Reconstruction. Obrázek vlevo se liší jen vypnutím Ray Reconstruction.

Autor: Se svolením autora článku / CD Project Red

Přílišných rozdílů si všimnete spíše při bližším pozorování. Větší rozdíl dělají spíše odrazy neonů od vodních ploch v noci. Ale třeba i odraz textu od oken je lehce ostřejší při zapnutém Ray Reconstruction. Přínos Ray Reconstruction je patrný zejména při pohybu, kdy celkově stabilizuje scénu. Po zapnutí získáte o pár FPS navíc. Mimo město to bylo 7–8 FPS, v centru 3–4. Rozdíl byl tak okolo 5 % nárůstu výkonu.

Autor: Se svolením autora článku / CD Project Red

A vliv Frame Generation? Značný. Pokud tuto technologii vypneme, dostáváme se na 35 FPS. Opět zapnutý Path Tracing a DLSS Super Resolution. Abychom mohli hru vůbec rozjet bez poslední berličky, tedy DLSS Super Resolution, musíte se rozloučit s Path Tracingem a velkou řadou Ray Tracing efektů. I tak ale dostanete FPS hluboko pod 30. V nativním 4K rozlišení si bez DLSS a AI technologií zkrátka Cyberpunk 2077 pořádně nezahrajete.

Nvidia to sama přiznává v přiloženém videu, kdy bez DLSS, ale s plným Ray Tracingem nedostanete více jak 20 FPS. A to jde o benchmark na 4K rozlišení, nejvyšší detaily (RT Overdrive), jako v našem testu, jenže s RTX 4090. Výsledky tedy odpovídají.

Alan Wake II představuje o něco novější titul a provázanost s moderními technologiemi je oproti Cyberpunku 2077 ještě o trochu větší. Ray Reconstruction se zde zapíná hned už při minimálním přednastaveném Ray Tracingu. Pokud RR vypneme, můžeme využít připravené odšumovače nepřímého osvětlení. Jejich dopad na výkon je ale enormní a bez Ray Reconstruction budete muset Path Tracing i Ray Tracing výrazně omezit.

Autor: Se svolením autora článku / Remedy Entertainment

V režimu DLSS Super Resolution Performance a Frame Generation se na vysokou kvalitu detailů a Ray Tracingu (zahrnuje Ray Reconstruction a Path Tracing) dostanete na slušných 70 FPS v akci, 80 FPS v klidnějších oblastech.

Autor: Se svolením autora článku / Remedy Entertainment

Při vypnutí Ray Reconstruction si raději nechte ujít i Path Tracing. FPS totiž jinak klesnou blízko k obrázkové prezentaci. Bez Path Tracingu už se hra blíží aspoň ke 30 FPS.

Pro porovnání FPS u DLSS Super Resolution a DLSS Frame Generation raději kompletně vypneme Ray Tracing. Bez RT dávají obě technologie společně okolo 108 FPS. Vypnutí Frame Generation sníží FPS na 70. Konečně při kompletním vypnutí DLSS včetně Super Resolution se dostaneme na nějakých 23 FPS. Alan Wake II je zkrátka náročnou hrou a Super Resolution zde odvádí velký kus práce. Ale stejně tak i Frame Generation.

Rozdíl mezi vypnutými Nvidia technologiemi DLSS a RT a zapnutými je propastný nejen u FPS. V prvním případě získáte 23, ve druhém až 80. Ale i v kvalitě obrazu. Při plynulejším obrazu obdržíte plný Ray Tracing a Ray Reconstruction.

Nvidia udává, že s RTX 4080 se dostanete až na 103 FPS, což není úplně tak daleko od naměřených hodnot. Záleží i na místě ve hře, kde byl výkon testován. A samozřejmě my zkoušeli hru s novým DLC Night Springs.

Autor: NVIDIA

Nástup generace RTX grafik nebyl zcela hladký, ale dneska jde o ekosystém, který dokázal umělou inteligenci integrovat asi nejlépe. Není se čemu divit. Řada AI pomocníků využívá servery s Nvidia grafikami, tudíž tato společnost může čerpat z bohatých zkušeností.

Praxe ukazuje, že nejlepší AI je takové, u kterého vlastně ani nevíte, že jde o umělou inteligenci. Řekli jste si snad někdy, že teď ve hře zkusíte zapnout AI? Zapínáte prostě DLSS, tedy sadu technologií, které AI využívají optimálně a tak, abyste vy mohli hrát a víc neřešit. A takto by se umělá inteligence v moderní době měla implementovat.