GPU Intelu dosáhla technologické parity s DLSS od Nvidie. XeSS 2 má generování snímků i vlastní Reflex

Sdílet

S novými grafikami uvádí Intel také novou technologii upscalingu, která už zahrnuje i vlastní ekvivalent interpolace snímkové frekvence DLSS 3 a redukci latence pro rychlé reakce ve hrách.

Zítra vyjdou grafiky Arc B580 od Intelu, představené minulý týden. Jejich GPU přinášejí novou architekturu Xe2, která má být efektivnější i výkonnější (byť se dostane jen do relativně levnějších grafik). Nejen hardwarem ale chce Intel občerstvit své grafiky Arc – s novou generací GPU přichází i vylepšená technologie „super resolution“ upscalingu: XeSS 2. Ta by mohla po stránce funkcí v podstatě srovnat krok s DLSS od Nvidie.

Reparát Intelu v herních grafikách: Arc B580 a B570 s architekturou Xe2 „Battlemage“ jsou tady Přečtěte si také:

Reparát Intelu v herních grafikách: Arc B580 a B570 s architekturou Xe2 „Battlemage“ jsou tady

Efektivita a silný ray tracing. Detaily nové architektury Xe2 v grafikách Arc „Battlemage“ Přečtěte si také:

Efektivita a silný ray tracing. Detaily nové architektury Xe2 v grafikách Arc „Battlemage“

XeSS 2

Upscaling XeSS od Intelu uvedený s první generací grafik Arc byl již od první generace z velké části technologicky blízko čelu pole. Jeho základní verze, kterou Intel nazývá XeSS SR (Super Resolution), je víceméně ekvivalentní tomu, co přinesly DLSS 2.x a FSR 2.x od Nvidie a AMD v tom smyslu, že jde o upscaling používající pokročilou temporální rekonstrukci detailů (v těchto technikách je v podstatě zabudovaná vyhlazovací technika TAA s použitím pohybových vektorů pro kompenzací pohybu). Ovšem na rozdíl od FRS 2.x má Intel pokročilejší komponent 2D upscalingu, protože již používá AI model (zatímco u AMD je tato část konvenční) jako Nvidia v DLSS.

Autor: Intel

Tento AI upscaling má dva alternativní modely – jednodušší model „Lite“, který používá instrukce DP4a nebo zcela obecné široce kompatibilní shadery (tento režim lze použít i mimo GPU Intel), a těžkotonážní pokročilejší model, který vyžaduje akceleraci na specializovaných jednotkách XMX, které jsou totéž co tensor jádra u Nvidie. Je už tedy vázaný na vlastnictví karty Arc (nicméně do hry se integruje obojí najednou, takže toto nemusí vývojáře her trápit a mohou teoreticky pomocí XeSS implementovat upscaling, který „bude pro všechny“, podobně jako u FSR).

XeSS-FG: Generování snímků od Intelu

XeSS 2 teď ke spatio-temporálnímu upscalingu a vyhlazování/rekonstrukci přidává také to, v čem byla Nvidia napřed – technologii dopočítávání mezisnímků mezi reálné snímky hry, což (aspoň zdánlivě) zdvojnásobuje FPS a může zlepšit pocitovou plynulost. Intel svůj ekvivalent označuje jako XeSS-FG (FG = Frame Generation neboli generování snímků).

Mělo by jít skutečně o ekvivalent fungující na stejném principu – XeSS FG analyzuje obrazová data ze dvou po sobě jdoucích snímků a vytvoří umělou interpolaci hypotetického mezistavu mezi oběma vstupními snímky vytvořenou na základě kompenzace pohybu prováděné pomocí technologie Optical Flow.

Autor: Intel

Současně se vytváří takový hypotetický mezisnímek kompenzací pohybu dle informací o pohybových vektorech (ty dodává s dalšími metadaty engine hry) a tato verze predikce se kombinuje se snímkem vytvořeným technikou Optical Flow. Pro pixel lze tedy podle různých kritérií volit z těchto dvou zdrojů predikce, nebo je oba smíchat. Konečný interpolovaný snímek je pak zařazen do fronty k zobrazení mezi oba zdrojové snímky.

S RTX 4000 přichází Nvidia DLSS 3. Nová generace AI upscalingu generuje snímky, obchází limit CPU Přečtěte si také:

S RTX 4000 přichází Nvidia DLSS 3. Nová generace AI upscalingu generuje snímky, obchází limit CPU

Otevřená alternativa DLSS 3 je tady. FSR 3 v prvních hrách, opět funguje na všech grafikách Přečtěte si také:

Otevřená alternativa DLSS 3 je tady. FSR 3 v prvních hrách, opět funguje na všech grafikách

Podle popisu by měla tato technika v XeSS 2 fungovat obdobně jako ta, kterou používá Nvidia v DLSS 3.x a AMD v FSR 3.x. Nvidia nicméně uvádí, že její verze využívá speciální akcelerátory pro onu technologii Optical Flow, které jsou dílčím zdrojem dat pro vzniklé snímky. U Intelu není jasné, zda jsou nějaké jednotky zcela specializované jen na Optical Flow použité – minimálně jsou ale potřeba jednotky XMX pro akceleraci umělé inteligence. To znamená, že XeSS-FG bude fungovat jen na grafikách Arc první i druhé generace a na integrované grafice procesoru Lunar Lake (Core Ultra 200V) – již ale ne na grafice v Meteor Lake a Arrow Lake, které mají architekturu Xe LPG bez jednotek XMX.

Schéma fungování XeSS Frame Generation

Autor: Intel

Výsledkem aplikace XeSS-FG by tedy mělo být, že získáte až dvojnásobnou snímkovou frekvenci (v praxi to bývá o trošku méně) ve srovnání s tím, co normálně vaše GPU a CPU zvládnou. Sama hra totiž stále generuje nezměněné množství snímků, až pro samotné zobrazení se k nim dopočítají „vycpávací“ mezisnímky (ty z pohledu hry neexistují, není k nim vyhodnocován vstup, AI nepřátel, fyzika a tak podobně).

Protože jsou systémy vytvářející onen interpolovaný mezisnímek odlišné, budou mezi těmito technologiemi jednotlivých firem vždy určité vizuální odlišnosti. Jak bude XeSS-FG srovnatelné s DLSS 3.x Nvidie a FSR 3.x od AMD, teprve uvidíme.

Generování může až zdvojnásobit výslednou snímkovou frekvenci na monitoru (navíc ke zvýšení výkonu dodaného upscalingem z nižšího rozlišení)

Autor: Intel

XeSS FG by mělo tím, jak pracuje s pohybovými vektory, být navázané na současné použití upscalingu XeSS Super Resolution. Asi tedy nebude možné použít ho samostatně bez toho, aby bylo aktivní základní XeSS.

Xe LL: zkrácení latence ve hrách

S generováním snímků asi souvisí druhá novinka. Jak jsme psali v popisu fungování DLSS 3, toto generování snímků prodlužuje latenci ve hře – tedy zpoždění mezi akcí hráče (nebo i jeho protivníka nebo AI) a jejím zobrazení na monitoru. Je to právě kvůli tom, že se mezisnímek vkládá mezi dva reálné snímky. Hra musí vždy mít dva vypočítané snímky ve frontě (n1 a n2), aby mohla začít vytvářet interpolovaný mezisnímek (n1,5). Když ho začne tvořit, může již zobrazovat snímek n1, ale n2 musí čekat na zobrazení n1,5 a pak ještě samozřejmě po dobu časové prodlevy mezi n1,5 a n2, než nastane jeho čas k zobrazení. Tímto čekáním nevyhnutelně dochází ke zvýšení latence proti režimu, kdy hra sype všechny dokončené snímky okamžitě do monitoru k zobrazení – jeden snímek vždy zůstává chvíli ve frontě a zobrazení je o něj opožděné.

Marketing Nvidie se toto dost nepochopitelně snažil popírat a tvrdit, že DLSS 3 latenci neprodlužuje, nebo dokonce zkracuje, ale ve skutečnosti je to jinak: Firma doporučuje to, aby hry ve spojení s DLSS 3 používaly technologii Reflex, což je nezávisle existující metoda ke snížení latence (důležitá zvlášť pro soutěžní a multiplayerové hraní, kdy je používána bez generování snímků). Její aplikace může latenci hry zase o něco snížit, ale důležité je, že neeliminuje ono zpoždění inherentně spojené s interpolací a čekáním snímků. Odstraňuje jen jiné nezávisle existující faktory zvyšující latenci, které by existovaly i bez DLSS.

Autor: Intel

Každopádně Intel teď spolu s XeSS-FG také uvádí i vlastní ekvivalent tohoto zkracovače latence, jehož rolí bude asi také kompenzovat zhoršení latence při použití interpolace (a vedle toho také separátně sloužit oněm eSports a multiplayerovým hrám). Tato technologie se jmenuje Xe Low Latency neboli Xe LL. Fungování by v principu asi zase mělo být stejné jako u Reflexu, tedy zkrácení nebo eliminace front v ovladačích a ve hře a snaha o větší synchronizaci pipeline, včetně toho, že GPU může nakrátko zvýšit svůj takt, aby co nejdříve dokončilo operace potřebné k co nejrychlejšími protlačení vypočítávaného snímku skrz pipeline hry.

Xe LL může znatelně zkrátit latenci mezi vstupem a zobrazením. Jde o obdobu Reflexu od Nvidie

Autor: Intel

XeSS LL by stejně jako Reflex od Nvidie mělo vyžadovat integraci do her, aby se dalo použít. Pro hry, které ji nemají (nebo třeba už jsou starší a nové funkce do nich nikdo nepřidává), lze použít zkrácení latence jen na úrovni ovladačů, které má menší možnosti, a je tak o něco méně účinné.

Autor: Intel

Podpora technologií je tu, otázka je rozšíření ve hrách

I zde by tedy teď Intel (podobně jako AMD s FSR 3 a technologií Anti-Lag 2) měl mít víceméně paritu s technologiemi Nvidie sloužícími ke zvýšení snímkové frekvence ve hrách (nebo pseudozvýšení v případě generování snímků).

Tedy s tou výhradou, že zatím nemůžeme porovnat vizuální kvalitu, která se může lišit (být o něco horší, teoreticky ale třeba někde i lepší). Jednou výjimkou, která Intelu a AMD chybí, je technika Ray Reconstruction přidaná v DLSS 3.5. Ta může o něco zlepšovat vizuální kvalitu (a vyžaduje specifickou podporu ve hře), jde ale asi o menší inkrementální posun ve schopnostech proti generování snímků.

bitcoin školení listopad 24

Lze nicméně asi očekávat, že alespoň zpočátku budou mít technologie XeSS 2 podporu v méně hrách než řešení konkurentů. Srovnat by se to však mohlo, pokud/až hry začnou používat pro tyto upscalovací činnosti standardizované rozhraní DirectSR. To spočívá v tom, že abstrahuje tyto technologie a hry už budou muset implementovat jenom tuto standardizovanou platformní techniku místo toho, aby se všechny technologie musely implementovat zvlášť – ovladače grafické karty už dodají ten upscaling, který vaše GPU bude umět, a z pohledu hry to bude fungovat zcela automaticky.

Jedna Super Resolution vládne všem. DirectSR odstraní dominanci Nvidie a DLSS ve hrách Přečtěte si také:

Jedna Super Resolution vládne všem. DirectSR odstraní dominanci Nvidie a DLSS ve hrách

Zdroj: Intel