Zítra vyjdou grafiky Arc B580 od Intelu, představené minulý týden. Jejich GPU přinášejí novou architekturu Xe2, která má být efektivnější i výkonnější (byť se dostane jen do relativně levnějších grafik). Nejen hardwarem ale chce Intel občerstvit své grafiky Arc – s novou generací GPU přichází i vylepšená technologie „super resolution“ upscalingu: XeSS 2. Ta by mohla po stránce funkcí v podstatě srovnat krok s DLSS od Nvidie.
XeSS 2
Upscaling XeSS od Intelu uvedený s první generací grafik Arc byl již od první generace z velké části technologicky blízko čelu pole. Jeho základní verze, kterou Intel nazývá XeSS SR (Super Resolution), je víceméně ekvivalentní tomu, co přinesly DLSS 2.x a FSR 2.x od Nvidie a AMD v tom smyslu, že jde o upscaling používající pokročilou temporální rekonstrukci detailů (v těchto technikách je v podstatě zabudovaná vyhlazovací technika TAA s použitím pohybových vektorů pro kompenzací pohybu). Ovšem na rozdíl od FRS 2.x má Intel pokročilejší komponent 2D upscalingu, protože již používá AI model (zatímco u AMD je tato část konvenční) jako Nvidia v DLSS.
Tento AI upscaling má dva alternativní modely – jednodušší model „Lite“, který používá instrukce DP4a nebo zcela obecné široce kompatibilní shadery (tento režim lze použít i mimo GPU Intel), a těžkotonážní pokročilejší model, který vyžaduje akceleraci na specializovaných jednotkách XMX, které jsou totéž co tensor jádra u Nvidie. Je už tedy vázaný na vlastnictví karty Arc (nicméně do hry se integruje obojí najednou, takže toto nemusí vývojáře her trápit a mohou teoreticky pomocí XeSS implementovat upscaling, který „bude pro všechny“, podobně jako u FSR).
XeSS-FG: Generování snímků od Intelu
XeSS 2 teď ke spatio-temporálnímu upscalingu a vyhlazování/rekonstrukci přidává také to, v čem byla Nvidia napřed – technologii dopočítávání mezisnímků mezi reálné snímky hry, což (aspoň zdánlivě) zdvojnásobuje FPS a může zlepšit pocitovou plynulost. Intel svůj ekvivalent označuje jako XeSS-FG (FG = Frame Generation neboli generování snímků).
Mělo by jít skutečně o ekvivalent fungující na stejném principu – XeSS FG analyzuje obrazová data ze dvou po sobě jdoucích snímků a vytvoří umělou interpolaci hypotetického mezistavu mezi oběma vstupními snímky vytvořenou na základě kompenzace pohybu prováděné pomocí technologie Optical Flow.
Současně se vytváří takový hypotetický mezisnímek kompenzací pohybu dle informací o pohybových vektorech (ty dodává s dalšími metadaty engine hry) a tato verze predikce se kombinuje se snímkem vytvořeným technikou Optical Flow. Pro pixel lze tedy podle různých kritérií volit z těchto dvou zdrojů predikce, nebo je oba smíchat. Konečný interpolovaný snímek je pak zařazen do fronty k zobrazení mezi oba zdrojové snímky.
Podle popisu by měla tato technika v XeSS 2 fungovat obdobně jako ta, kterou používá Nvidia v DLSS 3.x a AMD v FSR 3.x. Nvidia nicméně uvádí, že její verze využívá speciální akcelerátory pro onu technologii Optical Flow, které jsou dílčím zdrojem dat pro vzniklé snímky. U Intelu není jasné, zda jsou nějaké jednotky zcela specializované jen na Optical Flow použité – minimálně jsou ale potřeba jednotky XMX pro akceleraci umělé inteligence. To znamená, že XeSS-FG bude fungovat jen na grafikách Arc první i druhé generace a na integrované grafice procesoru Lunar Lake (Core Ultra 200V) – již ale ne na grafice v Meteor Lake a Arrow Lake, které mají architekturu Xe LPG bez jednotek XMX.
Výsledkem aplikace XeSS-FG by tedy mělo být, že získáte až dvojnásobnou snímkovou frekvenci (v praxi to bývá o trošku méně) ve srovnání s tím, co normálně vaše GPU a CPU zvládnou. Sama hra totiž stále generuje nezměněné množství snímků, až pro samotné zobrazení se k nim dopočítají „vycpávací“ mezisnímky (ty z pohledu hry neexistují, není k nim vyhodnocován vstup, AI nepřátel, fyzika a tak podobně).
Protože jsou systémy vytvářející onen interpolovaný mezisnímek odlišné, budou mezi těmito technologiemi jednotlivých firem vždy určité vizuální odlišnosti. Jak bude XeSS-FG srovnatelné s DLSS 3.x Nvidie a FSR 3.x od AMD, teprve uvidíme.
Generování může až zdvojnásobit výslednou snímkovou frekvenci na monitoru (navíc ke zvýšení výkonu dodaného upscalingem z nižšího rozlišení)
XeSS FG by mělo tím, jak pracuje s pohybovými vektory, být navázané na současné použití upscalingu XeSS Super Resolution. Asi tedy nebude možné použít ho samostatně bez toho, aby bylo aktivní základní XeSS.
Xe LL: zkrácení latence ve hrách
S generováním snímků asi souvisí druhá novinka. Jak jsme psali v popisu fungování DLSS 3, toto generování snímků prodlužuje latenci ve hře – tedy zpoždění mezi akcí hráče (nebo i jeho protivníka nebo AI) a jejím zobrazení na monitoru. Je to právě kvůli tom, že se mezisnímek vkládá mezi dva reálné snímky. Hra musí vždy mít dva vypočítané snímky ve frontě (n1 a n2), aby mohla začít vytvářet interpolovaný mezisnímek (n1,5). Když ho začne tvořit, může již zobrazovat snímek n1, ale n2 musí čekat na zobrazení n1,5 a pak ještě samozřejmě po dobu časové prodlevy mezi n1,5 a n2, než nastane jeho čas k zobrazení. Tímto čekáním nevyhnutelně dochází ke zvýšení latence proti režimu, kdy hra sype všechny dokončené snímky okamžitě do monitoru k zobrazení – jeden snímek vždy zůstává chvíli ve frontě a zobrazení je o něj opožděné.
Marketing Nvidie se toto dost nepochopitelně snažil popírat a tvrdit, že DLSS 3 latenci neprodlužuje, nebo dokonce zkracuje, ale ve skutečnosti je to jinak: Firma doporučuje to, aby hry ve spojení s DLSS 3 používaly technologii Reflex, což je nezávisle existující metoda ke snížení latence (důležitá zvlášť pro soutěžní a multiplayerové hraní, kdy je používána bez generování snímků). Její aplikace může latenci hry zase o něco snížit, ale důležité je, že neeliminuje ono zpoždění inherentně spojené s interpolací a čekáním snímků. Odstraňuje jen jiné nezávisle existující faktory zvyšující latenci, které by existovaly i bez DLSS.
Každopádně Intel teď spolu s XeSS-FG také uvádí i vlastní ekvivalent tohoto zkracovače latence, jehož rolí bude asi také kompenzovat zhoršení latence při použití interpolace (a vedle toho také separátně sloužit oněm eSports a multiplayerovým hrám). Tato technologie se jmenuje Xe Low Latency neboli Xe LL. Fungování by v principu asi zase mělo být stejné jako u Reflexu, tedy zkrácení nebo eliminace front v ovladačích a ve hře a snaha o větší synchronizaci pipeline, včetně toho, že GPU může nakrátko zvýšit svůj takt, aby co nejdříve dokončilo operace potřebné k co nejrychlejšími protlačení vypočítávaného snímku skrz pipeline hry.
XeSS LL by stejně jako Reflex od Nvidie mělo vyžadovat integraci do her, aby se dalo použít. Pro hry, které ji nemají (nebo třeba už jsou starší a nové funkce do nich nikdo nepřidává), lze použít zkrácení latence jen na úrovni ovladačů, které má menší možnosti, a je tak o něco méně účinné.
Podpora technologií je tu, otázka je rozšíření ve hrách
I zde by tedy teď Intel (podobně jako AMD s FSR 3 a technologií Anti-Lag 2) měl mít víceméně paritu s technologiemi Nvidie sloužícími ke zvýšení snímkové frekvence ve hrách (nebo pseudozvýšení v případě generování snímků).
Tedy s tou výhradou, že zatím nemůžeme porovnat vizuální kvalitu, která se může lišit (být o něco horší, teoreticky ale třeba někde i lepší). Jednou výjimkou, která Intelu a AMD chybí, je technika Ray Reconstruction přidaná v DLSS 3.5. Ta může o něco zlepšovat vizuální kvalitu (a vyžaduje specifickou podporu ve hře), jde ale asi o menší inkrementální posun ve schopnostech proti generování snímků.
Lze nicméně asi očekávat, že alespoň zpočátku budou mít technologie XeSS 2 podporu v méně hrách než řešení konkurentů. Srovnat by se to však mohlo, pokud/až hry začnou používat pro tyto upscalovací činnosti standardizované rozhraní DirectSR. To spočívá v tom, že abstrahuje tyto technologie a hry už budou muset implementovat jenom tuto standardizovanou platformní techniku místo toho, aby se všechny technologie musely implementovat zvlášť – ovladače grafické karty už dodají ten upscaling, který vaše GPU bude umět, a z pohledu hry to bude fungovat zcela automaticky.
Zdroj: Intel