AMD FSR4 může dohnat DLSS od Nvidie. Firma potvrdila, že už používá umělou inteligenci

17. 9. 2024

Grafiky AMD Radeon a procesory AMD Ryzen - ilustrace

FSR4 poběží na principu AI a má přinést lepší výkon a delší výdrž mimo jiné pro handheldová herní zařízení. Bude tedy fungovat i na APU Ryzenech.

V březnu tudy prošla zpráva o tom, že by AMD mohlo do budoucích generací upscalingu FSR (FidelityFX Super Resolution) chystat nějaké zapojení umělé inteligence, podobně, jako je na ní založený upscaling DLSS od Nvidie. Včera jsme psali o tom, že Jack Huynh z AMD oznámil budoucí unifikovanou architekturu GPU nazvanou UDNA. Stejný člověk webu Tom’s Hardware prozradil i něco k next-gen verzi FSR a potvrdil, že bude používat AI.

FSR4

Příští generace upscalingu FidelityFX Super Resolution se bude podle Huynha jmenovat FSR4 (jde asi o první potvrzení) FSR4 má nadále obsahovat element škálování snímků, zřejmě také s temporálním filtrováním a rekonstrukcí, a také generování snímků z FSR3. Jako novinku ale začne místo ručně naprogramovaných algoritmů v nějaké formě používat AI.

Přesné detaily zatím chybí, takže nevíme, jak moc součástí škálování, temporálního filtrování (rekonstrukce) a operací při interpolování (generování) mezisnímků bude zajištěno neuronovou sítí. Jako nejpřirozenější a nejjednodušší cíl pro aplikaci AI se jeví samotné bitmapové škálování, kde začala s AI i Nvidia v DLSS 1.0. Lze předpokládat, že tato část bude v FSR4 řešená pomocí neuronové sítě prakticky určitě.

Speciální jednotky nebo shadery a akcelerace v RDNA 3?

Nabízelo by se, že uvedení FSR4 bude spojeno s tím, že nová generace grafik Radeon RX 8000 přinese jednotky (Matrix Cores, nebo jinak označené) akcelerující speciálně operace umělé inteligence. Jejich přítomnost v architektuře RDNA 4 je ale jen hypotetická, zatím nejsou potvrzené. AMD má v GPU architektuře RDNA 3 přítomnou akceleraci umělé inteligence instrukcemi WMMA, která sdílí hardware s výpočetními jednotkami shaderů. Jsou důvody se domnívat, že FSR4 poběží pomocí instrukcí WMMA, a možná tak ani RDNA 4 nebude mít pro AI speciální jednotky fyzicky oddělené od shader ALU v blocích CU.

Akcelerace operací AI na výpočetních jednotkách architektury RDNA 3 by měla být účinnější než prosté použití shaderů na GPU s architekturami RDNA 2 a staršími

Autor: AMD

Důvod je ten, že Jack Huynh mluví o FSR4 jako řešení, které bude myslet mimo jiné na použití v handheldech, kterým má umožnit výrazně prodloužené doby hraní na baterii díky tomu, že výpočet náročných her (jako příklad je uvedený momentálně velmi populární titul Black Myth Wukong) poběží s nižším interním rozlišením. A hru poté FSR4 přeškáluje na vyšší rozlišení (a vyšší FPS pomocí generování snímků). Handheldové konzole ovšem mají procesory (APU) s grafikami založenými na architektuře RDNA 3 (Ryzeny 7000, 8000, Z1 a Z1 Extreme) nebo RDNA 3.5 (nový Ryzen AI 300 a budoucí Ryzen Z2 Extreme).

Tyto handheldové (a notebookové) procesory nicméně také obsahují jednotku NPU pro akceleraci umělé inteligence. Teoreticky tak FSR4 může být zaměřeno na její použití. I pak bychom ale čekali, že bude mít také záložní kompatibilitu s akcelerací na klasických samostatných GPU Radeon. Co je méně jasné, je kompatibilita s širokou paletou starších i konkurenčních GPU, což je něco nabízeného předchozími verzemi FSR až po nynější FSR 3.1. Opustí AMD tuto dosud úspěšnou strategii? Je možné, že v budoucnu tuto formu kompatibility nahradí využití standardního rozhraní pro upscaling DirectSR, takže už nebude vadit, že FSR4 poběží jen na GPU od AMD (a ještě třeba jen na jejich části).

FSR4 je ve vývoji zhruba rok

Jack Huynh mluví o tom, že se tým vyvíjející FSR4 přeorientoval proti předchozím generacím FSR, které používaly konvenční algoritmy, ale postupný přechod od nich na AI je nejspíš aspoň částečně plánovanou strategií. FSR4 založené na umělé inteligenci může přijít nyní, když architektura RDNA 3 a pozdější obsahuje akceleraci umělé inteligence pomocí operací WMMA. V době grafik Radeon RX 6000 měla GPU od AMD pro akceleraci AI nižší výkon (používaly by patrně výpočty FP16 přímo na shaderech, tzv. Rapid Packed Math) a současně technologie FSR potřebovala širokou hardwarovou podporu, aby oslovila vývojáře her, takže dávalo smysl ji vytvořit jako obecný kód běžící na všech rozumných GPU.

Vzorek procesoru AMD Granite Ridge a mobilní Ryzen AI 300 Strix Point

Vzorek procesoru AMD Granite Ridge (vlevo) a mobilní Ryzen AI 300 Strix Point (vpravo)

Autor: Jack Huynh, AMD

Každopádně by vývoj FSR4 založeného na AI měl údajně nyní běžet už nějakých 9 až 12 měsíců. Kdy bude technologie oficiálně vydaná a uvolněná pro integraci do her, zatím nevíme. Bylo by logické, kdyby bylo oznámení spojeno s příchodem grafik Radeon RX 8000, které dříve bylo očekáváno na první kvartál roku 2025, ale nedávno se zase začalo mluvit o možnosti, že by tyto karty mohly jít na trh ještě tento podzim (dejme tomu v listopadu).

Je možné, že FSR4 bude pro integraci do her používat stejná rozhraní a API jako FSR 3 a FSR 3.1, takže by mohlo jít technologii upscalingu v existujících hrách poměrně jednoduše upgradovat. A s trochou štěstí by tak FSR4 mohlo do her být přidáváno relativně rychle. Ale to je zatím jen spekulace. Jak se elementy umělé inteligence projeví na obrazové kvalitě a výkonu, to zatím těžko hádat.

Zdroj: Tom’s Hardware