Radeony RX 7000 asi mají něco jako Tensor Core. RDNA 3 přinese maticové instrukce WMMA

30. 6. 2022

AMD doteď nenásledovalo Nvidii a neintegrovalo do herních GPU jednotky vyhrazené pro akceleraci AI. Ale podle linuxových ovladačů to přicházející grafiky s architekturou RDNA 3 možná změní.

Na podzim chystá AMD vydání nové generace GPU s architekturou RDNA 3, která by měla dostat jméno Radeon RX 7000. Firma řekla, že jejich architektura by měla být výrazně přepracovaná s novými výpočetními jednotkami a lepší energetickou efektivitou, ale zatím nejsou moc jasné konkrétní detaily těchto změn. Vypadá to ale, že by mezi nimi mohlo být přidání hardwarové akcelerace neuronových sítí („AI“) podobné tensor jádrům u Nvidie.

AMD už pomalu posílá různé patche přidávající linuxovou podporu RDNA 3 a díky open-source kódu ovladačů (jedna z nevýhod pro dotyčné firmy) se z nich dá hodně vypozorovat. AMD teď v patchi zaslaném 28. 6. uvádí, že architektura či instrukční sada „gfx11“ obsahuje nové instrukce WMMA. Přičemž tato zkratka znamená Wave Matrix Multiply-accumulate. Označení gfx11 znamená GPU architektury RDNA 3, není tu tedy řeč o nějakých výpočetních GPU, ale zřejmě přímo o herních grafikách Radeon RX 7000.

Instrukce WMMA by měly provádět operace typu FMA nad maticí čísel, což je přesně typ operace, kterou akcelerují specializované jednotky pro AI výpočty včetně tensor jader v GPU Nvidie. Jedná se tedy téměř určitě o obdobu této funkcionality určenou k akceleraci neuronových sítí.

GPU RDNA 3 podle patche přinášejí instrukce WMMA (zdroj: LLVM)

Instrukce WMMA by zřejmě měly podporovat matice 16×16×16, přičemž výsledek výpočtů má být ve formátu FP16 nebo Bfloat16. Otázka je, jak jsou tyto instrukce zpracovány v GPU, tedy zda pro ně RDNA 3 přidává nějaké samostatné výkonné jednotky. O tom, jak užitečné budou, bude rozhodovat zejména hrubý výkon.

AMD již má specializovanou akceleraci AI výpočtů v linii GPU architektury CDNA, kde se jmenují „Matrix Core“. Ovšem architektura CDNA (a následníci CDNA 2 a další) je oddělená linie, která vychází spíše z architektury Vega/GCN než z linie RDNA. Tudíž není jisté, zda se podobné jednotky prostě dostanou i do architektury RDNA 3. Místo nich může být použito něco jiného. Architektura CDNA také nazývá instrukce používající Matrix Core jinak (MFMA).

Zatím tedy těžko říct, zda bude podpora AI výpočtů v RDNA 3 mít nějaký dramatický význam pro výkon. Pokud ano, mohlo by AMD tyto operace využít podobně jako Nvidia, u které je asi nejviditelnější aplikací tensor jader herní upscaling DLSS a zejména vylepšený DLSS 2.x. AMD proti němu přišlo s FSR 2.0, což je podobný temporální upscaling, který ale nevyužívá neuronovou síť.

Použití pro upscaling her?

FSR 2.0 je až překvapivě konkurenceschopné v obrazové kvalitě, ale AMD by přesto asi mohlo vyvinout i verzi FSR 2.0 (FSR 3.0?), která by do této sady filtrů přidala interpolaci pomocí neuronové sítě. Mohlo by to vylepšit tu dílčí část celého procesu, která čistě spatiálně interpoluje jednotlivý snímek na vyšší rozlišení. Zdá se sice, že hlavní přínos v FSR 2.0 i DLSS 2.x má spíše temporální rekonstrukce probíhající poté, ale nějaké zlepšení by mohlo, či spíše mělo nastat.

Intel by měl u svého vlastního upscalingu XeSS sledovat podobnou strategii – měl by fungovat na bázi neuronové sítě, která využívá AI akcelerátory XMX v grafikách Intel Arc, ale zároveň má jako „fallback“ pro univerzální kompatibilitu režim, kdy upscaler používá jednodušší algoritmus běžící na obecných shaderech GPU. Případné FSR 3.0 by možná mohlo fungovat podobně – s režimem využívajícím AI instrukce i s režimem podporujícím všechna, i starší GPU ve stylu FSR 2.0. Nicméně to je zatím spekulace, uvidíme, jak se to s akcelerací AI na Radeonech RX 7000 vyvine.

Tip: AMD potvrdilo, že u Radeonů RX 7000 také naroste spotřeba. Bude to méně než u Nvidie?

Zdroj: Kepler, LLVM, VideoCardz

Vstoupit do diskuse (5 názorů)

Jan Olšan

Témata:

Ak sa to neodloží, akcie TSMC prdli za pár mesiacov o -40%,hlavní odberatelia znižujú objednávky, TSMC po dlhom časenebude vyťažené na plný profil....Samsung má 3nm proces, ktorý zrejme negatívne ovplyvňuje akcie TSMC:https://www.hardwaretimes.com/nvidia-reduces-5nm-capacity-rtx-4090-4080-launch-may-get-delayed-to-2023-report/

bez přezdívky

Sdílet

Použití pro upscaling her?

Autor článku

Jan Olšan

Témata:

Nejnovější

Anketa

Stali jste se někdy terčem nějakého podvodu?

Témata

Návody a tipy

Jak na Netflixu najít perfektní film během pár sekund? Tajnou zkratkou jsou skryté kódy ve vyhledávání

Usínáte pravidelně u YouTube? Nová funkce vám ušetří peníze za elektřinu

Jak vložit elektronický podpis do PDF dokumentu? Jde to snadno a zdarma

Jak zjistit heslo Wi-Fi sítě, ke které jste připojeni? Na počítači s Windows nebo na smartphonu snadno

Šest nejlepších vychytávek od Mapy.cz. Znáte je všechny?

Optimalizace pro Ryzeny s 3D V-Cache i podpora běhu Radeonů na LoongArch míří do jádra

Koalice chce na povinnosti z digitální ústavy o dva roky více, hledá se viník zpoždění

Když malý usnul, otevírala notebook. Nyní má úspěšný byznys pro nejmenší

Google se musí zbavit Chrome, Androidu a monopolu na vyhledávání, požaduje Ministerstvo…

Musk chce upgradovat státní IT systémy, návrh na rozdělení Googlu, nový minipočítač od Microsoftu

Stříteský: Obchodníci dostávají v zahraničí vyšší sankce a slevy mají výrazně omezené

Srovnání linuxových kompresorů dat: různé kompresní poměry a rychlost

Krátké vlny: Odklad práva na digitální služby a Milouš Jakeš o kyberbezpečnosti

Jak uplatní pracující důchodci u zaměstnavatele slevu na pojistném?

Radeony RX 7000 asi mají něco jako Tensor Core. RDNA 3 přinese maticové instrukce WMMA

Sdílet

Použití pro upscaling her?

Autor článku

Anketa

Stali jste se někdy terčem nějakého podvodu?

Kvíz týdne

Návody a tipy

Z našich webů

Optimalizace pro Ryzeny s 3D V-Cache i podpora běhu Radeonů na LoongArch míří do jádra

Koalice chce na povinnosti z digitální ústavy o dva roky více, hledá se viník zpoždění

Když malý usnul, otevírala notebook. Nyní má úspěšný byznys pro nejmenší

Google se musí zbavit Chrome, Androidu a monopolu na vyhledávání, požaduje Ministerstvo…

Musk chce upgradovat státní IT systémy, návrh na rozdělení Googlu, nový minipočítač od Microsoftu

Stříteský: Obchodníci dostávají v zahraničí vyšší sankce a slevy mají výrazně omezené

Srovnání linuxových kompresorů dat: různé kompresní poměry a rychlost

Krátké vlny: Odklad práva na digitální služby a Milouš Jakeš o kyberbezpečnosti

Jak uplatní pracující důchodci u zaměstnavatele slevu na pojistném?

Dále u nás najdete

ÚOOÚ šetří české vydavatele kvůli „pay or ok“

Vyznejte se v kuřatech. Takhle se liší selské od venkovského

Celý příští týden se můžete nechat anonymně otestovat na HIV

Souvisí zákaz Huawei i s nákupem stíhaček F-35?

Firmy mají řešit byznys, ne hledat účtenky, razí Fidoo

Šestka nad čtyřkou? Zastaralé. Čtyřka nad šestkou!

Opakující se melodii v hlavě zkuste zahnat žvýkačkou

Podnikatelé s nižšími příjmy si za celý rok připlatí skoro o 13 tisíc víc

Osvědčené způsoby, jak snížit vysoký krevní tlak

Stříteský: Obchodníci mají v zahraničí vyšší sankce a omezené slevy

První pacientka podstoupila genovou terapii bránící slepotě

Chrome OS se zřejmě promění v Android

World of Warcraft slaví 20 let a stále se hraje

V obchodech je máslo s obsahem tuku jen 61 %. Rarita, ale povolená

Hackeři zneužili reklamy na Facebooku k šíření falešných správců hesel pro Chrome – pak ukradnou Facebook účet

Balík od DPD si nově můžete vyzvednout i na České poště

Čeští středoškoláci očekávají vypuštění své družice

Města ve Středočeském kraji mění koeficienty k dani z nemovitostí

Deepl nově umí překládat v reálném čase řeč

Jihlava a Havlíčkův Brod mění daň z nemovitostí. Co další města?