Pomalu se blíží velká generační výměna grafických karet, kterou přinesou nové architektury GPU, jež chystá jak AMD, tak Nvidia na druhou polovinu letošního roku, snad srpen až říjen. Tato nová generace by měla přinést opravdu vysoké nárůsty výkonu, kdy by prý highendové karty mohly dosáhnout až třeba dvouapůlnásobné nárůsty výkonu. Výpočetní výkon by prý mohl stoupnout z dnešních 23 až na 90 TFLOPS.
V posledních dnech se objevily opět útržkovité informace o specifikacích budoucích grafik. Leaker Greymon55, který má kontakty na informátory obeznámené s plány AMD, píše, že by AMD mohlo u svého přicházejícího highendového GPU Navi 31 výrazně navýšit teoretický hrubý výpočetní výkon. Tedy to, co se udává jako tzv. TFLOPS, počet operací, které mohou teoreticky za sekundu provést všechny shaderové ALU grafické karty.
Z dřívějších dob si možná pamatujete, že grafiky AMD s architekturou GCN měly o dost vyšší udávané TFLOPS, ale konkurenční Nvidie dosahovaly stejný herní výkon s o dost menším udávaným číslem. Od doby architektury Ampere se to úplně obrátilo kvůli tomu, že Nvidia zdvojnásobila počet jednotek FP32, od nichž se TFLOPS odvozují. Ale výkon na 1 MHz o moc nestoupl. Nyní tedy platí, že Radeony s architekturou RDNA 2 dosahují cca stejného herního výkonu při mnohem menších TFLOPS (teoretickém výpočetním výkonu shaderů). Ona převaha Ampere se nicméně asi může někdy ukázat ve výpočetních aplikacích, ale úplně papírový výkon to není.
Více: Architektura a detaily GPU Nvidia Ampere/GeForce RTX 3000
RDNA 3 bude obří skok ve výpočetním výkonu
Toto by ale možná právě mohlo přestat, respektive by rozdíl nemusel už být tak velký. Podle Greymona55 by Navi 31 v nejvýkonnější kartě mohlo dosáhnout hrubý výpočetní výkon až kolem 90 TFLOPS ve výpočtech s hodnotami FP32 (konkrétně dokonce mluví o 92 TFLOPS). Pro srovnání: dnes má GeForce RTX 3090 „jen“ 36 TFLOPS a RTX 3090 Ti už 40 TFLOPS. Radeon RX 6900 XT, který jim konkuruje, respektive je o nějaká procenta pomalejší, má uváděný výkon jen 23,04 TFLOPS.
https://twitter.com/greymon55/status/1520392877242675201
Jak by mohlo být navýšení až na 90 TFLOPS možné? Podle Greymona bude Navi 31 složené ze dvou 5nm výpočetních čipletů, ale každý z nich bude sám výkonnější než jedno dnešní GPU Navi 21. Zřejmě by jeden čiplet měl obsahovat 7680 shaderů, o polovinu více než 5120 shaderů v Navi 21. Navi 31 s dvěma čiplety v kompletně aktivované podobě by mělo mít 15 360 shaderů.
Dvakrát víc shaderů na CU
Je zajímavé, že to pravděpodobně bude členěno jinak než dnes – nepůjde o 240 bloků CU, ale jen o 120 CU. AMD prý totiž zdvojnásobí počet shaderů v jednom bloku CU z 64 na 128 – je to trošku podobné zdvojnásobení jednotek FP32 u Nvidia Ampere, ale tam nešlo o úplné zdvojnásobení výkonu, protože FP32 jednotky navíc zabírají pipeline předtím vyhrazenou pro celočíselné jednotky.
AMD zřejmě jde cestou prostého zdvojnásobení ALU. Architektury RDNA a RDNA 2 používaly dva SIMD enginy o šířce 32 ALU/lane, čímž vzniklo 64 shaderů – byla to změna proti GCN, kde byly použité čtyři enginy o šířce 16. Teď to prý AMD dalo dohromady – v architektuře RDNA 3 má jedna CU údajně čtyři SIMD enginy, ale o šířce 32, takže celkově 128 shaderů.
Tím pádem má Navi 31 s dvěma výpočetními čiplety jen 120 CU (tedy o polovinu více než Navi 21), ale shaderů má třikrát více. V údajích o šířce GPU se jinak objevuje také údaj, že celé GPU má 60 WGP (Workgroup Processorů). Jeden WGP je tvořen dvěma CU, a obsahuje tedy 256 shaderů, což nakonec zase dává těch 15 360 shaderů. Tyto WGP by měly být spojeny to Shader Enginů po deseti, každý výpočetní čiplet tedy bude tvořen třemi Shader Enginy a celé Navi 31 jich bude obsahovat šest.
Tip: AMD RDNA 3: Radeon RX 7900 XT bude složený ze sedmi čipletů. Čtyři záhadné křemíky MCD
Takt až 3 GHz?
Ztrojnásobení počtu shaderů ale na těch 90 TFLOPS nedosáhne (jen na 69, pokud vycházíme z 23 TFLOPS Radeonu RX 6900 XT). Zbytek by prý měla udělat frekvence. Navi 31 a architektura RDNA 3 bude mít údajně velmi vysoký takt, toto highendové GPU údajně může běžet na taktu až 3,0 GHz. Navi 21 má dnes boost jen 2250 MHz. Menší GPU architektury RDNA 2 běží mnohem výš, tím ale klesá energetická efektivita.
Výpočetní výkon nového highendového Radeonu by tak mohl stoupnout víc jak 3,5×, pořád ale platí, že mezi různými architekturami neškáluje herní výkon lineárně s počtem TFLOPS. Reálně asi bude nárůst herního výkonu nižší, protože budou důležité také ROP, paměťová propustnost (GPU bude mít 256bitovou sběrnici s 16 GB GDDR6), respektive zde ještě účinnost a kapacita Infinity Cache. Očekává se, že herní výkon by proti Radeonu RX 6900 XT měl stoupnout o víc jak dvojnásobek, a možná o výrazně více než o dvojnásobek – ale přesný nárůst teď nikdo neví.
V příští generaci masivně zrychlí obě značky
Takto veliké nárůsty výkonu po dvou letech nejsme zvyklí vídat, takže to teď může znít nepravděpodobně. Ale je třeba si uvědomit, že to bude spojeno s navýšením spotřeb (u Nvidie možná až dvojnásobným; AMD se doufejme zblázní o trošku méně, ale kdo ví). To přímo přináší nárůsty výkonu. A druhá věc, kterou je třeba vzít do úvahy, je, že podobně velké skoky udělají obě značky.
https://twitter.com/greymon55/status/1520415432335032320
Více než dvojnásobné nárůsty výkonu budou tedy i u grafik od Nvidie. Tam má nejvýkonnější GPU architektura Ada/Lovelace mít 18 432 shaderů. A jak teď také uvádí Greymon55, také Nvidia zřejmě díky použití 5nm procesu TSMC dosáhne velmi vysokých frekvencí, které by prý možná mohly být dokonce blízko těch u Radeonů, možná až třeba 2,8 GHz.
https://twitter.com/kopite7kimi/status/1520046285667336193
Podle dalšího leakera Kopite7kimi není vůbec nepravděpodobné, že by se Nvidia mohla vybičovat na hrubý/teoretický výpočetní výkon dokonce až 100 TFLOPS. Toto je sice jen odhad, a ne přímo „únik“, ale ilustruje to, že ta informace o třeba 2,5× mezigeneračním nárůstu výkonu u budoucího Radeonu RX 7900 XT nemusí být nějaký šílený nerealistický sen fanoušků, ale spíš nutnost k tomu, aby AMD drželo krok s vývojem.
Zdroje: VideoCardz, Greymon55, Kopite7kimi