Už před víkendem jsme referovali o odhalení prvních grafik AMD z nové generace Radeon RX 7900 a také o jejich architektuře RDNA 3. AMD ale minulý týden ještě nezveřejnilo všechno. Pod NDA dostali novináři podle všeho i další informace o GPU Navi 31, na kterém jsou Radeon RX 7900 XT a XTX založené. Včetně diagramu GPU, který teď prosákl na veřejnost a ukazuje některé další novinky, které zatím zůstávaly tajné.
Tyto informace přinesl web VideoCardz, jemuž někdo předal fotografii schématu čipu Navi 31, který AMD ukazovalo v interní prezentaci pro média. Diagram má zejména zajímavé popisky a legendu, která odhaluje ty nové podrobnosti. Větší část sice už byla zveřejněna ve veřejné prezentaci, ale zdaleka ne vše.
Tip: Rozbor GPU architektury RDNA 3: Nová CU a Media blok, akcelerace AI, DP 2.1 pro next-gen 8K monitory
AMD také nepodporuje PCI Express 5.0
První věc: blokové schéma GPU Navi 31 potvrzuje, že opravdu nebude podporovat PCI Express 5.0, protože blok řadiče dole v schématu je popsán jako „PCIE GEN 4“ (čímž se myslí PCI Express 4.0). Radeony na tom tedy nakonec budou úplně stejně jako GeForce RTX 4000, u nichž Nvidia také zůstala jen u PCIe 4.0.
Vylepšení ROP a geometrie
Minulý týden AMD podle všeho nepředstavilo všechna zlepšení přítomná v architektuře či Navi 31. V popisu diagramu lze číst novou informaci, že Navi 31 přinese o 50 % vyšší výkon geometrického engine (zřejmě proti Navi 21, tedy nejvýkonnějšímu GPU generace RDNA 2) – ten má zpracovávat 12 primitiv za cyklus. Přítomná je také nějaká funkce nazvaná Multi Draw Indirect Accelerator (MDIA). Také se měla zdvojnásobit schopnost GPU odstraňovat z výpočtů geometrie primitivy a vertexy scény irelevantní pro výsledný obraz, například protože nejsou viditelné.
Zlepšení uvádí AMD i v rasterizaci ve smyslu ROP jednotek. Je podporováno rasterizování šesti primitiv za cyklus a může být vygenerováno až 192 pixelů za jeden cyklus – obojí by mělo být zlepšení o 50 % proti Navi 21.
Co je zmiňovaná funkce Pixel Wait Sync, ještě nevíme. S ní je ale uvedená jako novinka také schopnost Random Order Opaque Exports, v jejímž případě už asi tušíme. Jde o to, že výsledky pixel shaderů je další fáze pipeline schopná přijímat v jakémkoli pořadí, takže mohou být vykonávány stylem „out of order“ a asi i paralelně, aniž by musela v pipeline být přítomná nějaká mezifronta, ve které by se řadily. Toto je potvrzení funkce, o které už mluvily před pár měsíci úniky jako o „OREO“ (Opaque Random Export Order).
Větší cache
Při prezentaci AMD veřejně sdělilo, že zvětšilo objem registrů, s kterými GPU může pracovat (soubor registrů je o 50 % větší). Nepochlubilo s už, že zvětšené jsou i cache – s výjimkou Infinity Cache druhé generace, jejíž kapacita se o třetinu zmenšila ze 128 MB na 96 MB, ale měla by mít lepší propustnost a lepší politiku plnění a nahrazování dat.
Slajd se schématem píše, že Navi 31 má nově o 50 % větší L2 cache – 6 MB místo 4 MB v Navi 21. Tato cache je společná pro celé GPU. L1 cache byla údajně zvětšená rovnou o 300 % na 3 MB. Zde se bavíme ale ne o jednom bloku cache, ale o součtu L1 cache. V architekturách RDNA se L1 cache nachází vždy na úrovni shader array, což je sada bloků CU – tyto shader array jsou vždy dvě v každém shader enginu. GPU Navi 21 mělo čtyři shader enginy a tím pádem osm shader array, každý se 128kB L1 cache. U Navi 31 jednak máme víc shader enginů (6) a shader array (12), ale také mají jednotlivé L1 cache zdvojnásobenou kapacitu na 256 kB. Ono uváděné 3× zlepšení je tedy součtem samotného zvětšení kapacit a zvětšení počtu těchto cache v čipu.
A zvětšená je i L0 cache. Ta je zase přítomná vždy na úrovni jednoho workgroup processoru, což jsou dvě CU, které L0 cache sdílí. V architekturách RDNA 1 a 2 měla L0 cache 32 kB, ale RDNA 3 to zdvojnásobuje na 64 kB. Navi 31 obsahuje 48 workgroup processorů (96 CU), takže celkem to dělá 3 MB celkové kapacity všech L0 cache. Vychází to na 2,4× kapacity distribuované v Navi 21 (40 WGP × 32 kB = 1280 kB).
RDNA 3 prý přece jenom má dosahovat taktů přes 3 GHz?
A na konec jsme si nechali možná nejzajímavější položku. Tedy aspoň v tom kontextu, že neoficiální úniky před odhalením RDNA 3 mluvily o tom, že tato GPU budou mít velmi vysoké frekvence, což se ale nepotvrdilo. AMD u Radeonu RX 7900 XT a RX 7900 XTX oznámilo frekvence, podle nichž to spíš vypadá, že se takty nezlepšily, pokud dokonce nejsou horší než u čipů RDNA 2 v Radeonech RX 6000. Uváděný boost Radeonu RX 7900 XTX je jen 2500 MHz, ačkoliv předběžná šuškanda si byla takřka jistá tím, že takty budou nad 3 GHz – možná o hodně.
Schéma čipu Navi 31 ale opravdu uvádí něco trošku jiného, než co jsme viděli ve specifikacích karet. Architektura RDNA 3 je podle legendy na slajdu navržená tak, že je schopná dosáhnout frekvence přesahující 3 GHz. Takže nakonec drby mohly mít nějaký reálný základ. Otázka je, proč tedy, je-li GPU schopno jít výš, toto není využité?
Stalo se snad, že sice čipy Navi 31 jsou schopné dosáhnout takto vysokých frekvencí, ale je to jen u malého procenta vyrobených čipů, takže nelze (aspoň zatím) vydat takový model komerčně? Nebo je to sice možné, ale spotřeba by byla neúměrně vysoká? Nebo snad GPU opravdu budou na 3 GHz boostovat, i když mají ve specifikacích boost jenom 2500 MHz? Nebo je to fungování nad 3 GHz něco, co se zrealizuje až v menších GPU s menším počtem jednotek? (Je pravda, že taková progrese frekvencí byla vidět mezi Navi 21, 22 a 23 v generaci RDNA 2.)
Nějaké odpovědi nebo náznaky odpovědí možná dostaneme, až se grafiky začnou prodávat a bude možné analyzovat průběhy frekvencí při hraní a obecně chování těchto GPU v reálu. Každopádně zatím tuto informaci o frekvenčním „potenciálu“ (nebo nenaplněném očekávání?) RDNA 3 berte spíš jako zajímavost a neslibujete si od toho, že po vydání nastane nějaké velké překvapení.
AMD pravděpodobně na prezentaci minulý týden ukázalo reálný výkon těchto grafik, takže i pokud se zjistí, že ve skutečnosti běží nad 3 GHz, už to bylo v jejich prezentovaných výsledcích téměř určitě zahrnuté.
Zdroj: VideoCardz