Nejvýkonnější GPU architektury AMD RDNA 3 je překvapivě malé. Problém pro Radeony?

21. 7. 2022

Sdílet

 Autor: Fritzchens Fritz, použito se souhlasem autora - public domain
Čím větší jsou čipy GPU, tím vyšší mají výkon. Teď jsme se ale dozvěděli plochu 5nm křemíku nejvýkonnějšího 5nm GPU od AMD a číslo je to hodně malé. Budou Radeony RX 7000 mít proti Nvidii problém, nebo je to chytrá strategie?

Zatím není jasné, kdo v příští generaci GPU bude mít výkonnostní prvenství. Nelze zanedbávat dlouhodobé dominantní postavení (a hlubší kapsy) Nvidie, ale vodítkem by mohla být i velikost čipů. Překvapivě se zdá, že AMD má 5nm křemík výrazně menší, možná dokonce jen poloviční proti tomu, co na 4nm procesu chystá Nvidia. Ovšem první pohled může klamat, vzhledem k tomu, že generace RDNA 3 není tvořená jedním čipem, nýbrž čiplety.

Highendová GPU Nvidie tradičně bývala větší než 600 mm², což bývala dlouho téměř maximální praktická velikost čipu. Později Nvidia dokonce tyto limity prolomila, nejvýkonnější Turing TU102 měl velikost 754 mm², byť generace Ampere už tak rozšafná nebyla, GA102 má plochu jen 628 mm². Jak velký bude čip AD102 generace Lovelace, který tentokrát použije špičkovou 4nm technologii, zatím nevíme.

Navi 31 (GCD) měří jen něco přes 350 mm²?

AMD, zdá se, z nějakého důvodu tak velké čipy neprodukuje. Vega 10 měla plochu jen 495 mm² a Navi 21 jen 520 mm². Vyvstává tak otázka, zda takto AMD nepřichází o výkon. Ještě víc takové obavy možná vzbudí generace RDNA 3. Její nejvýkonnější GPU s označením Navi 31 má podle leakerů, kteří teď tyto informace zveřejnili, plochu jenom 350 mm² (nebo asi o něco málo více). Pokud by tedy Nvidia v generaci Lovelace zase vyrobila 700 mm² velký 4nm highendový čip, byl by 5nm highendový křemík od AMD jen poloviční.

https://twitter.com/greymon55/status/1549190072204795911

AMD možná pořád nevyužívá všechen potenciál, který by mohlo, ale v tomto případě má asi překvapivě malá velikost čipu svoje opodstatnění. Navi 31 je totiž čipletové, takže jde o podobný případ jako například u Ryzenů 5000. Ty jsou tvořené jen maličkými 80mm² kusy křemíku (pravda, 12- a 16jádrové modely je mají dva) díky tomu, že část funkcí byla vykopnutá mimo do pomocného čipletu vyráběného starší a levnější technologií.

Ona 350mm² plocha Navi 31 platí pro jeho hlavní 5nm část, nazvanou GCD (asi Graphics Compute Die). A tak je takto malá údajně díky tomu, že z ní byla vyjmuta Infinity Cache a paměťové řadiče, které se nacházejí v šesti malých čipletech MCD osazených zvlášť, což AMD nedávno nepřímo potvrdilo. MCD jsou vyráběné levnějším 6nm procesem. Pokud by AMD vše implementovalo do jednoho 5nm křemíku, asi by už mohl být v onom 500–600mm² pásmu. Kombinace 5nm a 6nm čipletů by ale měla vyjít levněji na výrobu. Možná, že to bude důležitá výhoda v konkurenčním boji proti monolitickým 4nm GeForce RTX 4000.

Zatím nevíme, jakou plochu křemíku přidává šest MCD čipletů k 350mm² čipletu GCD. Obsahují 64bitový paměťový řadič (celkově je tedy šířka pamětí 384 bitů) a také snad 32MB blok Infinity Cache. Pokud by měly plochu například 30 mm², dostali bychom se na celkovou velikost křemíku 530 mm². Nicméně reálně by to mohlo být víc, pokud je k propojení použit křemíkový interposer nebo můstky. Podle některých drbů by dokonce AMD mohlo navíc k šesti MCD ještě použít 3D V-Cache, zvětšující kapacitu Infinity Cache. Pak už by se celková plocha (ovšem složená zhruba půl na půl z dražšího 5nm a levnějšího 6nm křemíku s nižší hustotou tranzistorů) mohla možná blížit 700 mm².

GPU Vega 10 (zdroj: TechPowerUp)

RDNA 3 bude efektivnější na plochu křemíku

Nicméně tato čipletová disagregace prý není jediným důvodem, proč je GCD překvapivě malý. AMD prý hodně zapracovalo na zmenšení plochy, kterou zabírají samotné výpočetní a grafické jednotky v rámci čipletu GCD. Proti architekturám RDNA a RDNA 2 bylo prý odstraněno poměrně dost legacy funkcionality.

https://twitter.com/Kepler_L2/status/1549334335957995521

Podle patchů zaslaných do ovladačů pro Linux architektura RDNA 3 odebrala podporu pro legacy geometrickou pipeline, legacy scan converter a také neobsahuje sdílenou paměť Global Data Share (GDS). Je pravděpodobné, že bloky těchto funkcionalit byly přímo odstraněny z křemíku, zatímco v RDNA a RDNA 2 ještě jsou. AMD prý také do GPU generace RDNA 3 neintegrovalo podporu koherentního propojení xGMI (což je v podstatě Infinity Fabric). Konektivita xGMI byla používaná dvoučipovými grafikami Radeon vyráběnými pro Apple, což teď evidentně AMD považuje za zbytečné.

Je otázka, zda xGMI chybí také v menším GPU Navi 32. Objevily se totiž zprávy, že by AMD mělo pracovat na výkonnějším GPU, než je Navi 31, jehož označení zatím není známo, pracovně se mu tedy říká Navi 3x. To má údajně 16 384 shaderů, což by mohlo znamenat, že je tvořeno párem GCD z GPU Navi 32 (jeho GCD má totiž 8192 shaderů, zatímco GCD od GPU Navi 31 obsahuje 12 288 shaderů).

Na druhou stranu, podle leakera Keplera AMD v generaci RDNA 3 žádné GPU složené ze dvou GCD neplánuje. Možná, že Navi 3x, existuje-li vůbec, je tedy tvořeno dalším větším GCD, nebo to třeba jsou jen dvě GPU Navi 32 vedle sebe, což by mohlo být použitelné pro výpočetní karty a pracovní stanice, ale herní karty na takovém základě asi fungovat nebudou.

bitcoin školení listopad 24

Jak se vydání Radeonů RX 7000 blíží, mělo by k nim unikat více podrobností, které snad tyto otázky zodpoví. Jak čipletová GPU RDNA 3 dopadnou, bychom se mohli dozvědět na podzim či v závěru roku.

Zdroje: Kepler (1, 2), Greymon55, VideoCardz