Čipletové Radeony „Navi 31“ prý můžou mít až 3× víc jednotek, 15 360 shaderů

26. 7. 2021

Sdílet

 Autor: AMD
Příští generace grafik Nvidia GeForce RTX sice prý bude mít dvakrát lepší výkon, což byl normálně drtivý skok. ale teď máme informaci, že next-gen Radeony prý zase budou mít dokonce třikrát výpočetních jednotek. Kdo bude mít vyšší výkon, teda zdaleka není uzavřené.

Nedávno jsme tu měli zprávu, že příští generace grafických karet Nvidia, GeForce RTX 4000, má přinést až 2× navýšení výkonu. Ani to ale nemusí stačit, aby měla jisté výkonnostní prvenství. I AMD prý totiž chystá velký mezigenerační skok. Podle aktuálních zpráv by prý mohlo Navi 31, next-gen highendové GPU s architekturou RDNA 3 zvýšit počet výpočetních jednotek až 3× proti dnešku, takže nárůst výkonu by mohl být brutální.

Dosud se na internetu objevovaly informace (nebo možná spíše dohady), že by Navi 31 mělo být čipletové GPU, které by používalo dva čiplety s výpočetních jednotkami, každý prý se 80 CU (5120 shadery), šlo by tedy o něco jako dvojici Navi 21 (Radeonů RX 6900 XT) v jednom. Čipletová stavba asi stále platí, ale nyní od twitterových leakerů přicházejí informace, že čiplety budou mít jiný počet jednotek.

RDNA 3 už bez tradičních CU, až 2×7680 shaderů?

Zatímco Navi 21 má čtyři Shader Enginy, v každém dvojici Shader Arrays a v těch pak po 10 CU (CU = Compute Unit), kde každá má 64 shaderů – celkem tedy 80 CU a 5120 shaderů. Leaker KittyYYuko ale teď uvádí, že jeden čiplet Navi 31 by mohl být místo toho šest největších stavebních bloků (Shader Enginů?) a v nich v každém 10 podbloků, takže celkově 60. ovšem jeden z těchto podbloků už asi nemusí být „CU“, má totiž obsahovat 128 (4×32) shaderů místo 64.

Galerie: GPU architektura RDNA (Navi) a Radeony RX 5700 (prezentace na E3 2019)

Údajně by to mohlo 60 Workgroup Processorů. V architektuře RDNA 2 a RDNA se jako jeden Workgroup Processor označuje dvojice CU. Proto se nyní spekuluje, že Navi 31 a jeho nová architektura RDNA 3 by už nemusely uvádět CU jako základní stavební jednotku a tou by se místo toho stal až Workgroup Processor. Samotné shadery by v něm ale asi pořád byly organizované do jednotek SIMD se šířkou 32 (takže 32 shaderů) a vykonávaly by warpy/wavefronty o šířce 32 (takže by je jednotky zpracovávaly v jediném průchodu). Změna by tedy byla, že místo Workgroup Processoru o dvou CU, kde každá obsahuje dvojici SIMD32, bude nyní jeden Workgroup Processor se čtyřmi SIMD32.

https://twitter.com/KittyYYuko/status/1419594089163489284

Pokud se toto potvrdí, tak 60 WP neboli ekvivalent 120 starých CU pro jeden čiplet znamená 7680 shaderů v jednom čipletu a má-li Navi 31 být složené ze dvou, pak maximální plnotučná konfigurace pojede na oněch 15 360 shaderech. Výkon by mohl být proto velmi vysoký, není vyloučeno, že by dokonce narostl víc než 2× pro nynějším nejrychlejším Radeonům, tedy relativně více, než má být ono zrychlení u GeForce RTX 4000.

Schéma GPu Navi 21 Schéma GPU Navi 21 (Zdroj: AMD/AnandTech). Můžete vidět organizaci do čtyři Shader Enginů. Workgroup Processor (dvě CU) je označený jako "Dual Compute Unit"

Zatím pozor na predikce výkonu

Zatím je ovšem na místě opatrnost a asi by se nemělo předpokládat, že výkon těchto grafik poroste lineárně s počtem shaderů (takže by grafika s 15 360 shadery měla třikrát tak vysoký výkon jako Radeon RX 6900 XT s 5120 shadery). Jednak mohou být limitem paměti, vedle toho také TDP (spotřeba) nebo jiné architektonické „bottlenecky“, než je výkon shaderových jednotek. Ale protože jde o čipletové GPU, také by zejména škálování výkonu mohlo být horší kvůli tomuto aspektu.

Také ale nevíme, jak by případné navýšení počtu shaderových ALU fungovalo. Vzpomeňte si například na zdvojnásobení počtu FP32 jednotek v architektuře Ampere grafik GeForce RTX 3000. U těch byla druhá sada FP32 ALU přidána do pipeline, která již v Turingu a Voltě zpracovává celočíselné (INT) operace, a ačkoliv se zdvojnásobením FP32 zdvojnásobil teoretický výkon v TFLOPS udávaný „v papírech“, reálný výkon ani zdaleka nestoupl o takovýto kus. Stejné nebo podobné by to mohlo být i u reorganizace GPU, kteout prý teď chystá AMD. RDNA 3 může proto se stejným počtem jednotek dosahovat nižšího výkonu než RDNA 2. To je třeba brát v úvahu o onoho údajného highendového GPU s 15 360 shadery.

Každopádně jsou toto vše hodně předběžné informace, a tak je třeba je brát s obzvlášť dobře nafoukanou rezervou a počítat s tím, že se nakonec realita může dostavit v poněkud jiné podobě.

Schematická vizualizace GPU AMD Navi 21 s architekturou RDNA 2 Schematická vizualizace GPU AMD Navi 21 s architekturou RDNA 2 (Zdroj: AMD)

RDNA 3 je pořád plánovaná na podzim 2022

Příchod těchto GPU na trh se očekává v druhé polovině a pravděpodobně až čtvrtém kvartálu roku 2022. Vedle Navi 31, (což bude čipletové řešení s dvěma výpočetními čiplety, jak už bylo řečeno) má existovat minimálně ještě Navi 33. To by měl být buď monolitický méně výkonný návrh, nebo snad řešení s jen jedním výpočetním čipletem (který by pak mohl být společný s Navi 31 a tudíž by taková grafika mohla mít v plné konfiguraci 7680 shaderů).

ICTS24

Navi 33 údajně čeká tape-out v Q4 2021, zatímco tape-out čipletového Navi 31 by snad mohl být dříve. KittyYYuko uvádí ještě, že by mohlo existovat Navi 32, které by asi mělo tape-out ještě o něco později (možná v Q1 2022, takže by na trh mohlo jít třeba až v Q1 2023), ale u něj nemáme moc představu, jak velké/výkonné GPU by to bylo.

Zdroje: KittyYYuko (1, 2), VideoCardz