RDNA 3 místo RDNA 2 v Radeonu RX 7600 – je to jedno? Výpočetní testy říkají, že ne

1. 6. 2023

Sdílet

 Autor: AMD
Že je u RDNA 3 malý nárůst výkonu? Radeon RX 7600 ve výpočetních testech skáče běžně o 50 % proti RX 6650 XT, jak jsme zjistili.

Teprve dokončujeme recenzi Radeonu RX 7600 (v provedení Pulse od Sapphire), ale vyrobili jsme malé preview, které vám ukážeme už teď. Týká se jedné dílčí oblasti, která by se v celé recenzi asi dala i snadno přehlédnout, totiž testů této grafiky ve výpočetních aplikacích. Vypadá to, že v nich nová karta vykazuje lepší než typické nárůsty výkonu. Objevily se názory, že GPU Navi 33 nepřineslo nic nového prosti čipu Navi 23, ale tady to vypadá na opak.

Při procházení výsledků ze stovek testů, které máme v testech v grafech, jsme si všimli, že v porovnání s tím, jaké výsledky má Radeon RX 7600 typicky ve hrách (o tom až v kompletní recenzi), vycházejí překvapivě vysoké nárůsty výkonu v některých – i když také ne všech – výpočetních aplikacích. Tím nemyslíme, že by tato levná karta najednou nějak drtila GeForce RTX 4090 nebo něco podobného, ale na procenta tato zlepšení proti předchozí kartám s Navi 23 (například Radeonu RX 6650 XT) vycházejí jednoduše příznivější než ve hrách.

Nemáme žádnou exaktní analýzu, která by to vysvětlovala s jistotou, ale nejvíce se nabízí to vysvětlení, že tímto o sobě dává vědět právě nová architektura RDNA 3 a změny, který v ní jsou proti architektuře RDNA 2 nacházející se v kartách s čipem Navi 23 (Radeon RX 6650 XT, RX 6600 XT…). Věnovali jsme se jim už zde.

Výpočetní jednotky CU (Compute Unit) architektury RDNA 3 jsou výrazně přepracované. Od prvních GPU architektury GCN téměř před 11 lety měl blok GPU vždy 64 shaderů („ALU“). RDNA 3 přináší u SIMD jednotek, které poskytují ony „shadery“, poprvé schopnost zpracovávat dvě instrukce za jeden cyklus. Stejně jako u RDNA 2 jsou na to použité dvě 32-wide SIMD jednotky, ale se schopností „dual issue“, tedy zpracovat současně dvě instrukce. Mají tím teoretický výpočetní výkon až jako 128 shaderů místo dosavadních 64.

Nicméně toto zdvojení „ALU“ či shaderů je provedeno v rámci struktury CU vycházející z předchozích generací, takže 64 těchto dual-issue shaderů, které by teoreticky mohly konat práci 128, sdílí některé řídicí a výpočetní struktury, které u RDNA 2 obsluhovaly jen 64 shaderů. A hlavně je tato schopnost dual-issue zatím poměrně nepružná a má různá komplikovaná omezení a požadavky na instrukce, které mohou být vykonány zároveň. Proto tedy 64 těchto shaderů RDNA 3 má v praxi o dost menší váhu relativně k výslednému výkonu, než by mělo 128 shaderů RDNA 2. Sice se tedy zdvojnásobuje počet TFLOPS, které GPU s dual-issue může teoreticky počítat, ale v praxi z nich bude vytěženo mnohem méně – obvykle.

Ve hrách se zatím přínos této architektonické změny projevuje dost málo, jak je vidět na herních testech, kde se „IPC“ (čili výkon GPU na jeden shader a 1 MHz), zdá se, u RDNA 3 o moc nezvedlo. Pro ovladače AMD je evidentně obtížné ve hrách, které mají velké množství různých shaderů, dual-issue nějak častěji uplatňovat.

Relativně lepší výsledky Radeonu RX 7600 ve výpočetních aplikacích by ale mohly ukazovat, že takovéto programy jsou schopné dual-issue využít častěji. Může to být proto, že nemají tolik různorodého kódu, takže například hlavní algoritmy a smyčky Blenderu je snadnější optimalizovat tak, aby se některé instrukce zpracovávaly v režimu dual-issue.

Radeon RX 7600 ve výpočetních aplikacích

Radeon RX 7600 ve výpočetních aplikacích

Autor: Cnews

Nadprůměrné nárůsty výkonu s architekturou RDNA 3 v našich testech jsou nejspíš doklad toho, že alespoň v některých případech se dual-issue už ve výpočetních aplikacích uplatňuje. Je tu jeden důvod, který tuto myšlenku podporuje. Analogická situace byla totiž s architekturou Ampere od Nvidie. Ta také zdvojnásobila počet FP32 shaderů, i když technické detaily se lišily. I tehdy ale reálný přínos ve hrách byl poměrně omezený a ani zdaleka nedocházelo ke zdvojnásobení výkonu.

A snad podobně dnešní situaci se i tam přínos projevil mnohem výrazněji v některých výpočetních aplikacích než ve hrách. Na velké nárůsty výkonu v různých testech CUDA a OpenCL aplikacích si možná ještě vzpomenete. Toto tedy ukazuje na odlišný charakter výpočetních aplikací v porovnání s hrami, který možná stojí i za atypickými výkonnostními nárůsty ve výpočetních aplikací na architektuře RDNA 3 v Radeonu RX 7600 a čipu Navi 33.

Berte to tedy tak, že architektura RDNA 3 / Navi 33 může mít určitý potenciál navíc proti RDNA 2 a Navi 23, takže se rozhodně nedá říct, že by mezi starším a novějším čipem bylo prašť nebo uhoď, který budete mít. Výsledky výpočetních aplikací mohou také ukazovat na určitý zatím nevyužitý potenciál, který by přece jenom časem mohl prosakovat i do těch her.

Možná by tedy i u RDNA 3 mohlo trochu dojít na onu často citovanou průpovídku, že ovladače zrají jako víno. Neberte to tak, že by GPU udělalo třeba za rok, za dva nějaký extrémní skok. Ale pozvolné zlepšování výkonu (konzervativně si přestavme třeba 5–10 %?), o které by si RDNA 3 časem polepšila v porovnání s výkonem u RDNA 2, by mohlo být docela realistické. Zaručit vám to ale samozřejmě nemůžeme.

bitcoin školení listopad 24

Teď už tedy jen bez dalšího komentáře některé z relevantních grafů, které budou v celé recenzi a přišly nám zajímavé.

Autor: Cnews
Radeon RX 7600 ve výpočetních aplikacích

Radeon RX 7600 ve výpočetních aplikacích

Autor: Cnews
Radeon RX 7600 ve výpočetních aplikacích

Radeon RX 7600 ve výpočetních aplikacích

Autor: Cnews
Radeon RX 7600 ve výpočetních aplikacích

Radeon RX 7600 ve výpočetních aplikacích

Autor: Cnews

Zdroje: vlastní