GeForce RTX 4000 budou mít vlastní verzi Infinity Cache, Lovelace má až 96 MB L2 Cache

2. 3. 2022

Nová generace grafik Nvidia GeForce bude mít stejnou tajnou zbraň, díky které před rokem tak překvapily Radeony RX 6000.

Dnes jsme už psali o specifikacích GPU Nvidia Lovelace získaných ze zdrojových kódů ovladačů, které firmě ukradli hackeři a poté zveřejnili. Mezitím byla objevená další zásadní věc. Architektura Lovelace přinese velkou novinku: výrazně zvětší paměti cache. To dovolí dosáhnout se stejnou fyzickou propustností pamětí vyššího výkonu. Nvidia de facto chystá vlastní verzi Infinity Cache, uvedené v GPU architektuře RDNA 2 od AMD.

Kód v připravovaných ovladačích ukazuje že GPU architektury Lovelace, nebo možná spíš Ada (začíná to vypadat, že Nvidia se kloní k tomuto značení) budou mít v maximální konfiguraci až 96 MB „Nvinfinity“ Cache. Její funkce by asi měla být stejná jako u AMD, tedy držet přímo na čipu velkou část „horkých“ dat, s nimiž GPU při vykreslování her pracuje, a tím uspořit potřebu přístupů do paměti.

Podle experimentů AMD prý 128MB Infinity Cache způsobuje, že se GPU s 512GB/s propustností chová jako by mělo propustnost dvojnásobnou nebo i vyšší. Takováto cache sice na čipu zabere hodně místa (v kterém by jinak možná mohly být výpočetní jednotky), ale měla by zlepšovat energetickou efektivitu i výkon. A teoreticky může výsledné GPU i zlevnit, protože se může použít o něco užší paměťová sběrnice s levnějším PCB a méně paměťovými čipy. To, že se Nvidia přikloní k podobnému řešení, asi potvrzuje, že zde mělo AMD správný instinkt.

Ještě nevíme, jestli obdoba/nápodoba u Nvidie bude mít také nějaké speciální jméno. Podle ovladačů jde o zvětšenou L2 cache (u AMD by Infinity Cache snad měla být L3 cache). Tato velká L2 cache bude podle všeho mít kapacitu závisející na šířce paměťového řadiče. Minimálně u části GPU by vždy na každých 64 bitů paměťového řadič mělo připadnout 16 MB L2 cache. To znamená, že highendový čip AD102 s 18 432 shadery a 384bitovou paměťovou sběrnicí dostane 96 MB L2 cache. U architektury Ampere byla L2 cache v 512KB blocích pro každých 32 bitů řadiče (což je jeden kanál), celkově jen 6 MB. Rozdíl tedy bude diametrální, i když celková kapacita bude nakonec nižší, než mělo AMD v nejvýkonnější implementaci architektury RDNA 2 (čip Navi 12 obsahuje 128 MB Infinity Cache).

https://twitter.com/xinoassassin1/status/1498850983052341249

Podle této matematiky by tedy další čipy architektury Ada/Lovelace měly mít nižší kapacity L2 cache. AD103 s 10 752 shadery a 256bitovými paměťmi bude mít 64MB L2 cache, AD104 (7680 shaderů) se 192bitovými pamětmi by pak dostal 48 MB. Malé čipy AD106 a AD107 mají údajně 128bitovou sběrnici, takže by měly nést 32 MB L2 cache – pokud ji Nvidia třeba u druhého ještě víc neočeše třeba na polovinu, jako to u levnějších GPU (Navi 23, Navi 24) udělalo AMD. Případně by asi velká cache u nich mohla být vypuštěná pro zlevnění – nabízelo by se, že levnější čip AD107 by mohl být bez velké cache. Ale toto už je jen spekulace. Je možné, že Nvidia zachová úplně stejnou konfiguraci kapacity na kanál pamětí u všech GPU.

GPU architektury Ada/Lovelace budou vyráběná 5nm procesem TSMC, který jim dodá značné zlepšení energetické efektivity proti ne úplně nejlepšímu 8nm procesu Samsungu použitém v GPU Ampere – může jít o skok odpovídající generaci a půl až dvěma generacím výrobního procesu. 5nm proces zároveň zmenší velikost buněk SRAM této cache na čipu, takže pomůže snížit její dopad na plochu a cenu čipu. Zabraná plocha by měla být o dost nižší než u Infinity Cache v nynějších 7nm GPU od AMD.

GPU Nvidia GA103 (Zdroj: Geekerwan)

Čip AD102 má 600 mm² po optimalizacích

Podle leakera Kopite7kimi Nvidia také údajně udělala určité optimalizace v čipu, které mají ušetřit plochu, ale také kontakty BGA pouzdra. Z GPU (včetně nejvyššího AD102) údajně úplně vypadla konektivita NVLink a Nvidia prý snížila i počet obrazových výstupů, ale nevíme na kolik.

https://twitter.com/kopite7kimi/status/1498888852177518593

Potřeba šetřit kontakty na čipu má ovšem ne úplně potěšitelný důvod – prý je to proto, aby bylo k dispozici více kontaktů pro napájení. Jinými slovy, aby GPU mohlo spotřebovávat více energie. Celkově GPU AD102, tedy nejvýkonnější verze Ada/Lovelace a GeForce RTX 4000, má mít plochu „jen“ asi 600 mm². Toto uvádí přímo leaker Kopite7kimi, jenž je velmi spolehlivý.