Specifikace GeForce RTX 4070, 4080 a 4090 unikly. Výrobní proces 4N má prý blíž k 5 nm

24. 6. 2022

Další střípky do mozaiky ukazující podobu next-gen grafických karet Nvidie. Už se konečně dozvídáme, jak budou vypadat levnější modely RTX 4080 a RTX 4070 i něco k výrobnímu procesu.

Máme tu další kolo úniků informací o chystaných nových grafikách Nvidie s architekturou Lovelace, které by měly přijít na trh během poslední třetiny letošního roku. To, že se informace pořád mění, sice nebudí moc důvěru, ale pocházejí od leakera, který byl co do plánů Nvidie v minulosti nejspolehlivější. Je tedy možné, že Nvidia samotná ještě neuzavřela specifikace, se kterými GeForce RTX 4000 přijdou na podzim na trh.

GeForce RTX 4090: víc jednotek

Aktuální znalosti jsou údajně takové, že Nvidia poněkud posílila konfiguraci zamýšlenou pro GeForce RTX 4090, která by v první vlně grafik s architekturou Lovelace měla být nejvýkonnější. Předchozí informace zněly, že bude disponovat 16 128 shadery / jednotkami FP32 (či jak říká Nvidia, CUDA jádry), což by bylo 126 bloků SM. Ovšem to se změnilo a Nvidia nyní plánuje tuto grafiku postavit se 16 384 shadery, tedy 128 SM.

Toto by bylo 88,9 % celkové „šířky“ použitého čipu GA102 a tato konfigurace se má jmenovat GA102-300. Plnotučný čip GA102 by prý měl mít 144 SM (18 432 shaderů) a snad by mohl být použitý v eventuální kartě GeForce RTX 4090 Ti nebo možná modelu Titan, které by prý mohly udělat comeback. Takový výkonnější model by možná pak mohl mít výrazně vyšší spotřebu až někde v pásmu 600–800 W, o níž se několikrát objevily zprávy.

Tip: Power Limity nové generace GPU Nvidia jsou až 800 W. I méně drahé karty můžou brát okolo 400 W

Naopak GeForce RTX 4090 má být na tyto poměry ještě „rozumná“. Spotřeba má údajně být 450 W, tedy „jen“ na té úrovni, kam ji letos takřka bezprecedentně vyhnala GeForce RTX 3090 Ti také od Nvidie. Pravda, toto jsou referenční parametry, ale hodně karet se prodává v podobě modelů s továrním přetaktováním, které mohou mít TDP vyšší, zvlášť pokud čip AD102 údajně umožňuje až 800W power limit.

Kde se specifikace zatím nezměnily, jsou paměti. RTX 4090 má používat 24 GB paměti GDDR6X na 384bitové sběrnici. Jejich efektivní frekvence bude údajně 21,0 GHz, takže propustnost bude 1008 GB/s.

Uniklé fotky chladiče Nvidia GeForce RTX 4090 Ti - základna (zdroj: Chiphell, via: VideoCardz)

Tip: První fotky GeForce RTX 4090 Ti: Nvidia neuhlídala chlazení pro grafiky Lovelace

GeForce RTX 4080: paměti GDDR6 místo GDDR6X?

Kopite7kimi poprvé uvádí specifikace pro levnější model GeForce RTX 4080. Ten má být již založený na jiném čipu, AD103, a to v konfiguraci AD103-300. Ta má 10 240 shaderů (80 SM; maximum čipu AD103 je asi 84 SM, jako mělo GA102). Je možné, že první karty budou používat i částečně deaktivované čipy AD102, než se výroba AD103 rozběhne. Pouzdra prý jsou kompatibilní, takže na PCB pro AD103 je možné čip AD102 posadit.

TDP této karty prý může být 420 W, což je ale asi starší informace (už jsme tu toto číslo pro RTX 4080 měli), Kopite7kimi ji zatím uvádí z otazníkem.

Tato karta bude mít 256bitové paměti a kapacitu 16 GB. Zajímavé je, že Nvidia prý podle Kopite7Kimi nepoužije GDDR6X, ale jen paměti GDDR6. Běžely by prý na frekvenci 18,0 GHz. Toto by znamenalo, že proti RTX 3080 dost klesne propustnost, který by byla jen 576 GB/s. Nicméně propad herního výkonu asi nehrozí, protože GPU architektury Lovelace zřejmě mají velmi velké kapacity cache – Nvidia, zdá se, napodobila Infinity Cache od AMD. A jeho GPU tato technologie dovolila dosáhnout stejných herních výkonů s výrazně menší propustností pamětí, což by se u Nvidie mělo projevit také.

Více: GeForce RTX 4000 budou mít vlastní verzi Infinity Cache, Lovelace má až 96 MB L2 Cache

GeForce RTX 4070 má prý jen 160bitové paměti

Zatím nejlevnější kartou, pro kterou má Kopite7kimi podrobnosti, je GeForce RTX 4070 (model RTX 4060 a další jsou asi až součástí další vlny, která ještě nepostoupila v přípravách tak daleko). Karta RTX 4070 má být založená na čipu AD104-275. Tento čip by snad měl mít 60 bloků SM a 7680 shaderů jako GA103 v nynější generaci (AD103 zase kopíruje počet SM čipu GA102).

https://twitter.com/kopite7kimi/status/1539853156275761152

Z tohoto počtu má ale karta GeForce RTX 4070 využívat jen 7168 (56 SM). Nepůjde tedy o plnou konfiguraci GPU, a to dokonce ani v případě paměťového subsystému. Nvidia totiž – a to je další změna proti předchozím informacím – nepoužije plnou 192bitovou sběrnici GPU, ale u RTX 4070 ji oseká na 160 bitů, tedy jen pět ze šesti 32bitových kanálů. Na sběrnici bude osazená také paměť GDDR6 s efektivní frekvencí 18,0 GHz, to dává propustnost 360 GB/s. I zde tedy klesne propustnost proti modelu RTX 3070 (ten měl 448 GB/s díky širší 256bitové sběrnici). Ale jak už bylo řečeno, díky velké cache by architektura Lovelace měla potřebovat méně paměťové propustnosti než Ampere.

TDP GeForce RTX 4070 by mělo údajně být 300 W, naopak tedy vyšší. Také všechny tři karty nové generace mohou stát víc než modely RTX 3000 – Kopite7kimi uvádí, že doporučené částky přinejmenším nebudou nižší než u generace Ampere.

Zatím tyto specifikace berte s rezervou, protože Nvidia může ještě věci měnit v reakci na to, co se dozví o kartách konkurence nebo jakou výtěžnost bude mít výroba.

Ilustrace čipu Nvidia GH100 (zdroj: Nvidia)

Výrobní proces 4N by mohla být custom verze N5P

Kopite7kimi uvádí jinak ještě jednu věc, která se týká výrobního procesu. Je možné, že karty budou vyráběné stejnou technologií jako výpočetní GPU Hopper (akcelerátor H100). Nvidia uvedla, že používá technologii 4N, což je její vlastní označení pro na míru upravený proces TSMC. Číslo indikuje, že proces by měl být chápán jako 4nm, nicméně podle Kopite7kimi je vyvinutý z procesu N5P, který ještě TSMC oficiálně bere jako 5nm. Toto údajně uváděly i starší dokumenty Nvidie a je možné, že k „přeznačení“ došlo až po letošním hacku Nvidie.

https://twitter.com/kopite7kimi/status/1506456170860474370

Pokud bude tedy výrobní proces stejný i pro GPU Lovelace, pak na GeForce RTX 4000 můžeme nahlížet i jako na 4nm, ale možná i jako na 5nm GPU. Je to otázka, protože 4nm proces TSMC je také sám o sobě jen evolučním vylepšením jeho 5nm procesu. Je možné, že některé úpravy, které jsou v procesu 4N zahrnuté, jsou i v „čistém“ 4nm procesu N4, takže pak by Nvidií používané označení 4N (to prohození písmen bude asi hodně plést…) mohlo být oprávněné. Je otázka, k čemu má tato custom verze 4N blíž, zda k N5/N5P, nebo k N4.

Zdroje: Kopite7kimi (1, 2, 3), VideoCardz