GeForce RTX 5090 prý bude o 70 % výkonnější než RTX 4090, GPU Blackwell použije čiplety

18. 9. 2023

Co čekat od nové generace grafik GeForce, kterou teď Nvidia chystá? Na internet už probublávají zvěsti, dokonce o výkonnostním nárůstu, který má generace Blackwell přinést.

Na novou generaci grafik Nvidia se tentokrát zřejmě bude čekat o něco déle, protože podle (oficiální) roadmapy Nvidie je plánovaná až na rok 2025 místo na podzim 2024. Přesto se ale začínají objevovat informace o těchto chystaných GPU, která budou mít jak ve výpočetní, tak v herní oblasti architekturu Blackwell. A dokonce i predikce výkonu, který by měla přinést oproti současné generaci grafik GeForce.

Zvěsti o next-gen GPU Nvidie se objevily současně ze dvou zdrojů. Prvním je Kopite7kimi, leaker na Twitteru, který je nejspolehlivějším zdrojem o plánech Nvidie za posledních několik let (což se ukázalo úniky ke generacím RTX 3000 i RTX 4000). Kopite7kimi dnes přišel s dvěma informacemi k architektuře Blackwell.

Stejná struktura, víc výkonu na jednu jednotku?

Tou první je, že tato GPU by nemusela zvýšit počet výpočetních jednotek v jednotlivých čipech celé sestavy GPU, nebo ne nějak razantně. Architektura Blackwell se totiž údajně zaměří na architektonické změny a vylepšení na úrovni jednoho „jádra“ či výpočetní jednotky, možná by se dalo říct „IPC“ celého GPU. To znamená, že hypoteticky by se třeba nezvýšil počet shaderů u určitého GPU nebo modelu, ale narostl by místo toho výkon na jednu jednotku.

Přesněji řečeno, Kopite7kimi mluví o tom, že se „nezvýší významně“ počet jednotek, jako jsou bloky GPC nebo TPC. Toto jsou stavební bloky GPU Nvidia, současný nejvýkonnější čip AD102 například obsahuje fyzicky 12 bloků GPC (Graphics Processing Cluster) a v každém z nich je šest nižších jednotek TPC (Texture Processing Cluster), které se ještě dělí na dva bloky SM (které mají v architekturách Ampere a Ada Lovelace po 128 shaderech).

Pokud má tento únik pravdu, pak by se asi moc nezměnily tyto základní parametry a nové nejvýkonnější GPU, které by mělo být označeno GB202, může opět být tvořeno 12 GPC po šesti TPC. Není ale asi vyloučeno, že by pak na jeden blok připadalo více shaderů – třeba 192 místo 128 (o tom za chvíli). V takovém případě by pak GPU stále se 144 SM neslo o polovinu víc shaderů (27 648).

Schéma GPU AD102

Autor: Nvidia

Pro orientaci další GPU generace Ada Lovelace: Méně výkonný AD103 s 256bitovou paměťovou sběrnicí obsahuje oficiálně sedm GPC se šesti TPC, ale celkem jen 80 bloků SM (konfigurace není 100% symetrická). 192bitový čip AD04 je složen z šesti GPC, kde každý má pět TPC, celkem 60 bloků SM. Je tedy možné, že generace Blackwell toto bude kopírovat, ale je třeba říct, že čip GB204 prý nebude existovat – ale jeho parametry by třeba mohl převzít následující GB206 v řadě, kdo ví.

Tato politika konfigurací čipů co do počtů GPC a TPC by u Nvidie nebyla úplně překvapením. Generace Ada například dost připomíná čipy Ampere, jen se každá konfigurace posunula o kus dolů (a zúžila se paměťová sběrnice). Například AD103 má jednotek jako GA102, AD104 se podobá GA103.

Je asi dobré ještě zdůraznit, že Kopite7kimi neříká, že počty jednotek budou zcela beze změny, jen že se nezmění příliš. Není proto vůbec vyloučeno, že zde budou odchylky (a tím pokroky v počtech). Také je klidně možné, že mohou (zhruba) sedět počty výpočetních jednotek, ale výrazně se změní kapacity cache, nebo šířka paměťových sběrnic. Nejvýkonnější GB202 by prý mohlo mít už 512bitovou paměťovou sběrnici.

Poprvé vícečip(let)ové GPU

Druhá novinka od Kopite7kimiho se týká výpočetní větve pro servery, čipu GB100. Ten bude určený pro akceleraci AI a nemusí mít grafické a raytracingové bloky, jde o nástupce výpočetního GPU Hopper (Nvidia, zdá se, v roadmapě střídá fáze, kdy herní a výpočetní GPU mají rozdílnou architekturu a fáze, kdy je společná). GB100 architektury Blackwell podle Kopite7kimi poprvé použije čiplety – bude se tedy skládat z více kusů křemíku. Respektive, není jasné, zda je použito nějaké pokročilejší pouzdření (propojování čipletů). Teoreticky by mohlo jít jen o spojení dvou samostatně funkčních GPU dlaždic na jedno pouzdro, pak by se asi dalo mluvit spíše o vícečipovém modulu (MCM). V herních GPU zatím tato změna koncepce asi ještě přítomná nebude, zdá se, že jsou stále monolitická.

Dvojčipové výpočetní GPU: AMD Instinct MI200 v provedení OAM

Autor: AMD

Projekce výkonu GeForce RTX 5090?

Tolik Kopite7kimi. Vedle něj se ozval ještě další zdroj, a sice čínský leaker Panzerlied, který před časem přinesl informaci o tom, že v generaci Blackwell / RTX 5000 bude chybět GPU GB204. Toto pak Kopite7kimi potvrdil, takže je patrně důvod popřát tomuto zdroji také sluchu, i když ho je třeba asi brát s větší rezervou.

Podle Panzerlieda by prý GeForce RTX 5090 mohla mít zhruba následující nárůsty v parametrech proti GeForce RTX 4090: Paměťová propustnost má prý narůst o 52 % (1,54 TB/s?), frekvence GPU prý cca o 15 % (což by dávalo boost někde okolo 2,9 GHz?), kapacita cache o 78 % (128MB L2 cache?) a „škála“ prý bude o 50 % vetší, což by možná mohlo znamenat počet výpočetních jednotek. Pokud je pravda to, co říká Kopite7kimi, tak by možná mohlo jít o 50% navýšení počtu shaderů přítomných v jednom SM (nebo třeba tři SM na jeden blok TPC?).

Celkově by prý GeForce RTX 5090 mohla mít o 70 % lepší výkon (opět asi jen zhruba). Otázka je samozřejmě, odkud tyto údaje jsou, není jisté, zda nejde jen o spekulaci. Nvidia by teoreticky mohla něco podobného sdělovat interně partnerských výrobcům karet, kteří se připravují k výrobě těchto modelů, nebo výrobcům herních PC, u kterých chce dopředu uzavřít na dodávky těchto GPU kontrakty – samozřejmě by to bylo pod NDA. Takováto čísla by pak ale byla pouze předběžná, mohla by v nich být nějaká rezerva, takže nakonec karty mohou dopadnout lépe. A je zde samozřejmě i riziko, že se něco nepovede a produkt bude o něco slabší, než interní predikce. Je však pravda, že u GPU se pak dá dost „napravit“ zvýšením TDP coby plánem B (takže ve finále mohou vyjít projekce výkonu, ale ne energetické efektivity).

Jak už ale bylo řečeno, toto zatím berte s velkou rezervou. Pokud mají karty jít do prodeje až v roce 2025, jsou ještě víc jako rok daleko a na stanovení jejich finálního výkonu je ještě velmi brzy. Nvidia může ještě s výkonnostními cíli sama různě hýbat podle situace na trhu. Oněch 70 % je proto asi všechno, jen ne tesáno do kamene.

Zdroje: Kopite7kimi (1, 2), Chiphell, VideoCardz (1, 2)