GeForce RTX 4000 poodhalené: Z hacknutých dokumentů Nvidie unikly specifikace GPU Lovelace

2. 3. 2022

Sdílet

 Autor: Nvidia
Právě jsme se nejspíš dozvěděli specifikace příští generace GPU Nvidia, 5nm čipů Lovelace, z kterých na podzim budou GeForce RTX 4000.

hacku interních serverů Nvidie, o kterém přišly zprávy minulý týden, se už dostaly na veřejnost některé informace o budoucích GPU. Měli jsme tu naposled zprávu o tom, že následující architektura chystaná po GPU Lovelace/Ada a Hopper bude Blackwell. Vypadá to, že z ilegálně vypuštěných souborů už se podařilo zjistit i specifikace blížících se GPU s novou herní architekturou Lovelace, které vyjdou na podzim jako GeForce RTX 4000.

Zvědavců, kteří se do hackery zveřejněných dat Nvidie pustili, asi bude víc. Na Twitteru se objevily specifikace například od těchto dvou uživatelů. Uvádějí počty bloků SM, což je základní stavební jednotka GPU od Nvidie. Pokud budeme předpokládat, že v jednom bloku SM bude nadále přítomných 128 shaderů jako v architektuře Ampere (podle současných drbů se asi Lovelace v tomto nezmění), lze z počtů SM odvodit přímo počet shaderů, stream procesorů či Cuda jader, jak jim Nvidia (poněkud nepřesně) říká.

Nejvýkonnější GeForce RTX 4000: až 18 tisíc Cuda jader

Nejvýkonnější Lovelace, čip AD102, má údajně mít 144 SM (nebo 72 bloků TPC, které jsou tvořeny dvěma SM). To znamená 18 432 shaderů v grafické kartě, která by měla tento čip v plné konfigurace. Zprvu nicméně Nvidia může uvést jen grafiky s částečně ořezanými čipy, kvůli výtěžnosti. Například GeForce RTX 4080 by mohla mít shaderů až o pár tisíc méně, zatímco třeba RTX 4090 či RTX 4080 Ti by se blížily plnému počtu.

Paměťová sběrnice tohoto GPU je prý 384bitová, takže v tomto se Nvidia bude držet svých tradičních doktrín. Jaké paměti budou osazené, zda GDDR6, GDDR6X, nebo dokonce nějaká nová GDDR6+, to ještě nevíme. Před nedávnem se objevily poměrně nepříjemné zprávy, že modely grafik založených na tomto čipu by mohly mít TDP až 450 W (RTX 4080), 600 W (RTX 4080 Ti) a dokonce 850 W (RTX 4090?), ale doufejme, že se to nenaplní.

Tabulka počtu jednotek SM v GPU Nvidia generací Turing Ampere a Lovelace Tabulka počtu jednotek SM v GPU Nvidia generací Turing Ampere a Lovelace (Zdroj: La Frite David (Twitter))

Další čip v řadě AD103 by se zřejmě mohl lišit od úlohy, kterou hrál čip GA103, vydaný v generaci Ampere s více než ročním zpožděním a zřejmě zaměřený dost na notebooky. AD103 by možná mohl být spíš následník GA104, vyjde asi hned po AD102 a bude tvořit páteř populárních grafik vyššího mainstreamu.

Toto GPU má mít 84 bloků SM, tedy stejně, jako má teď highendový čip GA102. Znamená to 10 752 shaderů při plné konfiguraci. Ale opět, grafika GeForce RTX 4070 může vyjít s konfigurací, která bude kvůli výtěžnosti o něco ořezaná. AD103 má mít 256bitovou sběrnici, jako je čipů této třídy zvykem.

Pro dostupnější nižší mainstream by pak byl čip AD104, který ale ovšem asi bude spíše duchovním nástupcem čipu GA106, protože snad má mít jen 192bitovou paměťovou sběrnici. Počet bloků SM by ale byl 60, tedy jako nyní u vyššího čipu GA103. Toto dává 7680 shaderů, ale opět, grafické karty (GeForce RTX 4060?) na něm založené mohou mít pár jednotek vypnutých kvůli výtěžnosti, aby se mohly uplatnit i křemíky s defektem.

https://twitter.com/no_one180/status/1498823056696950786

Dvě 128bitová GPU v lowendu

Nvidia dále chystá dva čipy pro levnější grafiky, které už také mohou asi být hodně zaměřené na použití v noteboocích. AD106 bude mít 36 bloků SM, což je 4608 shaderů. AD107 má 24 bloků SM, což je 3072 shaderů. Obě tato GPU mají 128bitovou paměťovou sběrnici, Nvidia tedy nechce jít níž, ale je samozřejmě možné, že vydá nějaké grafiky, které budou reálně využívat jen část této šířky (třeba 96 nebo 64 bitů). Tato GPU už asi také mohou mít zredukovanou šířku rozhraní PCI Express třeba jen na 8 linek (nebo dokonce jen 4, pokud by třeba AD107 bylo určené pro notebookovou řadu GeForce MX).

GPU Lovelace bude Nvidia vyrábět na 5nm procesu TSMC, který by měl být výrazně lepší, než 8nm proces Samsungu u čipů Ampere. Minimálně nejvýkonnější AD102 bude 5nm určitě, u ostatních čipů není úplně vyloučené, že by třeba také mohly některé být místo toho vyráběné u Samsungu (ovšem pořád by to mohlo být na jeho 5nm procesu).

bitcoin školení listopad 24

Architektura Lovelace by měla přinést i různé zatím tajné novinky ve funkcích a výbavě, dá se očekávat například podpora PCI Expressu 5.0 (NVLink prý ale mít nebude), nebo výstupu DisplayPort 2.0 či nový enkodér videa – možná již s podporou komprese do formátu AV1. Toto jsou zatím jen spekulace, ovšem úniky z ovladačů by něco z tohoto mohly potvrdit nebo vyvrátit.

Zdroj: La Frite David (Twitter)