Je to zhruba půl roku od vydání nové generace grafik Nvidia, ale začaly se objevovat informace, či možná spíš spekulace o tom, co přinese generace příští, tedy grafiky zřejmě označené GeForce RTX 5000, které by logicky měly vyjít za rok a půl, pokud Nvidia zachová obvyklý dvouletý cyklus. Většina informací je teď asi vysoce nejistá, ale už máme první detaily, které by mohly být reálné a stojí za to se na ně podívat.
Takto v předstihu mívají nejvíc „informací“ youtubeři, u kterých se ale těžko ubránit dojmu, že potřebují udržovat zájem publika, a tak berou zavděk i spekulacemi, které nejsou založené na nějakém úniku z Nvidie, ale jen na něčím tipování. Rok a půl předem tedy to, co uvádějí o budoucích architekturách, může být dost mimo.
O architektuře Blackwell se nyní rozhovořil youtuber RedGamingTech. Podle jeho zdrojů prý Blackwell budou opět monolitické čipy včetně highendových herních modelů (GB102), s možností, že by mohly existovat čipletové verze pro servery a HPC (GB100). Otázka je, zda se jejich architektura nebude jmenovat jinak, tak jako máme nyní paralelně výpočetní Hopper a herní Ada Lovelace. Nicméně podle staršího úniku, který nastal kvůli hacku serverů firmy, by podobně jako Ampere tato architektura mohla mít jak herní, tak výpočetní verze.
Více: Data ukradená Nvidii odhalila plány příštích GPU. Čipy Lovelace a novou architekturu: Blackwell
RedGamingTech na svém videu uváděl, že dle jeho názoru by čipy Blackwell mohly používat 3nm proces TSMC. Je to asi ale jenom odhad, ne reálné zjištění. Z tohoto se ovšem nakonec vyklubala nová informace, protože zareagoval nejkvalitnější leaker plánů Nvidie Kopite7kimi, podle kterého Blackwell ještě 3nm čipy nebudou.
Bohužel to asi znamená, že bude použitá nějaká parametry horší technologie pořád v 4nm generaci. Protože již Ada Lovelace se vyrábí na silně upraveném 5nm procesu TSMC, který bude asi víceméně parametry na úrovni 4nm procesu N4 (pokud ne lepší), znamená to, že by GPU Blackwell mohla být v situaci, kdy získají jen minimální zisky v hustotě tranzistorů a energetické efektivitě z lepší výrobní technologie oproti čipům Ada Lovelace. Nvidia by možná mohla využít nějakou verzi N4, která zlepší výkon tím, že dosáhne vyšších taktů – TSMC například chystá speciální „HPC“ procesy jako N4X. Ale takový proces zřejmě nenabídne nějaké velké zlepšení poměru výkonu a spotřeby, který je u GPU hodně důležitá věc. Nebo aspoň byla v době, kdy trh neakceptoval zvyšování TDP tak snadno jako dnes.
Více: Přímo proti Intelu: TSMC uvádí speciální křemíkové procesy pro maximální výkon. První je N4X
512bitové paměti?
Víc toho o Blackwellu Kopite7kimi zatím nechce říkat – podle jeho Twitteru je zatím příliš brzo na podobné debaty. Nicméně zmínil, že by ho nepřekvapilo, pokud by tato GPU měla širší paměťové sběrnice a highendový čip by se dostal na 512bitovou šířku pamětí. To by bylo poprvé od GPU Fermi, ve své době nechvalně proslulého spotřebou. Od té doby se Nvidia držela jako maxima 384bitových pamětí. Zatím to ale asi také není nějaká jistá informace, takže je to třeba brát jen jako možnost, zatímco to o nepoužití 3nm procesu je patrně z lepších zdrojů.
https://twitter.com/kopite7kimi/status/1645324379398766595
Velké architektonické změny
Už zase jen podle RedGamingTechu prý Nvidia pravděpodobně v Blackwellu bude mít výrazně přepracovanou architekturu. Má se to týkat i změněné struktury jednotlivých bloků SM (výpočetních jednotek). SM prý budou propojené „hyperrychlou“ propojovací logikou, která by snad mohla pak být použitá i pro propojení čipletů u oné serverové verze GB100.
GPU by prý také mohla mít specializovaný akcelerátor denoisingu, nebo možná nějaké instrukční rozšíření či vylepšení tensor jader pro tento účel. Odšumění obrazu se používá při ray tracingu a už nyní ho akcelerují tensor jádra, takže rozšíření jejich funkcionality se zdá pravděpodobnější než přidání samostatné jednotky pro tyto účely.
Tyto informace jsou ale, jak už bylo řečeno, asi hodně předběžné a ještě ne moc spolehlivé. Hodně se toho ale asi dá úspěšně uhádnout, každého asi napadne podpora PCI Express 5.0 a možné použití pamětí GDDR7. RedGamingTech také uvádí, že by highendový čip GB102 mohl mít stále jen 144 SM (stejný počet jako u AD102) a navýšení výkonu by pocházelo z architektonických zlepšení a frekvencí.
Ale je opravdu otázka, zda to zatím není jen spekulace. Možná je toto číslo užitečné hlavně k tomu, abychom ho za rok a půl mohli porovnat se skutečností k zhodnocení toho, jak moc mělo smysl těmto druhům youtuberských úniků naslouchat. GeForce RTX 5000 by pravděpodobně mohly vyjít na podzim roku 2024, pokud Nvidia udrží dosavadní dvouleté rozestupy.
Zdroje: Kopite7kimi (1, 2), RedGamingTech