Nová generace grafických karet od Nvidie, GeForce RTX 5000, a nové karty chystané AMD (Radeon RX 8000) a Intelem pravděpodobně plánují používat novou technologii grafických pamětí GDDR7, které mají přinést lepší propustnost než GDDR6 i GDDR6X. Tato technologie byla nyní dokončena konsorciem JEDEC a umožní efektivní rychlosti až 48 GHz, takže propustnost s ní proti dnešním grafikám stoupne hodně výrazně, až 2–3×.
Specifikace GDDR7 byla dnes publikována ve finální formě jako standard „JESD239 Graphics Double Data Rate (GDDR7) SGRAM“. Podporu této technologii vyjádřili dle očekávání Nvidia a AMD, takže obě firmy by v budoucnu měly tyto paměti používat (Intel nebo třeba čínští výrobci GPU ale nejspíš také).
Vyrábět je na druhé straně bude Samsung, Hynix a Micron, tedy všichni tradiční dodavatelé grafických pamětí. Na jejich vývoji pracovali už před dokončením a vydáním specifikace, takže dostupnost čipů pro výrobce grafických karet by neměla být vzdálená.
Podle JEDECu počítá standard GDDR7 s propustností pamětí až 192 GB/s na jeden čip. Ten by stále měl mít datovou šířku 32 bitů, což znamená, že výhledově by GDDR7 měla běžet na efektivních rychlostech až 48 Gb/s na jeden bit sběrnice. Či chcete-li, tzv. na efektivním taktu 48 GHz. To je dvojnásobek maximálních rychlostí u GDDR6 a GDDR6X (24 GHz efektivně). Ale většina dnešních grafik s pamětí GDDR6 má zatím frekvence spíše v pásmu 16,0–18,0 GHz, takže v porovnání s nimi může být výkon pamětí až trojnásobný při stejné šířce sběrnice. Těchto maximálních hodnot ale asi bude dosaženo až časem, takže toto by asi platilo u srovnání GPU třeba přes dvě nebo tři generace.
S onou efektivní rychlostí 48 GHz by se pro představu dalo na grafice s úzkou typicky lowendovou 64bitovou sběrnicí, jakou má třeba Radeon RX 6500 XT, dosáhnout propustnosti 384 GB/s (což má Radeon RX 6700 XT). Levná mainstreamová grafika se 128bitovými pamětmi by už měla propustnost 768 GB/s (víc než GeForce RTX 3080). Výkonná GPU s 256bitovými a 384bitovými sběrnicemi by pak dosáhla dnes fantastických propustností 1536 GB/s a 2304 GB/s (v podstatě z říše pamětí HBM2/HBM2e).
Ale jak už bylo řečeno, ze začátku se asi budou používat pomalejší čipy, v první vlně možná s efektivní rychlostí 32 GHz. To by s citovanými šířkami sběrnice dávalo 256 GB/s, 512 GB/s, 1024 GB/s a 1536 GB/s.
PAM3 místo PAM4 u pamětí GDDR6X
Tajemstvím za navýšením propustnosti u GDDR7 je použití signalizace PAM3 založené na pulzně amplitudové modulaci. Ta je konceptuálně podobná vícebitovému (MLC/TLC) záznamu v pamětech NAND. Znamená to, že jeden tik elektrického signálu nerozlišuje jenom dvě hodnoty napětí (0 a 1), ale více úrovní napětí, v tomto případě tři – proto PAM3. Jeden tik díky tomu místo jednoho bitu přenese 1,5 bitu (a to tak, že dva po sobě jdoucí tiky umožňují kódovat tři bity).
Je zajímavé, že GDDR6X od Micronu používá kódování PAM4, kde jsou úrovně napětí čtyři a jeden tik signálu tak rovnou přenáší dva bity informace. Paměti GDD6X měly nicméně poměrně vysokou spotřebu a je zajímavé, že u nich nebylo dosaženo zdvojnásobení propustnosti (tedy například efektivní rychlosti 32 GHz proti tehdy 16GHz pamětem GDDR6), Micron a Nvidia se s nimi v praxi dostaly jen na asi 24GHz efektivní frekvenci. To bylo jen o 50 % víc proti starší GDDR6 a novější čipy GDDR6 se na tyto rychlosti také mají dostat.
Možná, že PAM4 je pro tuto aplikaci zatím příliš náročné kódování a jednodušším PAM3 se dá paradoxně získat lepší výsledek díky vyšším dosaženým frekvencím.
Vedle tohoto výkonnějšího kódování a vyšších frekvencí paměti GDDR7 mají také vylepšení v systému trénování při inicializaci systému (GPU). Toto zlepší schopnosti GPU provozovat paměti na vysokých frekvencích, současně by trénování při spouštění GPU mělo být rychlejší.
GDDR7 by také zřejmě měla mít více subkanálů (čtyři místo dvou), což by mělo zlepšit reálnou propustnost při určité úrovni teoretické propustnosti, tedy „vytěžitelnost“ rychlosti pamětí. Je to asi analogické tomu, jak byly u pamětí DDR5 moduly s 64bitovou šířkou interně rozdělené na dva nezávislé 32bitové kanály.
Po stránce kapacit standard počítá s velikostmi čipů 16 Gb až 32 Gb, tedy 2–4 GB. Menší 1GB čipy už nebudou existovat, 256bitové grafiky tedy budou mít minimálně 16 GB paměti, maximálně až 32 GB. Podle roadmap výrobců pamětí zřejmě bude existovat i střední cesta v podobě 24Gb/3GB čipů, což by umožnilo například 24GB paměti pro 256bitové grafiky (nebo 12GB kapacitu u grafik se 128bitovou šířkou).
Nadále ale bude podporováno clamshell zapojení, kdy se používá dvojnásobný počet čipů, kdy budou kapacity dále zdvojnásobené. Klasické grafické karty s pamětí GDDR7 by tak mohly dosáhnout kapacit pamětí 64 a 96 GB, byť to asi bude používáno jen profesionálními kartami, ne těmi herními – z cenových důvodů.
ECC
Paměti GDDR7 mají zřejmě přímo podporovat ECC přímo na úrovni čipů. Nebude tedy potřeba redundantních čipů, přímo jeden čip bude mít svou vlastní paritní či ECC informaci, a bude tak schopný detekovat a do určité míry opravovat chyby. Toto už je u DDR5, kde ale je ta chyba, že řadič pamětí v CPU nedostává informace o odhalených či opravených chybách, takže hlavní výhoda ECC je v podstatě nevyužitá. Výrobci totiž pravděpodobně v praxi jen navýší frekvence akorát tak, aby paměti sice už chybovaly, ale on-die ECC to ještě vše korigovalo. Tím, že uživatel o chybách opravených ECC není informován, si to mohou dovolit, zatímco u DDR4 musely být frekvence tak nízké, aby se neobjevovaly žádné chyby. Pokud ale k nějakým neopravitelným chybám u DDR5 (vlivem toho, že se s frekvencí jde víc na hranu) už dojde, řadič paměti v CPU se o nich nedozvídá a jste ve stejné situaci jako s DDR4 bez on-die ECC.
U GDDR7 by chyby paměti měly být signalizované dál a tudíž by měl celý systém možná odpovídat klasickým ECC pamětem s jejich výhodami pro spolehlivost. Podporována má být i technologie data poisoning, detekce chyb a scrubbing. I když je asi možné, že ne všechny čipy budou všechny tyto RAS funkce mít (pokud by třeba byly jen volitelné).
Prostor pro růst herního výkonu GPU na několik dalších let
Každopádně uvedení pamětí GDDR7 s jejich poměrně vysokými cílovými frekvencemi znamená, že na několik příštích let je otevřená cesta k hladkému navyšování herního výkonu u grafických karet. Ten propustnost GPU hodně limituje a vysokou propustnost potřebují zejména větší rozlišení jako 4K, 5K a 8K. Při zvyšování výkonu GPU tedy nestačí přidávání výpočetních jednotek a frekvencí (a teoretického hrubého výkonu v „TFLOPS“), musí přitom také být adekvátně zlepšována propustnost pamětí.
S vydáním GDDR7 je tato druhá část zajištěná, takže už bude záviset jen na tom, aby se výrobcům GPU dařilo přidávat ten hrubý výpočetní výkon (a výkon jednotek pro raytracing a dalších jednotek v GPU s fixní grafickou funkcí).
Zdroj: JEDEC (via: TechPowerUp)