Chvíli po pamětech GDDR6W, které by mohly být levnější alternativou k HBM2E a HBM3, prezentoval Samsung také to, co už bude tvořit novou generaci mainstreamových pamětí pro většinu herních grafik: technologii GDDR7. O té se objevily zmínky už loni, ale nyní poprvé dostává konkrétnější obrysy. Dozvídáme se, čemu bude GDDR7 vděčit za výkon a jak se bude lišit od GDDR6X vyvinuté Micronem pro grafiky Nvidie.
GDDR7 je zatím ještě pár let vzdálená (což není na závadu, protože nová generace GPU tu asi zase bude až za dva roky) a dotyčný standard není hotový. Samsung ale nyní uvedl první podstatné detaily o tom, na čem tato důležitá komponenta budoucích GPU bude postavená.
Jak už proběhlo před nedávnem, Samsung oznámil, že momentálně je u GDDR7 cíl dosáhnout přenosové rychlosti 36 Gb/s na jeden bit šířky paměťové sběrnice (zjednodušeně tomu někdy říkáme „efektivní frekvence“ 36,0 GHz, i když skutečné používané takty jsou mnohem nižší). To by znamenalo dvojnásobnou rychlost pamětí proti dnešní GDDR6 – u Radeonů RX 6950 XT, RX 6750 XT a RX 6500 XT se používají „18,0GHz“ paměti GDDR6. Ale není to úplně to nejlepší, čeho GDDR6 dosáhne – Samsung ve skutečnosti má vyvinuté čipy GDDR6 pracující na 24,0 GHz. Ve skutečnosti tak asi GDDR7 v rámci tohoto prvotního cíle dosáhne nárůstu výkonu o 50 %, ne o 100 %.
Samsung ale dokonce prezentoval i 27,0 GHz GDDR6, takže možná později také GDDR7 ještě zrychlí. Že by na 40,5 GHz, aby bylo zachováno 50% zrychlení?
Nové kódování: PAM3, ne PAM4
Vyplývá to asi z toho, jakou technologii kódování signálu Samsung (a s ním asi další firmy, protože tyto paměti by asi zase měly být standardizované a dodávané také Micronem a Hynixem) plánuje použít na fyzické vrstvě. GDDR7 opustí doteď používané kódování signálu NRZ (Non Return to Zero), která rozlišuje dvě hodnoty (0 a 1) rozdílným napětím, a přenáší tak jeden bit na cyklus.
GDDR7 místo toho použije pulzně amplitudovou modulaci. Ale na rozdíl od PCI Expressu 6.0 a GDDR6X od Micronu to neznamená použití kódování PAM4. Tato metoda používá čtyři různé úrovně signálu, a v jednom cyklu proto přenese dva bity na kanál (protože čtyřmi hodnotami lze reprezentovat všechny možné kombinace nul a jedniček ve dvou bitech). Teoreticky proto PAM4 dokáže se stejnou frekvencí signálu dosáhnout dvojnásobné datové propustnosti, ale v praxi jsme zatím takto vysoké výkony u GDDR6X neviděli. Potřeba, aby PHY dokázalo generovat a rozeznávat čtyři různé hodnoty napětí v každém cyklu, asi klade nezanedbatelné nároky.
https://twitter.com/IanCutress/status/1599451187509530624
GDDR7 bude podle Samsungu používat o něco méně agresivní systém – PAM3. Opět jde o pulzně amplitudovou modulaci, ale s rozlišením jen tří hodnot. Bude to asi realizováno použitím nikoliv kódování s jednou polaritou, ale bipolární signalizace, kdy jednotlivé hodnoty signálu budou plusové napětí, záporné napětí (opačné polarity) a nula mezi nimi. Tři různé hodnoty nelze rovnou použít k zakódování celočíselného počtu bitů, ale s dvěma takovými cykly po sobě se dají zakódovat tři bity. To znamená, že PAM3 přenese 1,5 bitu za cyklus proti 2 bitům za cyklus u PAM4 a proti 1 bitu za cyklus u NRZ, které je použité u GDDR6. Z toho asi vyplývá, proč momentálně plánovaná rychlost GDDR7 vychází ve výsledku na jedenapůlnásobek rychlosti GDDR6.
Proč bylo použito kódování PAM3, které neskýtá takový potenciál ke zvýšení výkonu jako PAM4, nevíme. Je možné, že zvítězila nižší komplexita a že PHY používající bipolární signál PAM3 budou schopná pracovat s lepší energetickou efektivitou. Samsung uvádí, že s PAM3 je schopen dosáhnout asi o 25 % lepší efektivity (nižší spotřeby při stejné rychlosti) než s tradičním kódováním NRZ použitým u GDDR6. Nicméně při zvýšení přenosové rychlosti o těch 50 % asi pořád spotřeba GDDR7 může vycházet vyšší než u GDDR. Těžko zatím soudit, jestli tyto paměti budou úspornější než GDDR6X, která, zdá se, má spotřebu relativně vyšší.
GDDR7 nebude s kódováním PAM3 ojedinělá. Stejné kódování je údajně použité také v 80Gb/s Thunderboltu (a USB4 2.0 alias USB 80Gbps). Na druhou stranu, Micron by teoreticky díky PAM4 mohl v rychlosti pamětí pro GPU zůstat napřed před standardizovanou GDDR7. Pokud se mu totiž podaří dosáhnout stejných skutečných taktů komunikace, bude díky PAM4 mít o třetinu vyšší propustnost. Je asi také možné, že eventuálně se PAM4 dostane i do standardů JEDEC třeba v rámci GDDR8.
- Tip: Vyšší rychlost, další zmatky: USB4 verze 2.0 přinese 80 Gb/s, ale jen s novými kabely
- Tip: Intel poodhalil nový Thunderbolt. Vychází z USB4 2.0 a DP 2.1, rychlost bude až 120 Gb/s
Skok o třídu výš v propustnostech pamětí na grafikách
Pokud se podaří realizovat efektivní rychlost 36 Gb/s („36,0 GHz“), umožní to opět docela pěkné nárůsty paměťového výkonu. GPU používající takto rychlou paměť by s 256bitovou sběrnicí dosahovalo propustnosti už 1152 GB/s – tedy vyšší, než jakou mají i nejvýkonnější dnešní grafiky včetně GeForce RTX 4090 s 384bitovou GDDR6X.
S 384bitovou sběrnicí se GPU dostanou na 1,69 TB/s, což je propustnost zatím možná jen s drahou „enterprise“ pamětí HBM2E. Přínos bude samozřejmě také pro malá mainstreamová GPU (288 GB/s s 64bitovou sběrnicí, 576 GB/s se 128bitovou). Ta díky vysoké rychlosti budou moci dosáhnout výkonu, jenž o generaci zpátky byl možný jen s o kategorii větší (a dražší) šířkou pamětí.
GDDR7 v GeForce RTX 5000 a Radeonu RX 8000?
Nejbližším možným termínem nasazení pamětí GDDR7 by asi mohla být příští generace GPU od Nvidie a AMD, která by se asi dala čekat zase v roce 2024 – předpokládejme, že opět vyjdou za dva roky po letošní nové generaci. GDDR7 by snad do té doby mohla být hotová, standardizovaná a ve výrobě. Zaručit to samozřejmě nelze, ale lze čekat, že výrobci pamětí se budou snažit svůj vlastní vývoj sladit s cykly svých hlavních odběratelů.
Zdroje: VideoCardz, Ian Cutress