Micron s Nvidií mají GDDR6X, Samsung teď vyvinul GDDR6W. Nejrychlejší paměti pro grafiky?

5. 12. 2022

Sdílet

 Autor: Samsung
Nová paměť má dvojnásobnou propustnost proti GDDR6, a dokonce může být levnější alternativou HBM2E. Ale spíš než v herních grafických kartách by se asi mohla uplatnit v noteboocích.

Minulý týden se objevila jedna nečekaná novinka: nová technologie pamětí pro GPU. Nečekaná proto, že to není GDDR6+ nebo GDDR7, které by měly být v přípravě. Samsung místo toho oznámil paměti nazvané GDDR6W, které mají výrazně zvýšit propustnost technologie GDDR6 a konkurovat už dokonce pamětím HBM2E či HBM3. Zřejmě jde o podobnou soukromou iniciativu mimo standardy jako u GDDR6X, koncepce Samsungu je ale dost odlišná.

GDDR6W: dvojnásobná šířka pamětí s vyšší integrací

Paměti GDDR6W jsou podle všeho založené na standardu GDDR6 s jeho signalizací a fyzickou vrstvou. To znamená, že by paměťové řadiče schopné pracovat s GDDR6 měly být schopné pracovat s GDDR6W jen s malými modifikacemi. Není jako u GDDR6X použitý nějaký jiný typ komunikace (jako je pulzně-amplitudová signalizace PAM4). Přesto má GDDR6W dosáhnout dvojnásobné propustnosti proti GDDR6.

Tip: Nová technologie paměti pro GeForce RTX 3000: GDDR6X s rychlostí až 21 GHz

Dosaženo je to jinou strategií – rozšířením paměťové sběrnice. Čip GDDR6 má vždy šířku paměťové sběrnice 32 bitů, ale u GDDR6W se šířka rozšiřuje na dvojnásobek – 64 bitů. Tato sběrnice pak komunikuje stejným způsobem jako GDDR6, takže by měla dosahovat i podobné efektivní frekvence (či přenosové rychlosti na jeden bit). A tudíž jeden „šváb“ paměti na grafické kartě bude mít dvojnásobnou propustnost. Samsung uvádí pro GDDR6 jako příklad čipy s rychlostí 24 Gb/s (efektivní frekvence „24 GHz“) a GDDR6W má dosahovat na dvojnásobnou propustnost. Nicméně na jiném místě firma uvádí, že GDDR6W poběží na efektivní frekvenci 22 GHz / 22 Gb/s, tedy o něco nižší (ale stále s onou dvojnásobnou šířkou).

Paměti Samsung GDDR6W Paměti GDDR6W (zdroj: Samsung)

Toto rozšíření sběrnice na dvojnásobek není realizováno tak, že by Samsung vyráběl úplně nový typ čipu. Firma podle všeho používá standardní čipy GDDR6 ze své produkce, ale balí je do pouzdra ve vrstvě na sebe. Je přitom použitá pokročilejší technologie pouzdření používající měděné sloupky a tzv. Fan-Out Wafer-Level Packaging (FOWLP). Díky tomuto je fyzická velikost pamětí GDDR6W stejná – nezabírají větší plochu a „čip“ (přesněji vícečipové pouzdro) má mít výšku jen 0,7 mm (což je dokonce méně než u GDDR6). Pouzdření nepoužívá PCB, ale vrstvu RDL (Re-Distribution Layer) s jemnějšími měděnými vodiči.

Tímto spojením dvojnásobku čipů do jednoho balení se současně dosahuje dvojnásobné kapacity. Například proti 16Gb (2GB) čipům GDDR6 by pouzdra GDDR6W měla kapacitu 32 Gb (4 GB).

Paměti GDDR6W integrují uvnidtř více čipů Paměti GDDR6W integrují uvnitř více čipů (zdroj: Samsung)

Paměti GDDR6W asi nejsou všeobecný upgrade oproti GDDR6 ve smyslu, v jakém byla paměť GDDR6 upgrade proti GDDR5. Je to právě proto, že dosahují na dvojnásobnou rychlost díky dvojnásobné šířce. S tradiční pamětí GDDR6 lze totiž dosáhnout na úplně stejnou věc, pokud prostě rozšíříte sběrnici GPU například na 512 bitů místo 256 bitů a použijete dvojnásobek čipů. Přesně to totiž GDDR6W dělá.

Tudíž bychom úplně nečekali, že GDDR6W začne nahrazovat GDDR6 u klasických desktopových GPU, protože se nezdá moc pravděpodobné, že by v Nvidii nebo AMD byly ochotní rozšířit sběrnice na 512 či 768 bitů. Širší paměťová sběrnice totiž GPU prodražuje, řadiče navíc potřebují další plochu křemíku, ale také více vývodů. Tyto vývody pak musí přirozeně také být na čipech GDDR6W, takže se prodražuje i PCB tím, že musí tyto vývody propojit.

Paměti GDDR6W jsou pouzdřené technologií FOWLP a integrují více čipů GDDR6 bez nutnosti použít uvnitř PCB Paměti GDDR6W jsou pouzdřené technologií FOWLP a integrují více čipů GDDR6 bez nutnosti použít uvnitř PCB (zdroj: Samsung)

Výhoda je v menší zabrané ploše na PCB

Pokud už GPU jednou má větší šířku sběrnice, je pak samozřejmě možné prostě využít více čipů GDDR6 místo GDDR6W. Paměť GDDR6W má zřejmě jednu hlavní výhodu. Díky tomu, že jsou paměti integrované do pouzdra s větší datovou šířkou a kapacitou, zaberou na PCB polovinu místa. To by se mohlo hodit u highendových grafik s velkou kapacitou. Například u GeForce RTX 3090 měla Nvidia problém naskládat na PCB 24 čipů po obou stranách – s GDDR6W by se to dalo realizovat elegantněji, protože by paměť byla jen v 12 pouzdrech (odmyslíme-li si pro zjednodušení, že Nvidia už používala GDDR6X).

GDDR6W tak obecně asi bude mít uplatnění tam, kde je třeba osadit velkou kapacitu paměti s vysokým výkonem, ale jste limitováni místem na PCB. Tudíž by se tato technologie hodila v herních noteboocích, kde se prostorové nároky na paměti zmenší na polovinu. Vedle GPU s 256bitovou sběrnicí (což je v noteboocích highend) nebude muset být osm „švábů“, ale jen čtyři. Jak velká výhoda to bude a jak často to budou výrobci notebooků používat, to teprve uvidíme.

Konkurence pro HBMx

Samsung uvádí, že touto hustotou integrace by GDDR6W mohla už částečně konkurovat pamětem HBM2E. Jako příklad uvádí GPU či akcelerátor s 4096bitovou sběrnicí s pamětí HBM2E na taktu 3,2 GHz efektivně. To dává propustnost 1,6 TB/s. S GDDR6W by se dalo téměř téhož dosáhnout při použití osmi pouzder na efektivním taktu 22 GHz, čímž se dosáhne propustnosti 1,4 TB/s. Je na to třeba šířka pamětí 512 bitů, což od doby Hawaii od AMD (Radeon R9 290X) u GPU použito nebylo, ale asi to není nereálné.

Srovnání modelového použití GDDR6W a HBM2E podle Samsungu Srovnání modelového použití GDDR6W a HBM2E (zdroj: Samsung)

Nevýhoda asi bude, že GDDR6W nejspíš na tuto propustnost spotřebuje více energie než HBM2E či HBM3, která se obecně považuje za úspornější technologii. GDDR6W nejspíš bude mít na jednotku propustnosti stejnou spotřebu jako GDDR6. Ale GDDR6W má naopak jednu velkou výhodu: bude možné ji osadit vedle GPU na běžné PCB a nevyžaduje speciální pouzdření na křemíkový interposer nebo na křemíkový můstek typu EMIB. To sníží výrobní náklady, a GDDR6W by se tak mohla stát právě levnější alternativou pamětí HBM2E či HBM3.

ICTS24

Budoucí nasazení tedy asi může být největší právě v oblasti různých AI akcelerátorů (a nejen GPU) pro datacentra, které typicky stavějí na HBM2E či HBM3, spíš než v herních GPU. V oblasti herních notebooků, o nichž jsme mluvili, jsou asi výrobci už zvyklí na použití GDDR6 a dost často pro ně ani zmenšení počtu čipů na desce nemusí být dostatečnou motivací. Větší rozšíření těchto pamětí bude asi každopádně věcí, která nastane třeba až za rok nebo dva, takže kandidáty asi budou až mobilní GeForce RTX 5000 nebo Radeony RX 8000.

Zdroje: Samsung, Tom's Hardware