Fiji mít paměti HBM 1.0 (druhá generace by ovšem mohla pomalu přijít příští rok). Ta je tvořena pouzdry o velikosti 5 × 7 mm, z nichž každé má kapacitu 1 GB. Nejde o monolitický čip, nýbrž o štůsek („stack“) čtyř vrstev DRAM na pátou základovou vrstvu s ovládací logikou. Tedy pět čipů, které propojují vertikální cesty TSV (through silicon via) a miniaturní pájené kontakty s roztečí jen 55 mikrometrů. Podobnými mikrospoji se pak tato paměť připájí na podklad, jímž je křemíkový interposer, sloužící jako velmi jemné PCB.
Čipy mají čtyři vrstvy DRAM a jednu s logickými obvody, vše je vertikálně propojeno pomocí TSV
HBM je navržena tak, aby měla velmi širokou sběrnici – jeden pětivrstvý čip má celkem datovou šířku 1024 bitů, ve srovnání s jen 32 bity u GDDR5. Je to umožněno tím, že HBM se vždy integruje velmi blízko ke svému živiteli – v tomto případě GPU – na zmíněný interposer. Kvůli úzké sběrnici musí GDDR5 používat extrémně vysoké efektivní takty až 7 GHz, což ale stojí mnoho energie a paměťové řadiče jsou značně komplexní. Díky mnohem větší sběrnici může ale HBM pohodlně běžet na nízkých taktech, což je úsporné a jednoduché na implementaci. Srovnání můžete vidět na prezentačním slajdu zde:
7GHz GDDR5 jak vidíte běží na frekvenci 1750 MHz a přenáší čtyři bity za takt (odtud efektivních 7 GHz). HBM naproti tomu „sviští“ jen na mrzkých 500 MHz s dvěma bity za takt (1 GHz efektivně). Při započtení šířek ale poskytuje čip GDDR5 jen 28 GB/s propustnosti, zatímco jedno pouzdro HBM 128 GB/s. Přitom také používá nižší napětí (1,3 V proti 1,5 V). GDDR5 sice vyjde coby jednodušší monolit levněji, hlavní problém u ní však je, že je prakticky na konci své evoluce a její výkony už není kam zvedat. Naproti tomu HBM má kam škálovat: v generaci HBM 2.0 se má propustnost na jeden bit sběrnice zdvojnásobit, nemluvě o tom, že rozšiřování sběrnic je s GDDR5 drahé, s HBM na interposerech by ale mělo být schůdnější.
Fiji by mělo mít 4 GB HBM s propustností 512 GB/s
AMD to úplně nepotvrzuje, ale dle schémat, která jsou v prezentaci použita a podle dalších neoficiálních zvěstí, má Radeon s GPU Fiji na sobě čtyři čipy HBM. To dává 4096bitovou sběrnici a propustnost 512 GB/s, vysoko nad tím, co mají k dispozici grafiky s pamětí GDDR5. Čtyři použité čipy pak také znamenají kapacitu 4 GB (8 GB, o nichž přicházely zprávy, asi platí jen pro údajně chystané duální grafiky). Vše by jinak mělo být zakryté rozvaděčem tepla, který bude chránit GPU a paměti před nepřízní živlů a také vyřeší rozdílené výšky čipů.
HBM je určená k integraci blízko GPU či CPU, k propojení slouží křemíkový interposer
Stinnou stránkou HBM je, že vyžaduje osazení na onen interposer, což se také označuje jako „2.5D Stacking“. Interposer je křemíková součástka, jde vlastně o velký, byť jednoduchý čip, sloužící jako substrát. Na jeho horní straně jsou připájené čipy HBM a GPU, spodní stranou je zase naletován na standardní substrát. Vzhledem k výrobě z křemíkových waferů nebude cena interposeru úplně triviální, neboť jeho plocha je poměrně značná. Nicméně AMD v něm údajně nepoužívá žádnou aktivní logiku, pouze kovové vrstvy, což by mělo nákladnost zmírnit. Výroba také probíhá na poměrně zastaralém procesu (prý snad 40–65 nm) u levnější fabriky UMC.
HBM prodraží grafickou RAM, zlevní ale zbytek karty
HBM tedy bude jako nevýhodu mít větší cenu (samotný čip bude při stejné kapacitě určitě dražší než léta masově vyráběná GDDR5) a navíc bude vyžadovat onen křemíkový interposer coby součástku navíc. Povede tedy k vyšším výrobním nákladům pro AMD, ovšem je třeba dodat, že zároveň přinese některé úspory. Část nákladů by totiž mělo vyrovnat zlevnění PCB a asi i samotného GPU.
Na typické kartě zabírají hodně místa paměťové čipy a signálové dráhy, které k nim od GPU vedou. To vše bude nyní jen na malém interposeru, celé pouzdro nebude o mnoho větší než dnes (u Fiji 70 × 70 mm). PCB tedy bude o dost menší, to ale nebude hlavní úspora. Eliminací pamětí odpadne velké množství spojů, a to těch nejkritičtějších, neboť zapojení rychlé GDDR5 je citlivé na délku, kvalitu signálu a tak podobně. Nyní budou na PCB již jen jednodušší spoje pro napájení a pro připojení k PCI Express, takže jeho komplexita by mohla být i řádově menší. Díky tomu bude nejen menší, ale hlavně mu bude stačit menší počet vrstev, což opět vyjde levněji. Toto bude výhoda též v noteboocích, nevíme ale ještě, zda do nich Fiji zamíří.
Na PCB zabírá GPU s pamětí HBM mnohem méně místa. Menší jsou i jednotlivé čipy
Druhá nepřímá úspora plyne ze spotřeby. HBM je díky nízkým frekvencím mnohem méně žravá než GDDR5. Přesná čísla AMD nesděluje, propustnost je ale pro GDDR5 údajně okolo 10,66 GB/s na spotřebovaný Watt, kdežto u HBM přes 35 GB/s na Watt. Paměti by tedy mohly ušetřit nějakých 25–35 W. Ty se ale obratem budou moci investovat do vyššího TDP pro GPU samotné – při stejné spotřebě celku tedy Radeon s HBM bude moci „spálit“ více elektřiny na samotnou práci oproti kartě GeForce s GDDR5. Jinými slovy, HBM vytváří prostor pro zvýšení hrubého výkonu GPU.
Při stejné propustnosti by HBM měla oproti GDDR5 uspořit desítky Wattů z celkové spotřeby
A podobný efekt by měl mít i na plochu čipu. Díky tomu, že pracuje na nízkých taktech a s velmi krátkými drahami, je z hlediska signálu HBM méně choulostivá než GDDR5 (zejména ta s nejvyššími takty). PHY paměťových řadičů tedy budou jednodušší a na čipu by měly zabrat méně místa. HBM tím pádem zlevní GPU, neboť se jich vejde více na wafer. Případně se tato úspora bude dát použít k zapojení většího množství výpočetních jednotek na čip.
Tyto úspory ale samozřejmě nebudou znamenat nějaké drastické snížení výrobních nákladů. Je asi nabíledni, že celek pořád bude dražší než tradiční GPU jako je Hawaii s GDDR5 v Radeonu R9 290X. Ostatně jinak by se asi AMD neobtěžovalo karty s čipem Hawaii a dokonce prý s 8 GB GDDR5 zařadit do nové třístovkové řady Radeonů. Ceny modelů s Fiji budou určitě nad 500 USD a velmi pravděpodobně i nad 600 USD.
Mimochodem… na závěr asi ještě musíme vypíchnout jednu věc. Paměti HBM by eventuálně měla využívat i Nvidia (možná už u příští generace GPU Pascal), takže AMD nebude mít náskok na dlouho, i když s generaci HB 1.0 zřejmě konkurenci mít nebude. Nicméně firma se na vývoji těchto pamětí, které jinak vyrábí Hynix, sama podílela a na jejich nasazení do praxe tedy nese díl zásluh. Pokud se HBM stane nezbytnou součástí budoucích výkonných grafik, bude za to i „zelený tábor“ částečně vděčit AMD.
Zdroje: SemiAccurate, AnandTech