Další podrobnosti GPU Vega a Navi. Vega 20 bude čip pro HPC, má sběrnici GMI

22. 9. 2016

V úterý se na webu VideoCardz objevily zajímavé informace z roadmapy serverových GPU, osvětlující dobu příchodu GPU Vega 10 a částečně i jeho parametry. VideoCardz má k těmto údajům navíc ještě jakýsi dodatek, který k čipům Vega 10 a Vega 20 dodává objasnění některých aspektů.

Vega 10 jen s dvěma čipy HBM2?

Předevčírem jsme uváděli, že GPU
Vega 10 – tedy to, které přijde také v highendových
Radeonech v první polovině příštího roku (mohlo by to
údajně být už v Q1) – má mít 16 GB paměti HBM2,
ovšem s propustností „jen“ 512 GB/s. To je překvapivé,
jelikož jde o stejnou rychlost jako u GPU Fiji s HBM1,
ačkoliv paměti HBM2 mají mít vyšší takty. Podle VideoCardz je
to proto, že toto GPU bude používat jen dvě pouzdra (či
„stacky“) HBM2, bude mít tedy efektivně je 2048bitovou
sběrnici. To znamená, že bude používat dva čipy HBM2 s osmi
vrstvami a kapacitou 8 GB, které poběží na plné
frekvenci 2,0 GHz efektivně.

Smyslem tohoto opatření je snad
zlevnění GPU a také jeho interposeru a pouzdření,
náklady na celek by měly být značně nižší než u Fiji se
čtyřmi HBM. To, že nevzroste fyzická propustnost, je trochu škoda
(pokud se tedy neukáže, že nativně je sběrnice širší a herní
modely budou používat celou šířku). Na druhou stranu, u Fiji
byla propustnost poněkud předimenzovaná a Vega 10 bude mít
účinnější delta kompresi, takže stejných 512 GB/s by mu
teoreticky třeba mohlo stačit (pro srovnání, Titan X
má 480 GB/s) – uvidíme. Dvojčipová serverová Vega 10 bude také
mít dvě pouzdra pro každé GPU, tudíž opět 2× 512 GB/s.

Další nový údaj, který pro Vegu 10
VideoCardz uvádí, je o výkonu tohoto čipu v dvojité
přesnosti (FP64). Ten má být jen 0,75 TFLOPS, dosahuje tedy jen
1/16 výkonu v FP32 (jenž má být 12 TFLOPS). Nemá tudíž
hardwarovou podporu pro rychlé výpočty v FP64 a není
tak použitelné v sektoru HPC, kde bude AMD nadále nabízet
Hawaii (které má výkon v FP64 značný, dosahuje poloviny
výkonu v FP32). Vega 10 bude v serverové oblasti sloužit
pro úlohy, které vyžadují jen FP32 nebo poloviční přesnost
(FP16), tedy například trénování neuronových sítí, pro což
se dnes používá „buzzword“ Deep Learning.

Totéž platí podle roadmapy také pro
Navi 10, i toto GPU nemá podporu pro rychlé výpočty v FP64.
Mimochodem, i Navi 10 bude pro servery nabízeno na dvojčipové
kartě. V serverové oblasti má být tato architektura dostupná
v roce 2019 – tento termín platí jak pro Navi 10, tak
pro Navi 11. Navi 11 je zdá se méně výkonnou variantou (jako
předtím Vega 11), jelikož má být nabízena jako GPU pro aplikace
natrénovaných neuronových sítí, kdežto Navi 10 k jejich
trénování.

Srovnání známých parametrů Vegy 11, 10 a 20 (Zdroj: VideoCardz)

Vega 20 bude speciál pro výpočetní
oblast, první 7nm GPU AMD

Pro HPC výpočty s dvojitou
přesností má být určen onen čip Vega 20, o němž jsme
minule psali jako o Vega 10 převedeném na 7nm proces. Vega 20
má však mít (kromě 4096bitové sběrnice pro čtyři čipy HBM2
a dvojnásobnou propustnost) také podporu pro FP64 na plné
rychlosti, půjde tedy o značně odlišné GPU specializované
na výpočty, podobně jako je GP100
Nvidie – a před ním GK210.
Vega 20 bude mít výkon v FP64 poloviční, tedy vzhledem
k dvojnásobné datové šířce vlastně v plné
rychlosti.

Vega 20 má vyjít v druhé
polovině roku 2018 (takže dosti agresivně, v prvním
roce 7nm výroby). A pozor, tento čip bude asi tím, který
bude tvořit GPU komponentu již delší dobu omílaných výkonných
APU pro superpočítače (HPC), jež mají s grafikou
integrovat CPU architekury Zen a také paměti HBM2. Vega 20 má
totiž podporovat propojovací logiku GMI (Global Memory
Interconnect), která obstarává koherentní komunikaci mezi
procesory architektury Zen s rychlostí až 100 GB/s. To
umožňuje spárovat CPU a GPU nebo propojit GPU a GPU jako
s obdobnou technologií
NVLink u Nvidie (tam je to s procesory Power8/9). Ovšem
s GMI bude možno vytvořit přímo integrovaný procesor APU,
kde bude obojí v jednom pouzdře, a tedy potenciálně
výhodněji z hlediska hustoty integrace, chlazení a asi
i spotřeby (výkonná sběrnice potřebuje na delší
vzdálenost více energie).

Vega 20 tím pádem nemusí figurovat
v herních kartách Radeon, kde bude nástupcem Vegy 10 možná
až Navi 10. Ovšem úplně jistě to asi říci nelze, AMD může
mít v tomto ohledu jinou strategii, než Nvidia.

Serverová roadmapa GPU AMD: Vega 10, 11, 20, Navi 10, 11 (Zdroj: VideoCardz)

Radeon Pro S9 Nano

Serverová roadmapa jinak odhaluje
ještě jednu chystanou novinku, tentokrát ale ještě založenou na
28nm čipu. AMD údajně už někdy brzy vydá kartu nazvanou Radeon
Pro S9 Nano. To bude zdá se obdoba Radeonu R9 Nano, tedy 175W malé
grafiky s čipem Fiji a 4 GB paměti HBM. Varianta S9
bude ale určená pro servery. Dle roadmapy má být tato karta opět
určena k aplikaci neuronových sítí („inference“), kdežto
pro trénování mají sloužit výkonnější karty s vyšší
spotřebou.