Radeon RX 480 je venku. Bude nejvýhodnější grafikou FinFETové generace?

29. 6. 2016

Sdílet

 Autor: Redakce

Po čtyřech týdnech od představení na Computexu je zde konec čekání a první 14nm grafika AMD, Radeon RX 480, se vydává na trh. Během této doby a zvlášť v posledních dnech se pořád objevovaly nějaké úniky informací, takže o parametrech je již jasno. Ovšem jde o novou či značně vylepšenou architekturu, a tak frekvence a počet CU nejsou všechno.

 

Nová architektura začíná v mainstreamu

Radeon RX 480 je mainstreamová karta,
nikoliv model, který by byl zamýšlen pro pozici nejvýkonnější
grafiky v nabídce. Ovšem na rozdíl od Nvidie se AMD rozhodlo
postupovat při uvádění z druhé strany, a tak se
FinFETové GPU objevuje nejprve na této pozici, kde tudíž
nepředstavuje protivníka 16nm grafik Nvidie (GeForce GTX 1070,
1080). Radeon RX 480 je dle AMD kartou, která je ideální pro hraní
na rozlišeních okolo 2560 × 1440 bodů, ale také jako dostupný
model s výkonem adekvátním pro VR brýle. Ačkoliv výkon by
měl odpovídat GPU Hawaii, model je vlastně kartou na pozici,
kterou dosud držel Radeon R9 380X.

AMD Radeon RX 480

Nové značení

Změněné značené, které opustilo
označení R9/R7, má mít praktický význam. První číslice (4)
značí generaci architektury GCN, druhé pak výkonnostní stupeň.
Podle informací od AMD je osmička a sedmička (RX 480/470)
vyhrazena pro karty na standardní rozlišení, tedy do 2560 × 1440
bodů a Full HD. Tyto karty by obvykle měly mít 256bitovou
paměťovou sběrnici, ale pravidlo to možná vždy nebude. Devítka,
která zatím čeká na využití, pak je znakem highendu, karet
s vyšší paměťovou propustností (384/512bitová sběrnice,
HBM), které již budou mít páru i do rozlišení jako 4K.

Konečně nižší pětka a šesta
budou vyhrazené pro základní herní grafiky pro hry typu MOBA/“
esports“, typicky se 128bitovými paměťmi. Až do této úrovně
budou mít karty společný prefix „RX“, který značí, že jde
o herní kartu. Lowendové modely níže již budou prostě
„Radeon 450“ (například), což značí, že slouží jako
základní zobrazovadlo či pro přehrávání videa a podobně,
ale již není doporučen pro „závažnější“ hraní.

 

 

 

Polaris 10: hardware

GPU, vyráběné na 14nm procesu firmy
GlobalFoundries, se (jak již asi víte) jmenuje Polaris 10, což je
kód sestávající z názvu architektury a čísla, které
má být čistě pořadové. Druhý FinFETový čip Polaris 11 je
méně výkonný a jmenuje se takto proto, že byl údajně
dokončen až po Polarisu 10. Ten obsahuje 5,8 miliardy tranzistorů a měří 232 mm² (Čína tedy měla pravdu).

Polaris 10 obsahuje celkem 36 CU, tedy
2304 stream procesorů, což Radeon RX 480 používá beze zbytku.
Jde o maximální konfiguraci, která neponechává nic
v rezervě. GPU má jeden Graphics Command Processor, čtyři
ACE (Asynchronous Compute Engine), dva hardwarové schedulery (HWS)
a čtyři jednotky Geometry Processor. Texturovacích jednotek
je 144 (čtyři v každé CU), rasterizačních 32, jako předtím
v čipech Tahiti a Tonga. V každé CU jsou také
čtyři jednotky load/store o šířce 32 bitů.

„Jádro“ GPU má tentokrát uváděné
dva takty (toto
se tedy potvrzuje). Maximální hodnota turba pro RX 480 je 1266 MHz,
AMD ale negarantuje, že na něm karta poběží většinu času,
a proto je uvedena také základní (v praxi minimální)
frekvence, jež je 1120 MHz. GPU by se mělo během hraní pohybovat
dynamicky někde mezi, zatímco u předchozích grafik na bázi
GCN se při provozu obvykle drželo maximálního taktu. Záviset
bude na teplotě a na TDP, které je dle specifikací 150 W.

AMD Radeon RX 480

 

Delta komprese

AMD k Polarisu 10 používá
standardní paměti GDDR5, jejichž sběrnice je 256bitová
a v Radeon RX 480 se bude dát pořídit v 8GB
variantě, ale i v levnější verzi s 4 GB RAM.
Morální životnost GDDR5 podle svých slov AMD vylepšilo jednak
použitím v současnosti nejrychlejší třídy čipů,
běžících na efektivním taktu až 8,0 GHz. S těmi má i pouze
256bitová sběrnice hrubou propustnost 256 GB/s (dvě třetiny
kapacity Radeonu R9 390X).

Většina karet, které jsme zatím viděli, vskutku používá 8GHz paměti, ale referenční návrh údajně připouští i pomalejší 7GHz čipy (224 GB/s). Ty má AMD použité u 4GB referenční karty, ale výrobci budou mít patrně volnou ruku u obou typů. 8GHz karty budou patrně o něco rychlejší (i když rozdíl nemusí být vždy významný), takže pokud máte možnost a cenový rozdíl není velký, doporučuji se zaměřit na ně.

Paměťový subsystém by každopádně měl
být silnější, než říká papír. Má totiž vylepšenou delta
kompresi barev (DCC), která podporuje bezeztrátové poměry 2:1,
4:1 a 8:1 a má vylepšovat propustnost, ale i spotřebu
energie.

Efektivitě pamětí má pomáhat i určité vyladění a zvětšení
L2 cache, která seskupuje požadavky pro lepší využití zdrojů.
Kapacita L2 cache je 2 MB, každá CU má pak 16KB L1 cache, 4KB
skalárních registrů a 4×64 KB vektorových registrů.

 

Výkonnostní optimalizace

Tím se dostáváme k architektonickým
zlepšením shaderů a GPU jako takového. Ty nejsou
zanedbatelné, podle informace od AMD by měly zlepšovat výkon při
stejných parametrech (počet CU a takt) až o 15 %,
i když nejspíš bude záležet na situaci. Pokud začneme
u samotné CU, pak byl vylepšen prefetch instrukcí, díky
kterému by měly být eliminovány některé prodlevy, kdy pipeline
stream procesorů běží naprázdno, a vylepšovat efektivitu
cachování kódu. Buffery pro instrukce jednotlivých „vln“
(wave) jsou prohloubené, což podle AMD zvyšuje výkon na
jednotlivém vlákně.

 

 

Darmožroutské primitivy pryč

Nad samotnými shadery je zlepšení ve
zpracování geometrie (Geometry Processor), které by zřejmě mělo
být hodně podstatné. Novinkou je Primitive Discard Accelerator,
který slouží k eliminaci prvků scény, které se nepodílejí
na její viditelné části nebo v ní mají mají nulovou
plochu. Takové trojúhelníky jsou v raných fázích
zpracování detekovány a vyhozeny z dalších operací.
Přínos této optimalizace má růst s úrovní MSAA a také
s úrovní teselace, v které by měla být eliminace
primitiv znát.

 

Hardware scheduler (HWS) a vylepšené
asynchronní shadery

Asynchronní shadery či výpočty by
také v architektuře Polaris měly nabízet evoluci, spojenou
s integrováním hardwarových schedulerů (HWS). Ty přebírají
část práce ovladače a rozdělují práci výpočetním
prostředkům, přičemž umožňují předtím nemožné věci.
Úlohy či procesy mohou opět zadat současně (obvykle je to
využito k proložení grafického a obecného výpočtu,
čímž se využijí jinak volné prostředky, podobně jako
v případě HT u procesorů), nebo mezi nimi prostě
přepínat („preemption“, takto by měla věc řešit Nvidia).

 

S HWS ale je možné pracovat
s prioritou jednotlivých úloh a vyvažovat jejich výkon.
Scheduler by měl být konfigurovatelný a lze jej údajně
aktualizovat mikrokódem. S jeho pomocí bude možné některým
úlohám přiřadit prioritu, nebo jim zcela vyhradit část CU, aby
je měly vždy volné pro sebe.

Lze tak implementovat tzv. „Quick
Response Queue“, která na latenci kritickým úlohám rychle
přidělí velkou část prostředků, aby byla tato práce hotova co
nejdříve. Pro na latenci nejcitlivější vlákna je pak dostupný
i scheduling s prioritou „realtime“, využitelný pro
audio nebo VR.

 

TrueAudio Next

Právě tato novinka v Polarisu
sebou nese jednu velkou změnu. Od teď může přímo na shaderech
běžet výpočet fyziky prostorového zvuku s technologií
TrueAudio. To v generaci Polaris již nebude závislé na
přítomnosti licenčního DSP v GPU, ale bude fungovat takto
softwarově a na všech grafikách pod názvem „TrueAudio
Next“.

S touto formou asynchronních
shaderů s pokročilou správou priority a možností
používat je k výpočtům s nízkou latencí totiž lze
konečně dosáhnout potřebné stability a předvídatelnosti
výkonu i bez zvláštního bloku DSP. Navíc lze škálovat na
vyšší výkon, kdežto klasické TrueAudio mělo určitý strop.
Také TrueAudio Next bude dostupné jako knihovna s otevřeným
kódem v projektu GPUopen.

Polaris 10 je tu, architektonické změny

Nové funkce, software

Podpora 16bitových výpočtů

Polaris 10 má také nativní podporu
pro výpočty s 16bitovými hodnotami jako datovým typem (a to
celočíselnými i „floating point“). Ty lze použít ke
snížení spotřeby aplikace a k zefektivnění využití
paměti a registrů, samotná hrubá výpočetní propustnost
(„TFLOPS“) je patrně stejná. Tato funkce bude patrně
využitelná hlavně k ručním optimalizacím a pro
výpočetní využití, takového číselné hodnoty může využít
například strojové učení a analýza obrazových dat.

AMD Radeon RX 480

 

Intrinsics Functions: asemblér pro GCN

Pro ruční optimalizace má jinak AMD
přichystánu možnost používat cosi jako ekvivalent ručního
asembléru u programů pro CPU – intrinsics functions. Ty
programátorovi umožní psát přímo pro interní instrukční sadu
GCN a vydřít tak co nejvíc výkonu pro kritické části
kódu. Používat to bude možné pod DirectX 12, Vulkanem i DirectX
11 a nástroje budou dostupné v rámci projektu
GPUOpen
(do kterého AMD od jeho zveřejnění vložilo i řadu
dalšího softwaru a nástrojů pro vývojáře). Programátor
her na PC tak bude podle AMD mít možnost optimalizovat výkon
podobně, jako vývojáři her pro konzole.


 

 

Diagnostika při spuštění

Polaris 10 má i některé další
triky, které se netýkají ani tak optimalizace výkonu, jako
optimalizace fyzického fungování čipu vůbec. Od APU Carrizo
Bristol
Ridge
byly převzaty pokroky ve správě spotřeby a v ovládání
taktu GPU, včetně detekce
poklesu napětí a rychlé reakce na něj
(„Adaptive
Clocking“, „AVFS“).


 

Stejně jako Bristol Ridge čip Polaris
10 při spuštění provádí diagnostiku kvality napájení a své
vlastní kondice, podle čehož také umí zkalibrovat své takty.
Výsledkem je, že lze z čipu bezpečně a při zachování
stability vytáhnout nějaké MHz navíc, či se vyhnout tomu, aby po
čase nějaká degradace učinila GPU nestabilním. GPU díky těmto
technikám nemusí mít zbytečně zvýšené napájecí napětí pro
rezervu, a tím pádem se ušetří na spotřebě.

 

Obrazový výstup: HDMI 2.0b,
DisplayPort 1.4, HDR

Ještě než s hardwarovými
aspekty skončíme, je třeba připomenout, že 14nm GPU jako
významnou novinku (stejně jako 16nm od Nvidie) přinášejí
podporu pro vyšší rozlišení monitorů. S DisplayPortem 1.3
(porty mají být připravené i na DP 1.4, který se ale asi do
monitorů dostane až později) bude možné provozovat Full HD
monitory běžící až na 240 Hz, a to i s 10bitovými
barvami (HDR), 2560 × 1440 bodů poběží na 240 Hz při
8bitech (HDR 200 Hz), u 4K obrazovek bude možných 120 Hz
při 8 bitech a 96 Hz při 10 bitech. Rozlišení 5120
× 2880 bodů poběží na 60 Hz, ale jen při 8 bitech
(tedy bez HDR). K připojení 5K obrazovek ale konečně bude
třeba jen jeden kabel, podporují-li DP 1.3.


 

 

12bitové a 10bitové barvy

HDR, neboli obraz s vysokým
dynamickým rozsahem, je jednou z novinek Polarisu, i když
ovladače mají zpřístupnit částečnou podporu také
pro Radeony řady 300, Fury a Nano
. HDR přináší vyšší
rozsah gamutu barev (sytosti) a také jasu. Výhledově by se
tedy lepší monitory měly dostat z relativně omezeného
gamutu sRGB na na barevné prostory jako P3 Digital Cinema a později
snad až Rec. 2020, který má dvojnásobek viditelných barev. HDR
bude jednak použito v audiovizuálním obsahu, uplatnění ale
má také ve hrách. Obraz s ním může být jasnější při
zachování detailů v temnějších částech a mít
živější barvy, beze ztráty přesnosti: Polaris podporuje 10bitové a dokonce i 12bitové barevné složky.

 

Ve hrách by dle AMD neměl být větší
problém HDR nasadit, protože enginy již nyní pracují interně
s větším rozsahem a přesností, které pak mapují na
omezený barevný prostor sRGB. Do značné míry tak bude stačit
jen změnit výstup a mapování – na což bude AMD
nabízet SDK Photon, podporující DirectX 11 a DirectX 12
(Vulkan zatím zmíněn není, ale opomenut asi nebude). Jednou
z výhod tohoto SDK bude to, že se přizpůsobí monitoru a dle
jeho charakteristik (údaje o jasu, kontrastu a barevném
gamutu) upraví vykreslování přímo ve hře, takže pak nebude
třeba další konverze v monitoru. Photon by měl být
použitelný i při přehrávání HDR videa.


 

 

 

10bitové HEVC, dekódování VP9

Pro HDR video podporuje Polaris 10 také dekódování 10bitového videa ve formátu HEVC Main 10, a to až do rozlišení 4K. Bude tedy plně podporovat přehrávání disků Ultra HD Bluray. Komprese videa v GPU také podporuje 4K HEVC při 60 snímcích za vteřinu, již ale asi jen v osmibitovém profilu. Kvalita má ale být vyšší, neboť enkodér používá techniku lookaheadu, která částečně kompenzuje nevýhody jednoprůchodového kódování. Polaris 10 má jinak také mít akcelerované dekódování VP9, ale to bude zprovozněno až v někteérm z nadcházejících ovladačů.


 

 

 

Variable Rate Shading

Různých změn ve vykreslování
budeme asi teď vídat více, což souvisí i s příchodem
VR brýlí jako nového zobrazovacího zařízení. Na ty míří
patrně optimalizace nazvaná Variable rate shading. Její princip je
poměrně prostý – rozdělí obrazovku na několik sekcí,
v nichž lze pak pomocí tzv. Multi-viewport API vykreslovat
s různou úrovní kvality či detailů.


 

Typicky s tímto trikem tedy bude
centrum obrazu vykreslováno s vyšším rozlišením
a periférie s nižším, jde tedy o prioritizaci
nejdůležitějších částí zobrazené scény. Zajímavý detail
je, že tento trik je připraven na spolupráci s detekcí směru
pohledu, takže bude umět reagovat na to, když se uživatel na onu
zanedbanou periférii podívá – ono centrum zájmu by mělo
být schopno se v obraze dynamicky přesouvat podle směru
pohledu oka.

 

CrossFire stále pro čtyři grafiky
(a víc v DX 12)

Než různé softwarové technologie,
které AMD v souvislosti s Polarisem představilo, úplně
opustíme, podíváme se ještě na CrossFire. Radeon RX 480 podle
AMD oficiálně podporuje CrossFire až čtyř karet (zatím tedy
firma nepodnikla stejný krok jako
Nvidia
, možná proto, že tradičně vytváří duální
grafiky), a to bez externích můstků (což mu asi výrobci
předražené herní bižuterie budou zazlívat). To ovšem platí
pro tradiční multi GPU realizované v ovladačích. Podle AMD
se nyní tato funkce začne více přesouvat do rukou vývojářů.
V DirectX 12 a Vulkanu pomocí explicitního multi GPU
přímo řízeného enginem hry bude počet grafik spolupracujících
na vykreslování neomezený. K implementaci explicitního multi
GPU mají údajně být k dispozici různé pomůcky a nástroje
od MS, ale také AMD (opět v rámci GPUOpen).

 

Nicméně určitá zlepšení se údajně
chystají také pro standardní CrossFire ze staré školy v DirectX
11, běžící metodou AFR. Ta spočívá v střídavém
počítání snímků na individuálních GPU. To, jak se na monitoru
řadí obrázky z více GPU za sebou, ale většinou vede
k nestejným časům mezi jednotlivými snímky, tedy jevu
nazývanému microstuttering. Proti této bolesti chystá nyní AMD
údajně vylepšený frame pacing pro režim AFR, který by měl
přijít v některé budoucí verzi ovladačů Radeon Software.
Tento AFR frame pacing by měl v CrossFire upravovat časy
zobrazení snímků tak, aby nebyly příliš dlouhé nebo zase
příliš krátké. Díky tomu by měl být obraz plynulý, byť za
cenu mírně horší latence (ta by se ale neměla zhoršit o víc,
než o čas jednoho snímku).


 

 

AMD Wattman

Poslední změnou pro ty, kdož taktují, je pak nový nástroj na taktování, nazvaný Wattman. Ten nahrazuje aplikace AMD overdrive a umožňuje manipulaci s nastavením otáček ventilátoru, limitů a cílových provní teplot, TDP, napětí a frekvencí. Podstatné je, že umí tyto parametry individuálně změnit pro každý z několika výkonnostních režimů, takže máte kontrolu nad celou křivkou výkonu při různé zátěži.


 

 

 

 

Závěr... Ceny jsou 6000 a 7000 korun

A tím jsme prakticky u konce
premiérového přídělu informací. Zbývají už prakticky jen
nízké „materiální“ záležitosti. Radeony RX 480 mají být
v obchodech hned, a to údajně ve velkých počtech. Od
počátku mají být dostupné jak 8GB, tak 4GB verze. Ty se
pochopitelně liší cenou. Menší 4 GB model má oficiální
cenovku jak známo stanovenu na 199 dolarů, u ná sje oficiálně doporučeno 6095 Kč.
Cenu 8GB verze, jejíž parametry se jinak neliší, nastavilo AMD na
239 dolarů, pro naše území je oficiální cenovka 7085 Kč. To
jsou ceny doporučené, v prvotním zápalu se ale asi nevyhneme
tomu, že bude cena leckde nadsazená. Jak rychle se srovná, to
teprve uvidíme, bude to určitě záviset i na poptávce a na
tom, zda se karty nebudou z počátku vyprodávat.

Na pořadu dne jsou prozatím jen karty
s referenčním chlazením s radiálním ventilátorem
a napájením jedním šestipinovým konektorem (a pro
rekapitulaci: karta má jako výstupy standardně tři DisplayPorty
1.3/1.4 a jedno HDMI 2.0b). Termín dostupnosti karet
nereferenčních AMD přímo nesdělilo a závisí spíše na
jednotlivých výrobcích, podle
neoficiálních zdrojů
by se ale mohly začít objevovat zhruba
od poloviny července, počkáte si na ně tudíž minimálně dva
týdny. Na nreferenční karty se asi vyplatí počkat zejména pokud chcete velmi tiché chlazení, dle testů je ten referenční spíše průmerný, byť teploty úspěšně drží někdo kolo 80 stupňů.

 

 

Jelikož nemáme vlastní recenzi, budeme vás muset odkázat na výsledky, které mají v den vvypuštění dostupné renomované zahraniční weby. A to například The Tech Report, německy ComputerBase, či PC Perspective, podle nějž je RX 480 rychlejší nebo stejně rychlý jako GeForce GTX 970 ve všech stestovaných hrách kromě GTA V, kde se údajně objevují problémy, které by mohla opravovat aktualizace ovladače. GCN obecně a také Polaris má zdá se  náskok spíše v DirectX 12 (Hitman, AotS, někdy značný), které mu zdá se sedí lépe, než Maxwellu. AnandTech má zatím jen preview, dle kterého se také po zprůměrování z více her RX 480 dostavá o pár procent před GeForce GTX 970 a Radeon R9 390. Na tomto výkonnostní hodnocení (alespoň s první verzí ovladačů) se testy více méně shodují. Hlavní přínos karty je tak asi třeba vidět v tom, že tuto úroveň výkonu přináší o cenovou třídu níže a výkonnostní nárůst proti GTX 960 nebo R9 380X už je velmi velký.

 

bitcoin_skoleni

Radeon RX 480 (PCOnline)
Polaris 10 v Radeonu RX 480 (PCOnline)

Zdroje: AMD