Zač je toho Pascal: Uvedení GeForce GTX 1080 je tady, vše odhaleno

17. 5. 2016

Sdílet

 Autor: Redakce

Jak bylo avizováno, dnes vypršelo NDA (tedy smluvní informační embargo) na první 16nm GPU Nvidia a na něm založenou grafickou kartu GeForce GTX 1080, která se stane nejrychlejším herním tahounem architektonické generace Pascal. Část specifikací již Nvidia prozradila při odhalení čipu GP104, na to tedy nyní navážeme a přidáme zbývající informace.

GeForce GTX 1080 s referenčním chladičem
GeForce GTX 1080 s referenčním chladičem   

 

Kompletní specifikace GP104

Nejprve k samotnému čipu. GPU
o rozměru 314 mm² obsahuje 7,2 miliardy tranzistorů
a varianta GP104-400 použitá v kartě GTX 1080 má
aktivních všech 2560 stream procesorů. Ty jsou rozděleny do čtyř
bloků GPC (Graphics Processing Cluster) po 640 shaderech, GPC je zas
rozdělen na pět SM (Streaming Multiprocessor) a konečně
každý SM je rozdělen na dva bloky po 64 shaderech. Zde je rozdíl
proti GP100,
kde je v každém SM jen jeden blok s 64 shadery. Po čipu
je je celkem rozloženo 160 texturovacích jednotek (osm na každý
SM) a 64 rasterizačních jednotek (ROP), tedy stejný počet
jako v GM204, zatímco GM200 jich mělo 96.

Schéma čipu GP104
Schéma čipu GP104

Takt GPU je v základu 1607 MHz,
frekvence Boostu je 1733 MHz; GPU tedy bude po výkonu sahat zejména
díky nebývale vysoké frekvenci. Nvidia pro GTX 1080 uvádí
teoretický výkon ve výpočtech s jednoduchou přesností 8,2
TFLOPS. Jaký je výkon v přesnosti dvojité (FP64), uvedeno
není, nejspíše však bude na 1/32 (jinými slovy nízký, okolo
250 GFLOPS?). Nikde není zmínka o tom, že by toto GPU jako
GP100 podporovalo také poloviční přesnost FP16.

Paměťový subsystém tvoří
256bitová sběrnice, u GTX 1080 obsluhující 8 GB paměti
GDDR5X na efektivním taktu 10,0 GHz (skutečný takt je jen 1250
MHz, jako u 5,0GHz GDDR5). Karta má s touto pamětí
surovou teoretickou propustnost 320 GB/s. Nvidia ovšem uvádí, že
proti Maxwellu je v GP104 použita účinnější delta komprese
dat, což může využitelné pásmo efektivně zvětšit ještě až
o další pětinu.

Celá karta má TDP 180 W a je
napájena jedním osmipinovým konektorem PCI Express. Chlazení
referenčních karet se podobá tomu, které již známe ze starších
karet, má však nově tvarovaný kryt. Výška je na dva sloty
a klasicky je použit radiální ventilátor, ženoucí vzduch
skrz vnitřek a záslepkou ven ze skříně. V základně
pasivu by pro lepší odvod tepla měla být vapor chamber.    

 

Ohlas ve světě

Jak dobře si referenční karty vedou,
si můžete v tuto chvíli již nastudovat v zahraničních
recenzích, jichž vyšla celá řada. Viz například v provedení
webu PC
Perspective
, techPowerUp či HardwareCanucks; kupodivu ale například AnandTech stihl zatím jen
krátké
„preview“
a zatím chybí třeba The Tech Report. Ti,
kdož vládnou spíše než anglicky němčinou, mohou zkusit
ComputerBase.de (nebo frančtináři Hardware.fr).
Pokud si chcete prohlédnout slajdy k uvedení, unikly již
předem všechny na
VideoCardz
. V krátkosti lze říci, že karta je podstatně
výkonnější než highend minulé generace – například onen
krátký test AnandTechu vypovídá o průměrně zhruba třetinovém
(31–32 %) náskoku na GeForce GTX 980 Ti či Radeon R9 Fury X.

 

 

Konečně asynchronní shadery

Tolik tedy ke specifikacím a nyní
se můžeme podívat na některé nové funkce a zlepšení,
které Pascal či toto konkrétní GPU přináší nad rámec svých
základních „čísel“. První z vylepšení by mělo
spočívat v implementaci asynchronně prováděných
výpočetních shaderů, tedy aspektu, v kterém Maxwell ztrácel
výkon proti architektuře GCN od AMD. V Pascalu by zřejmě
tato technika již měla být využitelná pro současně prováděné
grafické a výpočetní operace.

Asynchronous Compute
Asynchronous Compute

Dle Nvidie lze současným počítáním
úloh také snížit latenci některých úloh kritických na co
nejrychlejší zpracování, což by se mělo hodit například ve
VR. Pascal by v grafické pipeline měl podporovat formu
multitaskingu (tzv. pixel preemption), takže by měl dokázat
přerušit běžící operace kvůli rychlému dokončení nové
úlohy s vyšší prioritou.

Pixel Preemption
Pixel Preemption

Implementace těchto (konkurentních)
asynchronních operací se asi mezi GCN a Pascalem budou do
jisté míry lišit (zatímco Nvidia nyní inzeruje techniku
preempce, AMD má paralelní jednotky ACE) a zřejmě bude
chvíli trvat, než se nashromáždí dost dat k jejich
srovnání. Nvidia by snad nicméně mohla dohnat „áčko“, které
v této disciplíně měla s Maxwellem.

Zajímavá je novinka nazvaná
Simulataneous Multi-Projection, která by měla využívat specifické
funkce Pascalu na úrovni hardwaru. Umožňuje současný výpočet
více pohledů na jednu scénu, což by mělo být užitečné ve VR
hrách – ve virtuální realitě také Nvidia pro GP104
slibuje největší zvýšení výkonu. Část práce se při použití
Simulatenous Multi-Projection pro vícenásobné pohledy nemusí
opakovat, čímž se ušetří spotřebovaná výpočetní kapacita.

Simultaneous Multi-Projection
Simultaneous Multi-Projection

 

Po stránce zobrazení bude GTX 1080
podporovat nová vysoká rozlišení umožněná DisplayPortem
1.3/1.4, na nějž je připravena, ačkoliv zřejmě ještě nemá
hotovou certifikaci. GPU nadále podporuje až šest výstupů, ovšem
jen čtyři smějí být aktivní naráz. Maximální rozlišení je
7680 × 4320 bodů, avšak k tomu potřebujete dva kabely DP
1.3, běžné maximum je zřejmě 5K (5120 × 2880 bodů).

S Pascalem také Nvidia přichází
s novou funkcí FastSync, což je nový způsob obnovování
obrazovky. Nepoužívá variabilní frekvenci jako G-Sync či
FreeSync, jde o klaiskcé konstantní obnovování, ale na
rozdíl od obvkylého způsobu VSync není spjato s enginem hry.
Jde podle všeho o něco připomínajícího triple buffering
v OpenGL – engine hry vykresluje nezávisle do zásobníku
svou maximální rychlostí, není zamčen na maximální frekvenci
jako s aktivním VSync. Monitor však ve svých intervalech
kreslí vždy jen hotové snímky, tedy poslední dostupný,
a nikoliv necelé, takže nedochází k trhání.

Fungování FastSync
Fungování FastSync

 

GP104 hardwarové dekóduje 10bitové
i 12bitové HEVC

Samostatnou kapitolou pak jsou
multimédia. K tradičnímu H.264 (dekódování i nahrávání
v 4K) přibylo dekódování 4K VP9 (až dva proudy při 120
snímích za sekundu a 320 Mb/s). Novinkou je hardwarové
dekódování HEVC, a to ve velmi pokročilé podobě. Je
podporován profil Main, Main 10 (použitý na Ultra HD BluRay),
a také 12bitový Main 12, byť ten asi v praxi moc
využíván nebude. V případě 8bitového HEVC by dokonce měl
čip zvládat dekódování v rozlišení 8K, byť jen při 30
snímcích za sekundu. Pro Main 10 a Main 12 limity neznáme,
budou však patrně méně štědré. Co je ještě překvapivější,
je podpora enkódování HEVC v profilu Main 10.

Přehled schopností multimediální akcelerace
Přehled schopností multimediální akcelerace

Nvidia pro něj totiž má své
využití – tento 10bitový režim bude sloužit pro
zachytávání a streamování her s HDR obrazem – tedy
s vysokým dynamickým rozsahem. Bude tak možné hrát v HDR
kvalitě na televizi skrze konzoli Shield a technologii
GameStream (tedy pokud vám nevadí kompresní artefakty). HDR
zobrazení pro hry je další z novinek, které Nvidia pro
Pascal přichystala, následujíc v tom AMD, které HDR pro
Radeony Polaris (ale také současnou 28nm řadu 300/Fury) ohlásilo
již před časem
. První HDR tituly by se podle něj prý měly
objevit v roce 2017.

GeForce GTX 1080 podporuje HDR obraz
GeForce GTX 1080 podporuje HDR obraz

 

Už jen dvojité SLI

Zatímco tyto funkce byly přidány, je
zde i jedna ztráta. Nvidia uvádí, že podporuje jen SLI dvou
karet a vícenásobné „nepodporuje“. S novými HBI SLI
můstky ani nic jiného zrealizovat nepůjde. Ovšem se starými lze
karty fyzicky propojit i do třícestné či čtyřcestné
konfigurace. Problém je, že vám toto nebude automaticky fungovat
v ovladačích. Nvidia totiž zřejmě nechce investovat čas do
podpory konfigurací, které využije naprosté minimum lidí. Více
karet se má dát zprovoznit jen bizarní oklikou. Údajně se budete
muset registrovat na webu a požádat o klíč „enthusiast
key“. Tento kód vám pak má v ovladačích SLI ×4/×3
polooficiálně zprovoznit. Web PC Perspective to hodnotí tak, že
jde zřejmě o pokus uživatele od těchto spádů pomalu
odradit. Eventuálně tedy možná Nvidia zatěžující podporu tří
a více karet zařízne zcela.

HB SLI můstek pro GeForce GTX 1080 (Zdroj: VideoCardz)
HB SLI můstek pro GeForce GTX 1080 (Zdroj: VideoCardz)

 

Pro nejrychlejší vysokohorská přirážka

Co se týče dostupnosti a ceny
karet, tato informace byla již známa. Oficiální cena je 599
dolarů, což momentálně odpovídá 17 300 Kč, a dostupnost
má nastat příští pátek, 27. května. Ovšem tato oficiální
cena se týká jen nereferenčních modelů, které hned na počátku
dostupné nebudou.

ICTS24

Pokud budete chtít kartu hned
v prvních týdnech prodejů, bude podle všeho vaší jedinou
možností referenční karta. Ta má však nezvykle cenu nastavenou
výš, rovnou na 699 $ (a Nvidia
ji nyní raději
označuje jako „Founders Edition“). To
vychází na 20 200 Kč, takže nedočkavci si budou muset
připlatit asi tři tisíce. Za jak dlouho budou dostupné
nereferenční karty, není v tuto chvíli známo, jejich
chlazení však bývá obvykle účinnější i tišší, což
je další dobrý důvod, proč počkat.

Zdroje: PC
Perspective
, VideoCardz