Co se specifikací týče, potvrzují se nám plně dosavadní úniky a informace o čipu GM204. GeForce GTX 980 má 2048 stream procesorů architektury Maxwell, které běží na 1126 (základ) až 1216 MHz (boost). GPU obsahuje skutečně 128 texturovacích jednotek a 64 rasterizačních. Paměťová sběrnice má šířku 256 bitů, přičemž paměti GDDR5 o kapacitě 4 GB běží na 7 GHz efektivně. Navíc má ale GPU GM204 také velkou L2 cache o kapacitě 2 MB. A co je třeba opět vypíchnout, karta má velmi pěknou spotřebu – TDP je stanoveno na 165 W. Pro napájení tedy potřebuje jen dva šestipinové konektory.
GeForce GTX 980 na oficiálních obrázcích Nvidie
GeForce GTX 970 coby levnější model bude mít čip GM204 o něco ořezaný. Aktivních bude jen 13 z 16 bloků SMM, což dává 1664 stream procesorů a 104 texturovacích jednotek (pokud se nepletu). GPU poběží také na nižších taktech, u referenčních modelů na 1050 MHz v základu a 1178 MHz při boostu. Nvidia ale zachovala plnou šířku paměťové sběrnice (takže rasterizačních jednotek by mělo být také 64 kusů) i takt pamětí 7 GHz. Také tento model bude standardně vybaven 4 GB paměti. Vedle nižší ceny také bude GTX 970 úspornější než GTX 980 – podle specifikací má TDP dokonce jen 145 W.
Oproti starším informacím má nižší model GTX 970 nakonec stejný chladič jako vyšší sestra, jedná se o již dobře známé řešení pracující například i na kartách Titan. Obě karty jsou vybaveny (tedy v referenční verzi) výstupy DVI, HDMI 2.0 a hned třemi DisplayPorty 1.2; naráz však mohou být aktivní jen čtyři obrazovky. Mimochodem, zatímco GTX 980 podporuje SLI se čtyřmi kartami, s modelem GTX 970 Nvidia počítá jen pro trojité SLI.
Co jsme doposud nevěděli, byl výkon čipu GM204 ve výpočtech s dvojitou přesností. Potvrzuje se, že jde o herní GPU, nikoliv o výpočetní čip jako GK110. Výkon v FP64 proto bude na podobně nízké úrovni jako u malého Maxwellu GM107 – proti výpočtu v jednoduché přesnosti poběží FP64 na 1/32 výkonu.
GM204: DirectX 11.2 a 11.3
Architektura Maxwell v čipu GM204 přináší docela slušné množství technologických novinek. V prvé řadě je to hardwarová podpora pro DirectX 11.2 (Kepler plně pokrýval jen tzv. „feature level“ 11_0). GM204 tím pádem podporuje funkce jako sparse textures, tiled resources a target independent rasterization. GPU ale navíc obsahuje i funkce spadající do zcela čerstvého DirectX 11.3; mělo by plně podporovat nový feature level 11_3.
S čipem GM204 Nvidia uvádí technologii Voxel Global Illumination (VXGI), která slibuje realistický výpočet osvětlení scény v reálném čase, a to jak přímého, tak nepřímého. Do podrobností zde nebudeme zabíhat, můžete si je přečíst v materiálech Nvidie (zde a zde). Vše by mělo fungovat díky aproximaci objektů do sad malých „kostiček“ (voxelů), s nimiž se potom odražené světlo vyhodnocuje. GM204 používá k akceleraci těchto výpočtů funkce z DirectX 11.3, implementace Voxel Global Illumination je tedy závislá na hardwaru tohoto čipu a na starších GPU nepojede. Podporu pro VXGI Nvidia nyní přidává do svých knihoven GameWorks, takže by ji vývojáři již brzy měli mít možnost vyzkoušet. Ještě do konce roku by se také měla objevit například v Unreal Enginu 4.
Další novinkou, jejíž jméno již uniklo před uvedením, je Dynamic Super Resolution. Nvidia slibuje, že vám nabídne kvalitu odpovídající rozlišení 4K na jakémkoli monitoru se standardním rozlišením Full HD (1920 × 1080 bodů). Ve skutečnosti jde ale o velmi prostou věc. Karta vykreslí obraz na vyšším rozlišení, než má vaše LCD (tedy například v onom 4K), a poté obraz zmenší na správnou velikost speciálním škálovačem. Tento algoritmus má zajistit, že výsledek bude vypadat lépe než nativní rozlišení (nečekejte ale, že by kvalita skutečně byla stejná jako u 4K monitoru). Dynamic Super Resolution by neměla být hardwarově závislá na Maxwellu a Nvidia ji zřejmě zpětně aktivuje i pro další (highendové) modely. Zapnout si ji budete moci prostřednictvím softwaru GeForce Experience, kde také půjde nastavit, na jakém rozlišení se má hra vykreslovat.
Dynamic Super Resolution lze zapnout v GeForce Experience
Exkluzivně pro Maxwell je naopak určený nový režim vyhlazování, Multi-Frame Sampled Anti-Aliasing (MFAA). Je založený na programovatelných vzorech pro multisampling, které mohou být měněny snímek od snímku, případně i v rámci jediného snímku. Navíc Nvidia používá temporální filtr, takže pro vzorkování lze využít zároveň pixely ze současného a předchozího snímku. Podle Nvidie má 4xMFAA kvalitu odpovídající 4xMSAA, ovšem je výpočetně levnější, stojí jen tolik výkonu, co 2xMSAA.
VR Direct
Nvidia také u GeForce GTX 980 a GTX 970 slibuje optimalizace pro virtuální realitu s brýlemi jako je Oculus Rift. Ty spočívají zejména ve snižování prodlevy mezi pohybem hlavy coby vstupem a zobrazením výstupního snímku, který na pohyb musí co nejrychleji reagovat. Tuto prodlevu se Nvidii z circa 50 ms údajně podařilo redukovat zhruba na polovinu. Jednak redukcí času, který spotřebuje ovladač a operační systém, kromě toho ale také GPU vykresluje napřed jediný snímek místo čtyř.
Hlavním trikem, který odezvu systému urychluje, je ale tzv. Asynchronous Warp. Jde vlastně tak trošku o podvod, lépe řečeno o optimalizaci na úkor kvality. Tato technika totiž transformuje již vykreslené snímky na základě pohybu, zaregistrovaného až během jejich počítání nebo i po jejich dokončení. Místo vykreslení nového, aktuálnějšího snímku tedy AW vezme snímek „starší“, který už je dokončen, a aplikuje na něj transformace, které simulují zaregistrovaný pohyb uživatele. Výsledek tedy není přesný, zato je ale reakce na pohyb mnohem rychlejší a uživatel není rušen pomalou odezvou.
S použitím triku Asynchronous Warp lze odezvu VR srazit až o polovinu
Nvidia také pro virtuální realitu přidala speciální režim SLI, označený VR SLI. Ten přiděluje každému oku jedno GPU, které pak vykresluje jeho obraz. Tento režim by měl snad lépe škálovat, také však nezvyšuje prodlevu, což by nastalo, kdyby se obraz pro obě oči počítal najednou metodou AFR. Virtuální realita by tedy mohla dvojici GPU v počítači poměrně efektivně využívat.
HEVC a enkódování ve 4K
GM204 dostalo poměrně podstatně vylepšený enkodér videa NVENC. Ten nyní podporuje kompresi videa v rozlišení 4K při 60 snímcích za vteřinu; navíc ale nyní umí nový formát HEVC (či H.265). Ten nicméně ještě není zpřístupněn běžnému softwaru, takže například v GeForce Experience budete stále nahrávat do H.264, byť už i ve 4K.
Zatímco enkodér pro HEVC čip GM204 má, trošku paradoxně mu chybí hardwarový dekodér. GM204 podporuje pouze hybridní dekompresi tohoto formátu, která kombinuje hardwarovou akceleraci některých částí procesu (zřejmě entropy decode, kde je HEVC je velmi podobné H.264) s algoritmy běžícími na stream procesorech. Tento GPGPU kód by zřejmě měl zahrnovat fáze jako je MC, intra predikce a loopfilter. Karta by jím měla být vytížena podobně jako při 3D hře, takže na rozdíl od plně hardwarového přehrávání tato metoda asi nevylepší spotřebu a hlučnost při dekódování. Plně hardwarového dekodéru se tedy dočkáme až v nějaké příští generaci.
Cena, dostupnost
Prokousali jsme se hromadou informací, které Nvidia s uvedením karet vychrlila, a zbývá už dodat jen obvyklý závěr, čili „kdy a za kolik“. Karty by dnešním dnem měly být v nabídce různých výrobců, kteří s Nvidií tradičně spolupracují, a co je důležitější, už je mají skladem i různé české obchody. Ceny Nvidia oficiálně stanovila na 329 USD pro GeForce GTX 970 a 549 USD pro GeForce GTX 980. V našich končinách pak karty seženete za sumy začínající zhruba na 9500 CZK pro nižší model a 15 500 CZK pro GeForce GTX 980.