3,5GB záhada u GeForce GTX 970 objasněna. Má míň ROP a L2, než Nvidia tvrdila

28. 1. 2015

Sdílet

 Autor: Redakce

Ačkoliv je GeForce po stránce výkonu i provozních vlastností (tedy ponecháme-li stranou často hlášené pískání cívek) momentálně jednou z atraktivnějších grafik, nevyhnuly se jí kontroverze. Tento měsíc se začalo diskutovat o tom, že karta očividně nemůže efektivně využít plnou kapacitu své 4GB paměti a posledních 512 MB je zdá se drasticky pomalých. Nvidia se k této záležitosti vyjádřila jen před pár dny. Neřekla ale vše – vlastnosti paměťového subsystému jsou totiž způsobeny tím, že je GPU ořezané více, než tvrdily při vydání zveřejněné specifikace.

Pro připomenutí: v onom posledním prohlášení Nvidia přiznala, že karta má svůj paměťový prostor rozdělený do dvou částí: na 3,5 GB, kde lze měřit plnou, vysokou rychlost a zbylých 512 MB, kde už to slavné není. Tato horní část paměti je podle testů pomalá a karta se ji také snaží nevyužívat, dokud skutečně nemusí. Nvidia ale tak docela nevysvětlila, proč tomu tak je. Redaktoři webů PC Perspective a AnandTech (a nejspíš i dalších) ovšem do věci rýpali dál. Podle toho, co jim nyní Nvidia prozradilila, je zpomalení poslední osminy RAM způsobeno deaktivací části rasterizačních jednotek (ROP) a L2 cache, o němž se doposud nevědělo.

V recenzích GeForce GTX 970 jste si mohli přečíst, že GeForce GTX 980 (tedy varianta s plným čipem GM204) má rasterizačních jednotek 64, její L2 cache má 2 MB, a že u GTX 970 jsou oba údaje stejné. Novináři v oficiálních materiálech skutečně taková čísla dostali, jenže šlo o omyl. Nvidia nyní specifikace ex post opravila a přiznala, že rasterizačních jednotek je u modelu GTX 970 jen 56 a L2 cache má 1792 KB. Část (jedna osmina) dotyčného subsystému je totiž na GTX 970 vypnutá, jak můžete vidět na následujícím schématu. Zatímco řadičů GDDR5 (o šířce 32bitů) je zachováno osm, čímž tvoří 256bitovou sběrnici, tak portů vedoucích k těmto řadičům z crossbaru a spojených s ROP a bloky L2 cache je aktivních jen sedm.

  Blokové schéma čipu GM204 v GeForce GTX 970. Osmina ROP a L2 cache je deaktivována
Blokové schéma čipu GM204 v GeForce GTX 970. Osmina ROP a L2 cache je deaktivována

Vypnutí onoho osmého portu, bloku cache a na něj navázaných osmi ROP by normálně vynutilo také vypnutí příslušející části RAM a jejího řadiče. Ta by měla jen 3,5 GB a sběrnice by byla 224bitová. Nvidia však místo toho osadila plné 4GB a paměť, která přísluší deaktivovanému bloku L2, napojila na blok sedmý jakousi postranní cestičkou, která je v GM204 přichystána. Zatímco ostatní tedy spravují po 512 MB paměti, tento má na sebe navěšeno dvakrát tolik. Přístup do této osmé osminy RAM je ale zpomalen jednak sdílením rozhraní, jednak využitím oné (asi užší) záložní cesty. Proto se karta (respektive ovladače a operační systém) vždy snaží za běžného provozu nejdříve alokovat data jen do prostoru oněch prvních sedmi osmin, kde je výkon plnohodnotný, a do zbylých 512 MB na konci sáhnou, až když není zbytí.

Toto dostali od Nvidie novináři jako podklad pro recenze. Počet ROP a kapacita L2 cache byly uvedené chybně
Toto dostali od Nvidie novináři jako podklad pro recenze. Počet ROP je ale jen 56 a kapacita L2 cache je 1792 KB

Při správném fungování softwarové stránky je tedy karta vybavena plnohodnotnou pamětí o velikosti 3,5 GB a zbylých 512 MB využívá spíše jako odkládací prostor. Nejde ovšem o chybu či defekt, ale vědomé rozhodnutí při návrhu. Možná by to psychologicky vypadalo lépe, kdyby měla karta jen 3,5 GB paměti bez jakýchkoli kompromisů (nebylo by co kritizovat), objektivně vzato ale současný stav není v ničem horší. Mimochodem, podle webu PC Perspective by ani oříznutí počtu ROP na 56 nemělo zhoršovat výkon, neboť dokáží za cyklus zpracovat 56 pixelů, kdežto 13 bloků SMM v GTX 970 pixelů jich za takt vyprodukuje maximálně 52. Plný počet 64 tedy potřebuje až GTX 980 s 16 bloky SMM.

 

 

Za všechno může marketing...

To, že Nvidia původně publikovala nesprávné specifikace, teď asi hodně lidí namíchne. Pochybuji ale, že zde byla vědomá snaha klamat – firma by musela vědět, že se na to časem přijde a nastane průšvih. Podle toho, co zástupci sdělili AnandTechu, prý laps vznikl v marketingovém oddělení. To o deaktivované části ROP a L2 nevědělo a předpokládalo, že jsou v tomto bodě obě konfigurace GM204 identické, jelikož mají 256bitovou sběrnici (a příště už si to prý budou ověřovat líp).

Ona je taky pravda, že Nvidia na svém webu v oficiálních specifikacích ani nic o L2 cache a počtu TMU a ROP neuvádí. Nepravdivé údaje tedy byly ve specifikacích, které dostali novináři, přímo zákazníkům ale Nvidia 64 ROP a 2 MB L2 cache vlastně neslíbila. Že ale firma takový nepořádek ve veřejně prezentovaných údajích dopustila, je rozhodně chyba.

Nvidia má kliku, že v oficiálních prezentacích či přehledech počty ROP ani velikosti L2 cache neuvádí
Nvidia má kliku, že v oficiálních prezentacích či přehledech počty ROP ani velikosti L2 cache neuvádí

bitcoin školení listopad 24

Herní výkon ale odpovídá výsledkům této karty v recenzích, takže asi nelze říct, že by zde byl odhalen nějaký defekt. Všechna měření už tuto podivnost zahrnují. Podveden se asi člověk může cítit, pokud kupoval vysloveně s tím, že paměť bude plně využitelná až po maximum (což si představit dokážu), nebo pokud přímo vyžadoval oněch 64 ROP a 2MB cache (to už tolik ne). Na obecné kvalitě této grafické karty se toho moc nemění, ta je dána zejména jejím poměrem ceny a výkonu, jenž je bez ohledu na nyní odhalený nešvar stále stejný. Ocenění „Smart Buy!“, které u nás kartě vynesl, tedy stále stojí.

Zdroje: PC Perspective, AnandTech