GeForce GTX 280: CUDA, přetaktování, shrnutí (II.)

17. 6. 2008

Sdílet

 Autor: Redakce

CUDA a aplikace

O Nvidia CUDA jsem psal již něco málo v úvodní kapitole článku, a tak už všichni dobře víte, co to je. Kaliforňané chtějí dokázat, že CUDA nezůstane zajímavou pouze pro programátory a vědce, ale pronikne také mezi běžné uživatele. První demoaplikací byla beta verze převaděče BadaBOOM od společnosti Elemental Technologies. Jedná se zřejmě o placenou aplikaci (i ona beta verze omezená jen na GTX 280 má krátkou zkušební dobu) s vynikajícím rozhraním pro naprosté počítačové začátečníky. Vyberete zdroj videosouboru a poté zařízení, pro které jej chcete zkonvertovat.

Jaký příklad jsem použil dodaný 184MB MPEG-2 v rozlišení 720p a ten byl aplikací s využitím akcelerace přes GTX 280 do H.264 transformován rychlostí téměř 150 snímků za sekundu, tedy asi pětinásobkem rychlosti přehrávání v reálném čase. Aplikace bohužel nepodporuje jiné grafické karty či přímo procesor, takže pro ty, kterým zatím zobrazená akcelerace nic neříká, mám jediné: zkuste si najít podobně velký MPEG-2 v 720p a převést jej do H.264 do 40 sekund. Výsledné video je v rozlišení 640 × 360 px bez ohledu na to, pokud vyberete iPhone. Pro jiné zařízení se použijejiné rozlišení, ale BadaBOOM v náhledu hlásil vždy stejně velký výsledný soubor. To se ale týká asi jen beta verze programu.

Další aplikací byla beta verze Folding@home klienta pro GeForce. Ta mi bohužel jela opět jen na GeForce GTX 280, ale možná budete mít větší štěstí. Můžete si ji vyzkoušet po stažení z tohoto odkazu. Rychlost počítání zobrazuje screenshot níže, čtenáře, kteří mají s počítáním F@h na procesoru či Radeonech už zkušenosti, poprosím o zveřejnění svých zkušeností s rychlostí počítání, abychom mohli vše porovnat.

CUDA samozřejmě neznamená jen Folding či kódování videa do H.264. Některé další aplikace uvidíte na obrázku pod odstavcem, násobky znamenají akceleraci přes GPU GeForce GTX 280 oproti nízko taktovanému dvoujádrovému procesoru (CPU).

O CUDA se mnohem více dozvíte na stránce CUDA Zone. Tam si také můžete stáhnout potřebný ovladač pro GeForce 8/9, stáhnout toolkit pro tvorbu CUDA aplikací či celé kusy kódu jako příklady. Na stránce také v pěkném prohlížeči uvidíte desítky (možná už víc jak stovku) aplikací, v nichž CUDA našla využití.

Přetaktování a regulace větráku

Pro přetaktování jsem vyzkoušel dva nástroje: nejprve ten vestavěný přímo v Nvidia Control Panelu. Ten mi ale nechtěl povolit nastavit frekvenci jádra na 650 MHz. Stáhl jsem tedy nový RivaTuner 2.09, který již poslední GeForce podporuje a použil tento.

Zjistil jsem, že pokud deaktivujete volbu Linked (spojené taktování jádra a shader domain, stream procesorů), můžete sice taktovat stream procesory (Shader clock), ale změna frekvence jádra nemá žádný vliv. Jinými slovy, pro jádro můžete nanstavit třeba 800 MHz, ale nestane se to. Musíte jen v Linked režimu společně se stream procesory.

3DMark06 bylo možné i v 2560 × 1600 px a s 4× MSAA projet s taktem jádra/SP na 713/1538 MHz (Canyon Flight v tomto nastavení mimochodem běží přes 45 snímků za sekundu), 3DMark Vantage také, ale jen na nastavení Performance. Nastavení Extreme mě donutilo takt o pár MHz snížit na 705/1517 MHz.

U pamětí jsem už nejvyšší stabilní hodnotu nehledal s takovou přesností, při 1330 MHz se při testech objevila modrá obrazovka smrti, takže jsem se pokojil se 1300 MHz. 2,6 GHz efektivně je ale více, než bych kdysi při uvedení prvních 500MHz (1 GHz efektivně, 2,0 ns) GDDR3 modulů čekal.

Celkové přetaktování 705/1517/1300 MHz (jádro/SP/paměti, toto nastavení si generátor taktu přizpůsobí na nejbližší krok, přesněji tedy 702/1512/1296 MHz) bylo plně stabilní, až po delším testování jsem objevil drobné artefakty v DirectX 10 verzi Assassin's Creeda. To by zřejmě vyřešilo ještě pár MHz dolů na taktu jádra.

Jak už jsem zmínil, taktovat bylo možné i v nástroji společnosti Nvidia pracujícím na základních deskách s čipovou sadu Nvidia nForce. S tím samým nástrojem můžete GeForce GTX 280 zcela utišit, nebo naopak nechat na maximum chladit. Při 25 % otáček je už větrák velice tichý (implicitně jsem měl nastaveno 40 %) a současně to na uchlazení ve 2D režimu stačí. Myslím, že pro příznivce večerního sledování filmů se jedná o dobrou zprávu.

Výkon GeForce GTX 280 po přetaktování

 

Běh první městem:

Přesnější měření na jediném místě (studna u stromu):

Shrnující grafy

Jak na ExtraHardware počítáme grafy celkového výkonu: Pro každý dílčí test (tedy například Bioshock, 1680 × 1050 px) je nalezena nejrychlejší grafická karta a ta je označena jako maximum, tedy 100 %. Ostatní karty pak získají body v podobě relativního výkonu k tomuto dílčímu maximu. V dalším testu může být maximem zase jiná grafická karta, celkových 100 % by získala jen grafická karta nejrychlejší úplně ve všech testech. Tato metodika dává všem hrám stejnou váhu, bez ohledu na to, zda v ní karty běží typicky 30 fps nebo třeba 100 fps. Větší váhu mají jen hry Crysis a Assassin's Creed, ve kterých testuji vlastně dvakrát (u Crysis v high a very high, v Assassin's Creedu staticky a pak ještě během celým městem odspodu až po hrad).

Upozornění: kvůli nefunkčnímu anti-aliasingu u her Race Driver: GRID, Bioshock a Medal of Honor: Airborne v případě karet Radeon jsem tyto do shrnujících grafů počítal jen v nastaveních bez anti-aliasingu.

Spočítání poměrů výkon/cena mi trochu zkomplikovaly od výrobců mírně přetaktované Radeony. Ty se prodávají výrazně dráže než běžné verze (Toxic za 3460 Kč a X2 TOP za 7890 Kč) a následující grafy by to dost zkreslilo v neprospěch AMD. Kdybych jim ale zase počítal nejnižší nalezenou cenu podobného, ale nepřetaktovaného modelu (tedy standardního Radeonu HD 3870 DDR4 a Radeonu HD 3870 X2, momentálně asi 2830 Kč, resp. 7350 Kč), budu je zvýhodňovat. Nakonec jsem to tedy udělal tak, že jsem spočítal procentní nárůst frekvence, jež mají oproti referenčnímu modelu díky přetaktování (jádro i paměti, z toho průměr) a tyto zhruba 2 % k ceně netaktovaného modelu přičetl (a dostal ceny 2900, resp. 7680 Kč). Konzistentnost grafu s poměrem výkon/cena by tak měla zůstat téměř zachována.

Udělal jsem pro vás opět modelovou roční spotřebu elektřiny PC s danou grafikou. Graf počítá s 300 dny puštěným počítačem, na kterém se průměrně čtyři hodiny dělá něco něnáročného ve Windows (2D) a hodinu denně se hraje náročná 3D hra.

Verdikt

V diskuzích čtu od nemálo uživatelů slova zklamání. Podle mě ale nejsou tak úplně na místě. GeForce 280 GTX mě osobně rozhodně nezklamala. Předchozí velmi povedenou generaci překonává suma sumárum o nějakých 60 %, v rozlišení 30" LCD panelu (2560 × 1600 px) pak ještě více.

Situaci trochu zamotávají dvoučipové karty jako Radeon HD 3870 X2 a především GeForce 9800 GX2. Ty jsou i ve vysokém rozlišení často rychlejší, především pak v případě GeForce 9800 GX2 je Multi-GPU škálování výkonu celkem pravidelně nad 80 %. Ale jakmile dojde na opravdové HD hraní (velmi vysoké rozlišení a anti-aliasing), dochází těmto řešením disponujícím v AFR režimu v podstatě jen 512MB grafickou pamětí a 256bitovou paměťovou sběrnicí dech.

A bavíme-li se o highendu, o segmentu kde jsou peníze na drahé monitory, drahá PC a také drahé grafické karty, poměr cena/výkon je tedy až na druhém místě. V něm bude jistě lepší GeForce GTX 260, která nestojí 11 500 Kč, ale po větším rozšíření by se měla prodávat snad kolem 9 000 Kč a podávat přitom v širším spektru her jen zhruba o 10 % nižší výkon.

GeForce GTX 280 má proti dvoučipovým kartám další výhody v mnohem nižší hlučnosti, snadnější budoucí náhradě chladiče, snadnější a spolehlivější rozšiřitelnosti výkonu (SLI) a oproti GeForce 9800 GX2 s ní navíc spálíte daleko míň elektřiny. A ještě dvě věci tato Multi-GPU řešení penalizují: nikdy si nemůžete být jisti zda některý titul nebude problémy mít kvůli použité technice použít nejrychlejší režim Multi-GPU (AFR) a pak jsou tu jevy znemožňující použít SLI/CrossFire (nedej bože 3-way či Quad-) řešení v progamingu: microstuttering (nerovnoměrné zobrazování snímků) a input lag (zpoždění na vstupu).

To vše vám s jednočipovým řešením, paralelním pouze uvnitř v rámci jediného monolitického jádra, nehrozí. Nvidia u tohoto řešení chce určitě ještě nějaký rok zůstat, koneckonců výkon je až na výjimku v podobě Crysis dostatečný pro jakákoli nastavení a další zvýšení výkonu mohou přijít s novým výrobním procesem (Nvidia je teprve na 65 nm) či novými GDDR5. A docela vysoké přetaktování GTX 280 napovídá, že by při dobré konstelaci hvězd mohla Nvidia vytáhnout jinak prakticky stejnou Ultru.

GeForce 280 GTX je pro našince i díky silné koruně oproti předešlému highendu Nvidia docela stravitelné sousto. Cena pod 12 000 Kč s DPH při uvedení není rozhodně špatná, je dokonce o trochu nižší, než při uvedení ne až tolik přesvědčivé karty se dvěmi levnějšími GPU – GeForce 9800 GX2. Nečekám ale, že by měla rychle klesat. Při počtu jader GT200, jež se vejdou na 300mm wafer (105) a složitém 512bitovém PCB by asi Nvidia šla s cenou dolů jen velmi nerada. Donutit ji k tomu může jen případná povedenost RV770, resp. dvoučipové karty na tomto chystaném grafickém jádru od AMD postavené.

Když se přestaneme bavit jen o herním výkonu, máme tu celkově dobře vyladěný produkt: zahřívání je chladičem udrženo v rozumné míře, teplý vzduch foukán z bedny ven, hlučnost regulovatelného větráku i při standardu lze hodnotit rovněž kladně. Hned s prvními dodanými ovladači jsem nenarazil na jediný problém ani v jediné z 22 testovaných her. Navíc Nvidia pilně pracuje na tom, aby (nejen pro GeForce GTX 280) bylo co nejvíce aplikací CUDA. Superrychlý převod videa do H.264 nebo jen soutěžení ve Folding@home může přilákat další kupce, dalším marketingovým tahákem bude zanedlouho PhysX. Hardwarovou akceleraci fyziky realizované ve hrách tímto enginem dokáže Nvidia jistě brzy rozšířit i mimo 3DMark nebo Unreal 3 engine.

Nvidia GeForce GTX 280

+ vysoký výkon ve vysokém rozlišení
+ ve své třídě tiché chlazení
+ nízká spotřeba ve 2D (idle)
+ rezerva pro přetaktování, výkon po přetaktování
+ celkově vyladěný produkt
- v průměru horší v poměru cena/výkon než 9800 GX2 či HD 3870 X2
- vyžaduje 1× 6-pin a 1× 8-pin napájení

Za zapůjčení grafické karty Nvidia GeForce GTX 280 děkujeme společnosti Nvidia.

Za zapůjčení grafické karty Asus Radeon HD 3870 X2 TOP děkujeme společnosti Asus.

ICTS24

Za zapůjčení grafické karty Sapphire Radeon HD 3870 Toxic děkujeme společnosti Sapphire.

Do původní recenze bylo toto doplnění a shrnutí doplněno. Došlo také k opravám grafů u her Assassin's Creed (opraven výkon Radeonu HD 3870 X2), Enemy Territory: Quake Wars, Bioschock, Medal of Honor: Airborne, Race Driver: GRID a Hellgate:London. Ve dvou případech jsem opravil svoje chyby měření, u GeForce 9800 GX2 jsem zkusil v některých hrát přes profil vynutit AFR a obraz byl bez chyb a výkon vyšší, u Radeonů jsem nainstaloval ovladače Catalyst 8.5 WHQL a přeměřil, co se dalo. Kde se výkon změnil k lepšímu, tam jsem opravoval, u 3870 X2 klesl výkon v ET: QW, ale zase přestal blikat (a být průhledný) tank. U Hellgate: London jsem v grafech sjednotil anti-aliasing u všech karet na Medium, v grafu s AA na Very High nechávám jen GeForce (Radeony jej nepodporují).