Nvidia uvedla technologii GPU Boost s kartami s architekturou Kepler. Automatické přetaktování karty se u první generace řídilo její (změřenou) spotřebou. S GeForce GTX Titan se představila druhá generace, která se při nastavení úrovně přetaktování řídí primárně teplotou grafického čipu a následně až spotřebou samotné karty. GPU Boost 2.0 řídí takty i u dvou dalších novinek – GeForce GTX 780 a GTX 770.
GPU Boost při nastavování taktů vychází z hodnot, které naměří diagnostika. Protože se vlastnosti jednotlivých čipů liší kus od kusu, mohou být rozdílné i takty, které automatika nastaví. Výhodou je, že by měla regulace nastavit optimální takty pro konkrétní čip a tak by měl být využitý téměř na „maximum“, nevýhodou to, že se stejně jako kvalita čipu může potom lišit i výkon dvou „stejných“ karet. To už ale člověk nese nelibě zejména v případě, že je jeho karta horší než ta, která byla v recenzi, nebo kterou má kamarád. Vede to i ke spekulacím, že se do recenzí dostávají lepší karty, než které člověk pořídí běžně v obchodě. Vyloučit to nemohu, to by šlo vždy snad jen porovnáním několika kusů zapůjčených přímo v e-shopu a něco podobného je nemožné.
Problém pomalejších kusů se ale často přeceňuje, dosahované frekvence se liší jen v rámci nějakého rozsahu (u stejného modelu se vám nestane, že by jedna karta běžela na 950 a jiná na 1100 MHz). Rozdíl ve výkonu daný různou kvalitou čipu se tak může pohybovat spíše v řádech desetin procent.
Řízení spotřeby u Radeonů by oproti GeForce by mělo mít v tomto ohledu výhodu. Protože se automatika řídí odhadem spotřeby (a ta se počítá u všech karet stejně), měl by být i výkon všech stejně taktovaných karet karet stejný a něco podobného by se stávat nemělo. Píšu by se nemělo, v praxi to tak ideální bohužel není.
Výrobci často upravují BIOS a mění nejen nastavení taktů, ale i řízení spotřeby (a ovlivňují tak chování PowerTune), takže se každý model může chovat jinak. V extrémním případě mohou mít odlišný výkon i dvě stejné karty s různým BIOSem. To, že vyjde několik revizí BIOSu pro jeden modelu není nic neobvyklého a může se stát, že dojde i ke změnám u nastavení řízení spotřeby. Sám už jsem novější revizi BIOSu, který u konkrétní karty zvedá výkon, aniž by se měnily její specifikace, také flashoval. Na to, že budou dva Radeony se stejnými papírovými takty stejně výkonné, se tedy můžete spolehnout jen v případě, že výrobce nastaví u limitu pro PowerTune tak velkou rezervu, že se karta nebude podtaktovávat vůbec (v podstatě tedy deaktivuje PowerTune).
GeForce a takty podle specifikací vs. realita
V parametrech GeForce podporujících GPU Boost bývají uvedené dvě hodnoty, Base clock a Boost clock. V tomto ohledu se GPU Boost liší od PowerTune u karet AMD. U novějších Radeonů (s výjimkou „úkroku“ stranou v podobě několika modelů s PowerTune Boost – HD 7870 XT, HD 7950 a HD 7970 ) najdete ve specifikacích jen jediný údaj – základní frekvenci. U Radeonů ale odpovídá maximálnímu pracovnímu taktu karty. V případě, že by odhadovaná spotřeba přesáhla nastavený limit, se pak karta podtaktovává.
Base clock je základní frekvence, pod kterou by karta za normálních okolností neměla jít, jakýsi garantovaný minimální takt. Dostane se pod něj jen pokud se z nějakého důvodu přehřívá. U GeForce by měly být jakési tři teplotní limity (údaje jsou z prezentace Gigabyte ke GeForce GTX 770 OC Windforce 3X):
- 80 °C - cílová teplota, při jejím dosažení se začíná snižovat úroveň přetaktování až k Base clock
- 98 °C - karta sníží takty na polovinu Base clock (ochrana proti přehřátí)
- 103 °C - karta se vypíná
Boost clock by pak měla být typická frekvence, na které karta běží, nebo jakási průměrná frekvence při přetaktování. Hlavně o tom, nakolik údaj Boost clock souvisí s reálnou pracovní frekvencí GPU a tím i výkonem karty, má spousta lidí ještě zkreslené představy.
V ideálním světě by to měly být takty, na kterých se karta většinou ve hrách pohybuje. Jak se takto frekvence určuje ale nikde uvedené není a tak se praxe s teorií dost často rozchází. Jednak je to už kvůli tomu, jak GPU Boost funguje (u každého čipu mohou být reálné takty jiné, i když mají všechny karty stejné specifikace), jednak kvůli tomu, že každá hra, ba dokonce každá scéna zatěžuje grafický čip jinak a neexistuje nějaká obecná, průměrná či typická zátěž. Na rozdíl od CPU, u kterých při dodržení daných podmínek (dostatečné chlazení, vytížení pouze jednoho, dvou nebo více jader) běží procesor na udávané frekvenci, u grafických karet neplatí, že udávaná frekvence s GPU Boost je frekvence, na které karta ve hrách poběží.
Při běžném hraní se frekvence pohybuje poblíž této hodnoty, často je nad úrovní Boost clock, pochopitelně se ale může stát, že se karta v náročnějších scénách (a v případě GPU Boost 2.0 i při špatném chlazení) dostane i pod tuto frekvenci. Ale žádná z karet, které jsem tu měl, neběžela přesně na udávané frekvenci GPU Boost déle než několik sekund. Vyhnáno ad absurdum lze tedy za nesmyslná (a matoucí) označit podobná tvrzení, která často vídáme v novinkách či recenzích: „základní takt karty je 863 MHz, s GPU Boost běží na 902 MHz.“
Ze svých zkušeností pak mohu říci, že výrazně vyšší takty, než je udávaná hodnota Boost clock, bývají k vidění častěji u nereferenčních karet. Rozdíl se obvykle pohybuje v řádu desítek MHz. V extrému to může být i kolem 100 MHz, příkladem budiž první revize GeForce GTX 660 Ti od MSI, která měla udávanou frekvenci pro Boost 1098 MHz, ale i při intenzivní zátěži v Crysis běhala na 1188 MHz a v méně náročných hrách i na 1201 MHz.
Specifikace pro parádu
Jak u GeForce, tak u Radeonů tedy platí (a dvojnásob u těch nereferenčních), že udávané specifikace karet jsou spíše hrubě orientační, o přesných taktech, na kterých karta poběží (a o výkonu) rozhoduje nikde nespecifikované nastavení řízení spotřeby.
Dva různé modely s papírově stejnými takty tedy mohou mít odlišný výkon, ba dokonce karta s horšími udávanými takty může být výkonnější, pokud výrobce jinak nastaví limity pro řízení spotřeby. U GPU Boost 2.0, které se řídí hlavně teplotou, pak záleží i na tom, jestli chladič udrží teplotu pod stanovenou hranicí (80 °C). Stejná karta se stejnými specifikacemi a stejným BIOSem může mít různý výkon, pokud je na ní jiný chladič, pokud je v sestavě s výkonnějším systémovým chlazením, a k vyššímu výkonu dokonce stačí jen zvednout otáčky ventilátoru.
Za této situace je už je nerozum to, co jsme ještě nedávno běžně dělali – ze dvou karet s podobnou cenou si vybrat tu, která má o 50 MHz výše taktované jádro s tím, že bude výkonnější.
Pomocník při přetaktování
Aby měli uživatelé lepší představu o tom, na který z limitů karta při automatickém přetaktování narazila, přibyly u rozhraní pro monitoring GeForce další položky.
Diagnostickým utilitám je (už od uvedení GeForce GTX 780) k dispozici několik příznaků – v Afterburneru dostaly označení temp limit, power limit, voltage limit a OV max limit (overvoltage). Jejich stav se změní z nuly na jedničku v případě, že jeden z hlídaných parametrů narazí na nastavený strop. První tři jsou jasné – jde o teplotu, spotřebu a napětí, čtvrtý znamená, že karta dosáhla absolutní hranice pro zvýšené napětí (Nvidia doslova říká, že tím už riskujete usmažení GPU).
V GPU-Z je obdoba těchto položek přítomná v podobě jediné položky označené jako Perfcap reason, kde se v závislosti na tom, která položka nejvíce omezuje výkon, objevuje jedna z následujících hodnot:
- Pwr - dosažený limit spotřeby
- Thrm - dosažený limit teploty
- Vrel - maximální napětí (reliability)
- VOp - maximální napětí (operating voltage)
- Util - maximální vytížení GPU
do logu se pak ukládá číselná hodnota. Která položka odpovídá kterému číslu, jsem ale nezkoušel.
Dále se podíváme na srovnání toho, jak se při spuštění zátěže chová trojice různých GeForce GTX 770, které které jsem teď testoval (u karty od MSI rovnou na všech třech profilech z MSI App).
Srovnání tří Geforce GTX 770 – použité karty a sestava
První z karet, jejíž výsledky jsou v grafech, je referenční GeForce GTX 770, další je mírně přetaktovaný model od MSI a konečně nejvýše taktovaná karta od Gigabyte.
Speciálně v tomto srovnání bych chtěl ještě zdůraznit, že je testovací sestava vyladěná na nižší hlučnost a ve skříni je nejspíš menší průvan než u většiny PC (zejména to platí pro hotové sestavy, kde se regulace systémových ventilátorů a snižování hlučnosti příliš neřeší). U dvou ze tří karet to znamenalo, že se dostaly na hranici, kdy už dochází ke snížení přetaktování GPU kvůli jeho teplotě, přičemž u referenční karty bylo snížení taktů dost razantní.
Nvidia GeForce GTX 770
První je karta v referenčním provedení taktech přímo od Nvidie, běží pochopitelně na referenčních taktech.
MSI GeForce GTX 770 Gaming
Druhá karta je N770 Gaming od MSI. Už od základu je od výrobce mírně přetaktovaná.
Má jednu specialitu – ve specifikacích najdete vyšší takty, než jaké jsou uložené v BIOSu karty. Specifikace totiž uvádějí nejvyšší takty ze tří profilů, na které lze přepínají softwarově po instalaci dodávané utility MSI Gaming App. Bez její instalace má karta s „defaultním“ ve specifikacích uvedený základní takt 1059 MHZ a Boost 1111 MHz, s profilem Gaming je to 1059/1150 MHz a v módu Eco jsou takty 1046/1098 MHz.
Na snímcích GPU-Z vypadají jednotlivé profily takto (zleva doprava je to Default, Gaming a Eco):
Gigabyte GeForce GTX 770 OC Windforce 3X
A konečně poslední, papírově nejvýkonnější karta, je přetaktovaný model od Gigabyte s chladičem Windforce 3X. U něj musím ještě upozornit na to, že už nemá mezi chladičem a GPU původní teplovodivou pastu, nahradila ji Noctua NT-H1. Výsledky jsou tedy zřejmě lepší než u nerozebírané produkční karty (teplota GPU ~75 °C), nicméně ani s jakousi bílou pastou nešla teplota jádra na limit 80 °C (s ní byla ~78 °C) a ani takty GPU nebyly nižší. Budeme-li předpokládat, že to s původní pastou nebylo ještě horší, měl by být výkon stejný a liší se jen naměřené teploty, otáčky ventilátoru a s teplotou související spotřeba.
Testovací sestava
Jako testovací platforma posloužila základní deska Gigabyte X79-UD5 s BIOSem F10. Procesor je šestijádrový Core i7-3960X s TDP 130 W, který je přetaktovaný na 4,2 GHz při 1,36 V. Asistuje mu 16GB kit operačních paměti DDR3 od Kingstonu.
- základní deska: Gigabyte X79-UD5
- procesor: Core i7-3960X (deaktivovaný HTT, C1E, EIST), 4,2 GHz na 1,36 V
- chladič CPU: Noctua NH-D14
- paměti: 4× 4 GB Kingston DDR3 KHX2133C11D3K4/16GX
- zdroj: Enermax Revolution 85 ERV920EWT-00, 920 W
- pevný disk: Intel SSD 510 (250 GB)
- skříň: Gelid DarkForce
- operační systém: Windows 7 x64
Crysis: Nvidia GeForce GTX 770 (referenční)
V následujících grafech je záznam ze zátěžové scény v Crysis. Vodorovná osa je v sekundách, u hlavní mřížky je jednotkou 600 s (=10 minut), čára vedlejší mřížky je vykreslená každé dvě minuty).
V jednotlivých grafech jsou následující hodnoty tak, jak jsou pojmenované v logu z MSI Afterburner:
- Framerate – snímková frekvence
- GPU Usage – využití (vytížení) GPU
- Power – procento využití limitu spotřeby (taky označované jako TDP). Maximum je 100 %, vyšší hodnoty může dosáhnout v případě, že v utilitách pro přetaktování zvýšíte limit spotřeby).
- GPU Temperature – teplota GPU
- Core Clock + Voltage – reálná taktovací frekvence jádra a jeho napájecí napětí (přesněji by to měl být VID – voltage identifier, reálná hodnota napětí se může lišit)
- Fan tachometer – otáčky ventilátoru
- Spotřeba PC – spotřeba celé sestavy v daný okamžik měřená pomocí wattmetru
- limity – v tomto grafu jsou pohromadě všechny čtyři příznaky, které mohou omezovat takty. Pokud je kvůli některému z nich v daný okamžik snížený takt, v grafu je v daný čas bod příslušné barvy.
GeForce GTX 770 a Crysis
Během prvních dvou minut po spuštění Crysis je vidět prudký nárůst teploty GPU (první minutu se načítala uložená pozice, druhou minutu je spuštěná zátěž).
Jakmile teplota jádra dosáhla 80 °C, takt GPU spadl z 1149 MHz k ~1050 MHz (na něj je vázáno i napětí GPU, hodnota VID šla dolů z 1,2 na 1,087 V. S tím šla dolů i spotřeba karty (z původních ~83 % na ~66 % dostupného limitu spotřeby). Na spotřebě PC se to projevilo poklesem ze ~354 W na ~302 W.
Na posledním grafu si můžete všimnout, že kartu limitovalo nejprve napětí 1,2 V (při zmiňovaných 1149 V), následně se karta zahřála a výkon už brzdila teplota GPU.
Crysis: MSI GeForce GTX 770 Gaming - default
V zátěžové scéně v Crysis klesla po zahřátí čipu na 80 °C taktovací frekvence GPU z 1198 na 1162 MHz (zároveň došlo i na snížení napětí GPU). Spotřeba PC šla ze ~350 na 330 W. Rozdíl ale není tak výrazný jako u referenční karty.
Na grafu s průběhem teploty je znát, že předtím, než karta dosáhla na limit teploty, už teplota stoupala jen pomalu a chladič ji téměř udržel pod 80 °C, v grafu s průběhem teploty se neopakuje zlom, který je vidět u referenční karty.
Crysis: MSI GeForce GTX 770 Gaming - gaming
Ještě než se vrhnete na grafy, musím upozornit na jednu drobnost – Gaming App zatím trochu zlobí. Po přepnutí na jiný profil se karta přestala přepínat na nižší 2D takty. Kvůli tomu v idle měla asi o 40 W vyšší spotřebu. K tomu, aby 2D opět fungovalo, stačilo jen zavřít Gaming App a spustit Afterburner. U MSI jsem to hlásil, předpokládám, že je to otázka nějaké drobné chybky, která bude v dalších verzích opravená.
S gaming app karta nehlásí ani vytížení GPU, předpokládám, že se o tento údaj nějak přetahuje s Afterburnerem, kterým jsem hodnoty zaznamenával.
S profilem Gaming běží GPU po celou dobu na 1201 MHz. Ventilátor má mnohem vyšší otáčky, takže i přes vyšší takt se teploty drží zpočátku na 70 °C a i po zahřátí karty se drží pod 75 °C. Křivka s teplotou už se stabilizuje zcela pozvolně.
Spotřeba sestavy v zátěži se pohybuje mezi 325 a 350 W, ale není nijak dramaticky rozdílná oproti normálnímu profilu.
Crysis: MSI GeForce GTX 770 OC Gaming - eco
V režimu Eko karta prakticky nezvedá otáčky ventilátoru. V náročném testu tak poměrně rychle narazí na teplotní limit a dojde na snižování taktů, z původních cca 1150 MHz jde karta na 1100 MHz a občas se propadá i na 1059 MHz, což je v hodnota Base Clock.
Znovu ale musím zdůraznit, že to vše se děje při ventilátorech na ~1080 ot./min, při kterých ventilátory nejsou téměř slyšet ani v pasivně chlazené sestavě.
Crysis: Gigabyte GeForce GTX 770 OC Windforce 3X
Aliens vs. Predator: Nvidia GeForce GTX 770 (referenční)
V následujících grafech je zaznamenáno šest průběhů benchmarku Aliens vs. Predator. Jeden průběh trvá přibližně dvě minuty, začíná se se studenou kartou, cílem je zjistit, jak se její chování změní po zahřátí.
Maximální s GPU Boost frekvence byla 1149, při kterých už byl výkon karty omezený kvůli dosažení maximálního nastaveného napětí. Na této frekvenci se karta držela téměř během celého prvního průběhu, během kterého se chladič teprve zahříval. Projevilo se to i na vyšší průměrné snímkové frekvenci. Vyšší je i spotřeba karty. Průměry z jednotlivých měření vypadaly takto:
- 64,7; 63,1; 63,2; 63,2; 63,2; 63,5
Během prvního měření už se karta zahřála natolik, že dosáhla limitu 80 °C, následovalo snížení taktů. V grafu s frekvencí si ještě můžete všimnout, že je takt vyšší na začátku každého měření, je to dáno především tím, že mezi ukončením jednoho průběhu testu a opětovným načtením benchmarku karta trochu vychládne a teploty spadnou asi o 3 °C.
Vidět je to ostatně i na posledním grafu – téměř během celého prvního průběhu limituje kartu napětí, u dalších průběhů už karta na hranici limitu pro napájecí napětí běží jen pár sekund a po zvýšení teploty už přijde ke slovu teplotní limit.
Aliens vs Predator: MSI GeForce GTX 770 Gaming - default
Na rozdíl od zátěžového Crysis už chladič v Aliens vs Predator stačil na to, aby udržel teplotu pod 80 °C. Díky tomu se karta udržela na taktu 1162 MHz.
Aliens vs Predator: MSI GeForce GTX 770 Gaming - gaming
S profilem Gaming běží GPU po celou dobu na 1201 MHz. Ventilátor má mnohem vyšší otáčky, takže i přes vyšší takt se teploty drží zpočátku na 70 °C a i po zahřátí karty se drží pod 75 °C. Spotřeba sestavy se pohybuje mezi 325 a 350 W, ale není nijak dramaticky rozdílná oproti normálnímu profilu.
Aliens vs Predator: MSI GeForce GTX 770 Gaming - eco
První průběh ještě chlazení ustálo, postupně ale dochází ke snižování taktů. Rozdílný výkon karty (a klesající tendece) už je dobře vidět i na samotném grafu s průběhy FPS.
Aliens vs Predator: Gigabyte GeForce GTX 770 OC Windforce 3X
S kartou od Gigabyte bylo měření opět trochu nudné a předvídatelné, alespoň po stránce výkonu. Rozdíl v průměrných snímkových frekvencích se udržel v rámci chyby měření, průměry byly 66,5; 66,4; 66,3; 66,2; 66,5 a 66,5 snímků/s. Minimální rozdíly jsou důsledkem toho, že karta po spuštění zátěže naběhla na maximální frekvenci 1241 MHz a udržela si ji po celou dobu testu (viz graf Core Clock).
Měnily se ale provozní vlastnosti, v prvních dvou průbězích se postupně zahříval grafický čip a s tím šly nahoru otáčky ventilátoru, hlučnost karty i spotřeba celého PC. Po třetím průběhu (teda cca šesti minutách), kdy se karta dostatečně prohřála a držela si teploty, už vycházela další měření obdobně téměř ve všech ohledech.
V posledním grafu je pak vidět, že GPU Boost už s takty výše nešel kvůli tomu, že bylo dosaženo limitu maximálního napětí GPU.
Závěrečné shrnutí:
Pokud jste přes naměřené výsledky i s komentáři prokousali až sem, není velice co dodávat. Každá karta se chová trochu jinak.
Tiché sestavě sedla nejhůře referenční karta, regulace teploty poměrně rychle srazila takty nejen v Crysis, ale i v Aliens vs. Predator. Je to dáno neagresivní regulací otáček, která u ventilátorů na rychlosti příliš nepřidává i přesto, že má chladič ještě dost velkou rezervu. Je třeba zdůraznit, že i když spadla frekvence GPU u druhého průběhu už zhruba o 100 MHz, průměrná snímková frekvence šla dolů ze 64,7 jen o necelé dva snímky za sekundu. V Crysis už byl rozdíl ve výkonu ale o něco dramatičtější.
Karta od MSI a její tři profily jsou dokladem, jak málo stačí k tomu, aby se výrazně změnily vlastnosti karty i její výkon. Výrazněji se liší jen otáčky ventilátoru, co se taktů týče, posouvá se jen offset, v režimu Gaming o 3× 13 MHz nahoru, v Eco jen o 13 MHz dolů, což je téměř neměřitelný rozdíl. Přesto je karta v režimu Eco výrazně pomalejší (a má i výrazně nižší spotřebu v zátěži), protože automatika kvůli podstatně nižšímu výkonu ventilátorů naráží na limit teploty a výrazně sníží i takty.
Karta od Gigabyte má, zdá se, otáčky ventilátoru nastavené zbytečně vysoko. v AvP udržela kartu při 70 °C. I v Crysis, který lze považovat za příklad výjimečně náročné záatěže, se udržela na 75 °C. Regulace taktů tak do frekvence vůbec nezasahovala a karta běžela stále naplno. Tady jen připomenu, že už karta nemá původní pastu. Podobný výsledek ale přímo vybízí k tomu otáčky ventilátoru zregulovat pomocí ručního profilu tak, aby karta byla tišší.
A ještě jedna drobnost – v závislosti na tom, jak moc karta hýbala s takty (a současně i napětím) se výrazně měnila i spotřeba karty. Tato vlastnost karet s GPU boost má asi největší podíl na tom, proč jsou výsledky spotřeb nové generace GeForce ve srovnání se staršími kartami naměřené napříč weby tak rozdílné.