Osamotená na vrchole
Jadro (GPU) RTX 4090 je oproti RTX 3090 (Ti) o trochu menšie, pokiaľ ide o plochu, ale výrazne väčšie (o cca 60 %) ako v RTX 4080. GeForce RTX 4090 má so 128 blokmi SM viac ako dvojnásobok jednotiek RTX 4070 Ti. Dvojnásobná je i kapacita pamäte (GDDR6X) a takisto šírka jej pamäťovej zbernice.
Pamäťová priepustnosť presahuje 1 TB/s, to ako u jedinej hernej grafickej karty súčasnosti. RTX 4090 je vlastne akási osobitná kategória. TDP (450 W) je na úrovni RTX 3090 Ti, ale Ada Lovelace je, samozrejme, podstatne efektívnejšia architektúra než Ampere. Na jednotku spotreby je medzigeneračné zrýchlenie naozaj výrazné, ale to už trochu predbiehame…
Gigabyte RTX 4090 Gaming OC 24G v detailoch
Testovaciu vzorku grafickej karty RTX 4090 máme vo vyhotovení Gigabyte Gaming OC. Voči modelu Aorus Master sa jedná o nižší rad, ale s atraktívnejšou cenou, lepšou kompatibilitou pre o trochu menšie rozmery. Stále sa však jedná o obrovskú grafickou kartu s hmotnosťou cez dva kilogramy.
Na konštrukcii tela sa príliš nešetrilo, poriadny – z kovu – je i backplate. Ten má vzadu (v časti, ktorá už dĺžkovo presahuje krátke PCB) výrez/okno na naozaj efektívne prúdenie vzduchu. Gigabyte tu nepoužil žiadnu mriežku a napriek tomu sa nikde nič nekrúti. Pevnosť elegantne zvyšuje aj obvodové prehnutie backplate po stranách. To sa zároveň podieľa aj na vyššej ochrane citlivejších častí pri (de)montáži.
Grafické jadro a pamäte sú v kontakte s veľkou základňou výparníkovej komory. V súvislosti s pasívom Gigabyte uvádza aj striedanie dlhších a kratších rebier na efektívnejšie prúdeniu vzduchu. Dlhšie rebrá sú navyše trochu ohnuté, čím je možné dosiahnuť o trochu väčšiu plochu.
Aktívna zložka chladiča Windforce pozostáva z troch ventilátorov. Tie sú väčšie, než je na grafických kartách obvyklé. Formát ventilátorov je 110 mm. Ich prierez je o číslo väčší napríklad aj v porovnaní s konkurenčnými chladičmi MSI Tri Frozr 3S. Súčasne je vyšší aj profil ventilátorov (20 mm).
Po populárnom rotorovom rámčeku na znižovanie vibrácií na špičkách lopatiek Gigabyte nesiahol. Na druhej strane treba poznamenať, že pre väčšiu hrúbku materiálu sú lopatky nadštandardne pevné. Na každej lopatke je ale trojica vystúpených kanálikov. Tie na odtokových hranách potláčajú mikroturbulencie prúdnic vzduchu v dôsledku čoho v malej, ale v predsa nejakej miere dochádza k zvýšeniu prietoku pri súčasnom znížení hlučnosti.
Hlučnosť na úkor vyššieho zahrievania znižuje aj „tichý“ BIOS, ktorý je možné zvoliť mechanickým prepínačom. Dosahované frekvencie naprieč BIOSmi sú nastavené rovnako, v booste na 2535 MHz. V praxi ale k nejakým rozdielom predsa len v závislosti od chladenia dochádzať môže. Čím účinnejšie máte systémové chladenie v skrinke, tak tým viac sa budú blížiť k nule. My na priechod všetkými testami tak ako vždy u všetkých kariet používame BIOS „OC“. Ten je koniec koncov predvolený aj na Gigabyte RTX 4090 Gaming OC 24G.
Na dĺžku má táto grafická karta 340 mm (to je, mimochodom, o 18 mm menej, než má variant Aorus Master), hrúbka mierne presahuje 75 mm (takže počítajte so zablokovaním štyroch slotov). Od základnej dosky k bočnici je v tradičnej, vodorovnej polohe, potom 150 mm. Tie môžu byť s niektorými skrinkami nekompatibilné. Typicky s takými, čo majú interiér pozdĺžne rozdelený na dve komory. Medzi RTX 4090 sú ale aj širšie modely než je tento.
Hoci sa jedná o naozaj veľkú kartu, tak pokiaľ sa zameriame iba na RTX 4090, tak Gigabyte Gaming OC 24G patrí skôr k tým „menším“.
Vzhľadom k pomerne vysokej hmotnosti (~2029 g) grafickej karty je súčasťou príslušenstva aj dvojdielny držiak. A potom je tu 16-pinový adaptér, ktorý sa pripája k štyrom 6+2-pinom PCIe, čo znamená, že je stavaný na záťaž zodpovedajúcu 600 W.
Použité dutinky sú od Astronu, ktoré sú oproti alternatívnym dutinkám NTK prezentované ako horšia možnosť. To z dôvodu menšej styčnej plochy s pinmi, pre ktorý je vyšší prechodový odpor i zahrievanie. Ale stále sú štedro predimenzované a rozhodne vhodné aj pre grafickú kartu so spotrebou RTX 4090. Pokiaľ nevlastníte zdroj ATX 3.0 s vlastným 16-pinom, tak pokojne môžete použiť adaptér dodávaný s grafickou kartou.
Jediné, čo môžeme konštrukcii adaptéru vytknúť, je slabšie opáskovanie textílie, ktorá obopína jednotlivé vodiče. Výsledkom častejšej manipulácie potom môže byť strapkanie na koncoch, čo je, samozrejme, iba kozmetická vec. Elektrický návrh je v poriadku, zahrievanie puzdra konektoru aj pri zhruba 450 W dosahuje v našich podmienkach do 60 °C.
Z osvetlených prvkov (ARGB LED) sú tu kruhové pásy medzi ventilátormi a pasívom a zboku ešte Gigabyte. Farbu osvetlenia a jeho efekty je možné nastavovať v aplikácii Gigabyte RGB Fusion 2.0.
Článok pokračuje ďalšími kapitolami:
Metodika: výkonnostné testy
Herné testy
Najväčšia vzorka testov je z hier. Vzhľadom na to, že sa prevažne budú testovať GeForce a Radeony, teda grafiky primárne určené na herné použitie, je to vcelku prirodzené.
Testovacie hry sme vybrali v prvom rade s ohľadom na to, aby bola rovnováha medzi titulmi lepšie optimalizovanými na GPU jedného (AMD) či druhého výrobcu (Nvidia). Zohľadňovali sme ale takisto popularitu titulov, aby ste si v grafoch našli „tie svoje“ výsledky. Dôraz bol kladený aj na žánrovú pestrosť. Zastúpené sú tak hry typu RTS, FPS, TPS, automobilové závody ako i letecký simulátor, tradičné RPG a športovú zástavu dvíha najhrávanejší futbal. Zoznam testovacích hier nájdete v knižnici kapitol (9–32) s tým, že každá hra má na čo najlepšiu prehľadnosť tú svoju, niekedy i dve (kapitoly), čo má ale svoj dobrý dôvod, o ktorý sa s vami v ďalšom texte podelíme.
Skôr, než sa pustíme do herných testov, tak na zahorenie so zahriatím na prevádzkovú teplotu každá grafická karta prejde testami v 3DMarku. To je na začiatok taká dobrá syntetika.
Výkon v hrách testujeme naprieč troma rozlíšeniami s pomerom strán 16:9 – FHD (1920 × 1080 px), QHD (2560 × 1440 px) a UHD (3840 × 2160 px) a vždy s najvyšším profilom grafických detailov, ktorý je možné nastaviť rovnako na všetkých aktuálnych grafických kartách GeForce a Radeon . Proprietárne detaily na objektívnosť záverov vypíname a nastavenia s ray-tracingovou grafikou sú testované zvlášť, keďže ich nižšia trieda GPU nepodporuje. Ich výsledky nájdete v doplňujúcich kapitolách. Okrem natívneho ray tracingu aj po nasadení Nvidia DLSS (2.0) a AMD FidelityFX CAS.
Ak má hra vstavaný benchmark, tak používame ten (výnimka je iba Forza Horizon 4, kde pre jeho nestabilitu – sem-tam zvykne štrajkovať – jazdíme po svojej trati), v ostatných prípadoch merania prebiehajú na vlastných scénach. Z tých cez OCAT zachytávame časy za sebou idúcich snímok do tabuliek (CSV), ktoré do zrozumiteľnej reči fps interpretuje FLAT. Obe tieto aplikácie sú z dielne kolegov z magazínu gpureport.cz. Okrem priemernej snímkovej frekvencie do grafov zapisujeme aj minimálnu. Tá sa na celkovom zážitku z hrania podieľa významnou mierou. Na čo najvyššiu presnosť sú všetky merania opakované trikrát a konečné výsledky tvoria ich priemernú hodnotu.
Výpočtové testy
Otestovať grafickú kartu komplexne aj z pohľadu výpočtového výkonu je zložitejšie, než urobiť závery z herného prostredia. Už len z toho dôvodu, že sa takéto testy obvykle viažu na drahý softvér, ktorý si „len tak do redakcie“ nekúpite. Na druhej strane sme našli spôsoby, ako vám ten dostupný výpočtový výkon priblížiť. Jednak vďaka dobre stavaným benchmarkom, jednak sú tu aj nejaké voľne dostupné a pritom relevantné aplikácie a do tretice sme i niečo investovali do tých platených.
Testy zahajuje CompuBench, ktorý počíta rôzne simulácie (mimo iné aj z hernej grafiky). Potom prechádzame na populárny benchmark SPECviewperf (2020) , ktorý integruje čiastkové operácie z populárnych 2D a 3D aplikácií, medzi ktorými je 3Ds max či SolidWorks. Detaily o tomto testovacom balíčku nájdete na webe spec.org. Od rovnakého tímu je i SPECworkstation 3, kde je GPU akcelerácia v testoch Caffe a Folding@Home. V grafoch nájdete aj výsledky 3D renderu LuxMark 3.1 a pozoruhodný teoretický test GPGPU obsahuje aj AIDA64 s meraniami FLOPS, IOPS a rýchlostí pamätí.
Najväčšiu porciu testov si z pochopiteľných dôvodov ukrojilo 3D renderovanie. To napríklad aj v rámci praktických testov Blendery (2.91). Okrem Cycles grafiky potrápime aj renderermi Eevee a radeon ProRender (nech má nejaký spriaznený test aj AMD, keď už je väčšina optimalizovaná na karty Nvidie s proprietárnymi frameworkami CUDA a OptiX). Zaujímavý by bol isteže aj add-on pre V-ray, na ten však momentálne redakčná kasa nestačí, ale možno sa nám podarí časom získať nejakú „press“ licenciu, uvidíme.
Aplikačné testy chceme do budúcna rozvíjať. Výhľadovo určite nejakým pokročilým testovaním AI (zatiaľ sme neprišli na rozumný spôsob) vrátane odšumovania (tam by už nejaké nápady boli, ale pre časovú tieseň sme ich zatiaľ nezapracovali).
Grafické karty sa dajú dobre uchopiť aj pri úpravách fotografií. Na získanie predstavy o výkone v populárnom Photoshope používame naskriptovaný PugetBench, ktorý simuluje reálnu prácu z rôznymi filtrami. Medzi nimi sú i také, ktoré používajú GPU akceleráciu. Komplexný benchmark napovedajúci o výkone rastrovej a vektorovej grafiky je potom i v alternatívnom Affinity Photo. V Lightroome sú zase pozoruhodné farebné korekcie (Enhance Details) surových nekomprimovaných fotiek. Tie aplikujeme dávkovo na 1 GB archív. Všetky tieto úlohy vedia akcelerovať tak GeForce ako i Radeony.
Zase z iného cesta sú potom testy dešifrovania v Hashcate s výberom šifier AES, MD5, NTLMv2, SHA1, SHA2–256/512 a WPA-EAPOL-PBKDF2. Nakoniec ešte v broadcastových aplikáciách OBS a Xsplit meriame, o koľko sa zníži herný výkon počas nahrávania. To už neobstarávajú shadrery, ale kodéri (AMD VCE a Nvidia Nvenc). Tieto testy poukazujú na to, akú má ktorá karta približne rezervu typicky na online streamovanie.
Možnosti hardvérovej akcelerácií je, samoi zrejme, viac, typicky pre strih a prevody videa. To je už však čisto v réžii kodérov, ktoré sú v rámci jednej generácie kariet jedného výrobcu vždy rovnaké, takže nemá zmysel ich testovať na každej grafike. Naprieč generáciami je to už iné a testy tohto typu sa skôr či neskôr objavia. Už len doladiť metriku, kde bude na výstupe vždy rovnaký bitrate a zhoda pixelov. To je na objektívne porovnávania dôležité, pretože kodér jednej firmy/karty síce môže byť v konkrétnom profile s rovnakými nastaveniami rýchlejší, ale na úkor nižšej kvality, ktorú má (ale i nemusí mať, to je len príklad) iný kodér.
Novinka: Od 18. 11. 2022 testujeme všetky grafické karty už iba v režime a aktívnou technológiou Resizable BAR. Dôvody, prečo v meraniach bez ReBARu ďalej nebudeme pokračovať sú tri.
Hlavný dôvod je ten, že nové základné dosky počnúc modelmi s čipsetmi Intel Z790 a AMD X670(E) ho už majú vynútený, čo predtým nebývalo a v nastaveniach PCIe sa vyžadovalo sa ručné zapnutie ReBAR. Kto ho nevypne bude teda fungovať s aktívnym ReBARom, čo je z pohľadu hier, kde pridáva výkon, dobre. Je to do istej miery možno aj preto, že grafické karty Intel bez ReBAR sa, zdá sa, nesprávajú korektne a grafických kariet, ktoré s ním budú počítať, bude do budúcna zrejme pribúdať. Dôvod číslo dva pre testy iba s ReBARom už poznáte.
A nakoniec je pravda i to, že testovať všetky testy na dvakrát (s ReBARom i bez neho) s trojnásobnou opakovateľnosťou, je časovo extrémne náročné. Stále však platí to, čo sme tvrdili viackrát – platforma s ReBARom je, čo sa týka výsledkov meraní, menej stabilná. Naprieč časom sa môžu niektoré veci v procese ladenia (s ovládača na ovládač) meniť a vo vzájomnom porovnaní nemusia „dávať logiku“. Keď teda niekde uvidíte, že v iných testoch pomalšia karta v nejakom konkrétnom prípade predbieha nejakú výkonnejšiu, tak si spomeňte na tieto slová.
Nevýhoda meraní s aktívnym ReBARom je skrátka to, že všetky porovnávajúce testy nemusia byť vždy perfektne konzistentné. A je možné, že sa budú i naďalej objavovať prípady, kde ReBAR výkon skôr znižuje, než by ho pridával. S týmito vecami treba pri štúdiu výsledkov počítať. To neplatí iba pre naše testy, ale pre testy všetkých osttaných, ktorí s každou novou otestovanou grafickou kartou nepretestovávajú aj všetky staršie modeli v porovnaní.
Metodika: ako meriame spotrebu
Spôsob merania spotreby sme ladili pomerne dlho a ešte nejaký čas ho ladiť budeme. Ale už teraz máme k dispozícii prípravky, s ktorými môžeme spokojne fungovať.
Aby ste dostali presnú hodnotu celkovej spotreby grafickej karty je treba mapovať interný odber na slote PCI Express a externý na prídavnom napájaní. Na analýzu slotu PCIe bolo treba zostrojiť medzikartu, na ktorej meranie spotreby prebieha. Jej základ sú odpory kalibrované na presnú hodnotu (0,1 Ω) a podľa výšky úbytku napätia na nich vieme vypočítať prúd. Ten následne dosadzujeme do vzorca k zodpovedajúcej hodnote výstupného napätia ~ 12 V a ~ 3,3 V. Úbytok napätia je pritom natoľko nízky, že VRM grafickej karty nijako nerozhodí a na výstupe je stále viac než 12/3,3 V.
Na podobnom prípravku pracujeme aj pre externé napájanie. Pri ňom sú však dosahované podstatne vyššie prúdy, je nevyhnutná aj dlhšia kabeláž a viacero priechodov medzi konektormi, čo znamená, že úbytok napätia bude treba odčítavať na ešte menšom odpore 0,01 Ω, súčasný stav (s 0,1 Ω) máme zatiaľ nestabilný.
Dokým to poriadne vyladíme budeme na merania na kábloch používať prúdové kliešte Prova 15, ktoré takisto merajú s peknou presnosťou, akurát majú rozsah do 30 A. To ale stačí aj na OC verziu RTX 3090 Gaming X Trio. V prípade, že by bola nejaká karta cez rozsah, je vždy možnosť realizovať meranie spotreby na dvakrát (najprv na jednej a potom na druhej polovici 12 V vodičov).
A prečo sa vôbec trápime s takýmito prípravkami, keď má Nvidia analyzátor spotreby PCAT? Pre úplnú kontrolu nad meraniami. Zatiaľ čo naše zariadenia sú transparentné, tak to od Nvidie používa procesor ktoré môže (ale samozrejme i nemusí) merania rôzne prifarbovať. Po testovaní grafiky AMD na meracom prístroji Nvidia by sme asi pokojne nezaspávali.
Na čítanie a záznam meraní používame riadne skalibrovaný multimeter Keysight U1231A, ktorý vzorky posiela do XLS. Z neho získavame priemernú hodnotu a dosadením do vzorca s presnou hodnotou výstupných napätí na vetve získavame podklady do grafov.
Čiarové grafy s priebehmi budeme rozoberať pre každú časť napájania zvlášť. Aj keď podiel na 3,3 V je obvykle zanedbateľný, monitorovať ju treba. Ťažko povedať, čo táto vetva presne napája, ale obvykle je odber na nej konštantný a keď tak sa mení iba s ohľadom na to, či sa vykresľuje statický alebo dynamický obraz. Spotrebu meriame v dvoch náročnejších hrách (F1 2020 a Shadow of the Tomb Raider) a jednej menej náročnej (CS:GO) s nastavením najvyšších grafických detailov a rozlíšenia UHD (3840 × 2560 px).
Potom v pri 3D renderingu v Blenderi s použitím renderera Cycles na známej scéne Classroom. Okrem testov s vysokou záťažou je však dôležité mať prehlaď o odbere vo webovom prehliadači (tým je v našom prípade akcelerovaný Google Chrome), kde trávime tiež dosť času. Jednak teda pri sledovaní videa alebo pri prechádzaní stránkami.
Obvyklej priemernej záťaži tohto typu zodpovedá stránka FishIE Tank (HTML5) s 20 rybičkami a webové video v našich testoch spotreby zastupuje vzorka s kodekom VP9, dátovým tokom 17,4 mb/s a 60 fps. Naproti tomu testujeme spotrebu videa i offline, v prehrávači VLC. To na vzorke HEVC (45,7 mb/s, 50 fps). A nakoniec ešte odber grafickej karty zaznamenávame aj na pracovnej ploche nečinných Windows 10. S jedným i s dvoma aktívnymi monitormi UHD@60 Hz.
Metodika: merania hluku a zvuku
Merania hluku…
Hlučnosť, tak ako aj ostatné prevádzkové vlastnosti, ktorým, sa budeme ďalej venovať, meriame v rovnakých režimoch ako spotrebu, aby sa jednotlivé veličiny pekne prekrývali. Zaznamenávame v nich okrem hladiny produkovaného hluku aj frekvenčnú charakteristiku zvuku, vývoj frekvencií GPU a jeho zahrievanie.
V tejto časti opisu metodiky si uvedieme niečo k spôsobu merania hlučnosti. Používame Hlukomer Reed R8080, ktorý priebežne kalibrujeme skalibrovaným kalibrátorom Voltcraft SLC-100. Malý prídavok na hlukomeri je límec v tvare paraboly, ktorý má dve funkcie. Zvyšuje citlivosť, aby bolo možné rozlíšiť produkovaný zvuk aj pri veľmi nízkych otáčkach. Je tak možné medzi sebou lepšie porovnávať aj veľmi tiché karty s čo najväčším pomerovým rozdielom. V opačnom prípade (bez tejto úpravy) by sa mohlo jednoducho stať, že nameriame naprieč viacerými grafickými kartami rovnakú hladinu hluku i napriek tomu, že je v skutočnosti trochu iná.
Tento parabolický štít dáva význam ešte i z toho dôvodu, že z vonkajšej vypuklej strany (od chrbta) odráža všetky parazitné zvuky, s ktorými počas testovania bojuje každý, kto to s presnosťou meraní myslí aspoň trochu vážne. Ide o rôzne praskania tela či predmetov v miestnosti pri bežnej ľudskej aktivite.
Na zaistenie vždy rovnakých podmienok pri meraní hladiny hluku (a neskôr aj zvuku) používame okolo bench-wallu akustické panely s penovou plochou. To z dôvodu, aby sa zvuk do snímača hlukomera odrážal vždy rovnako bez ohľadu na momentálnu situáciu predmetov v testroome. Tieto panely sú z troch strán (zvrchu, sprava a zľava) a ich účelom odzvučniť priestor, v ktorom hlučnosť grafických kariet meriame. Odzvučniť znamená zamedziť rôznym odrazom zvuku a kmitaniu vĺn medzi plochými stenami. Nemýľte si to s odhlučnením, to máme v testlabe dlhodobo vyriešené dobre.
Snímač hlukomera je počas meraní umiestnený na statíve vždy pod rovnakým uhlom a v rovnakej vzdialenosti (35 cm) od slotu PCI Express, v ktorom je nainštalovaná grafická karta. Ku karte samotnej je to samozrejme vždy bližšie, záleží od jej hĺbky. Naznačený referenčný bod aj uhly snímača sú nemenné. Okrem „aerodynamickej hlučnosti“ chladičov meriame aj hladinu hluku pískajúcich cievok. Vtedy na moment ventilátory zastavíme. A na úplnosť treba dodať, že pri zvukových meraniach vypíname takisto ventilátor v zdroji ako aj na chladiči CPU. Meraná je tak vždy čisto grafická karta bez akýchkoľvek skreslení inými komponentmi.
… a frekvenčnej charakteristiky zvuku
Z rovnakého miesta meriame aj to, aká je frekvencia produkovaného zvuku. Jedna vec je hladina hluku (alebo úroveň akustického tlaku v decibeloch) a druhá vec jeho frekvenčná charakteristika, zafarbenie.
Podľa údaju o hladine hluku sa síce viete rýchlo zorientovať, či je grafická karta tichšia lebo hlučnejšia, respektíve kde sa na škále nachádza, no stále ide o mix rôznych frekvencií. Nehovorí teda o tom, či je produkovaný zvuk skôr dunivý (s nižšou frekvenciou) alebo piskľavý (s vysokou). Rovnakých 35 dBA vám tak za istých okolností môže byť prijemných, ale i nepríjemných – záleží na každom individuálne, ako vníma rôzne frekvencie. Z toho dôvodu okrem hladiny hluku budeme v aplikácii TrueRTA pri grafických kartách merať aj frekvenčnú charakteristiku zvuku.
Výsledky budú interpretované jednak formou spektrografu s rozlíšením 1/24 oktávy a na lepšie porovnanie s ostatnými grafickými kartami do štandardných pruhových grafov vytiahneme dominantnú frekvenciu nižšieho (20–200 Hz), stredného (201–2000 Hz) a vyššieho (2001–20 000 Hz) spektra tónov a k nemu i intenzitu, resp. hladinu hluku. Na merania používame mikrofón miniDSP UMIK-1, ktorým presne kopíruje polohu hlukomeru s tým, že takisto má límček, a to i s rovnakou ohniskovou vzdialenosťou.
Na záver tejto kapitoly treba poznamenať, že merania hluku a frekvenčnej charakteristiky zvuku budú na väčšine kariet prebiehať iba v záťažových testoch, keďže mimo záťaž a pri nižšom zaťažení (vrátane dekódovania videa) je prevádzka obvykle pasívna s odstavenými ventilátormi. Na druhej strane musíme byť pripravení aj na výnimky s aktívnou prevádzkou v idle alebo grafické karty s duálnym BIOSom, z ktorých ten výkonnejší ventilátory nikdy nevypína a tie sa točia aspoň na minimálnych otáčkach.
Nakoniec rovnako ako pri meraní hladiny hluku v jednom z testov zaznamenávame aj frekvenčnú charakteristiku pískajúcich cievok. Nejaké dramatické rozdiely tu však neočakávajte. Obvykle pôjde o jednu a tú istú frekvenciu a cieľom je skôr odhaliť nejakú prípadnú anomáliu. Zvuk pískajúcich cievok je samozrejme vzhľadom na scénu premenlivý, no my však meriame vždy na rovnakej (v CS:GO@1080p).
Metodika: testy zahrievania
Ochudobnení nebudete ani o testy zahrievania. Aby ale malo vôbec zmysel monitorovať teploty na kritických súčastiach nielen grafickej karty, ale čohokoľvek v počítači, je dôležité nasimulovať reálne prostredie počítačovej skrinky so zdravou cirkuláciou vzduchu. Od tej sa potom odvíja aj celkové správanie grafickej karty ako takej. Otvorený bench-table je v mnohých prípadoch nevhodný a výsledky z neho môžu byť skresľujúce. Preto počas všetkých testov nielen zahrievania, ale i merania spotreby či vývoju frekvencií grafického jadra používame veterný tunel s rovnovážnym prúdením.
Dva ventilátory Noctua NF-S12A sú na vstupe a rovnaký počet ich je aj na výduchu. Pri testovaní rôznych konfigurácií systémového chladenia sa nám to ukázalo ako najefektívnejšie riešenie. Ventilátory sú pritom vždy nastavené na 5 V a rýchlosť zodpovedajú približne 550 ot./min. Stálosť vzduchu na vstupe je počas testov riadne kontrolovaná, teplotne sa pohybuje v rozmedzí 21–21,3 °C pri vlhkosti ±40 %.
Zahrievanie odčítavame z interných snímačov cez GPU-Z. Táto malá jednoúčelová aplikácia umožňuje aj záznam vzoriek zo snímačov do tabuľky. Z nich je potom už jednoduché vytvoriť čiarové grafy s priebehmi či priemernú hodnotu do pruhových grafov. Termokameru tu veľmi nevyužijeme, keďže väčšina grafických kariet má backplate, ktorý znemožňuje meranie zahrievania PCB.
Kľúčové pre grafy zahrievania bude tak odpočet teplôt internými snímačmi, podľa ktorých sa koniec koncov odvíja aj regulácia frekvencií GPU. Vždy to bude zahrievanie grafického jadra a pokiaľ budú snímače aj na VRAM a VRM, tak vytiahneme do článku aj tieto hodnoty.
Testovacia zostava
Poznámka.: V čase testovania sú použité grafické ovládače AMD Adrenalin 21.10.3, zostavenie OS Windows 10 Enterprise je 19043.
3DMark
Na testy používame 3DMark Professional a z testov Night Raid (DirectX 12) vhodný na porovnanie slabších grafík, pre výkonnejšie je potom Fire Strike (DirectX 11) a Time Spy (DirectX 12).
Age of Empires II: DE
Testovacia platforma benchmark, API DirectX 11; prednastavený grafický profil Ultra; extra nastavenia žiadne.
Assassin’s Creed: Valhalla
Testovacia platforma benchmark; API DirectX 12; prednastavený grafický profil Ultra High; extra nastavenia žiadne.
Battlefield V
Testovacia platforma vlastná scéna (War stories/Under no flag); API DirectX 12, prednastavený grafický profil Ultra; TAA high; extra nastavenia žiadne.
Battlefield V s DXR
Testovacia platforma vlastná scéna (War stories/Under no flag); API DirectX 12, prednastavený grafický profil Ultra; TAA high; extra nastavenia DXR.
Poznámka: Hra podporuje aj DLSS, ale vzhľadom na to, že ide o starší titul a meraní je viac než dosť, sa tomuto nastaveniu v štandardných testoch venovať nebudeme. Nejaké to meranie na prianie však možné je, ak si oň napíšete.
Borderlands 3
Testovacia platforma benchmark; API DirectX 12, prednastavený grafický profil Ultra; TAA; extra nastavenia žiadne.
Control
Testovacia platforma vlastná scéna (kapitola Polaris); API DirectX 11, prednastavený grafický profil High; extra nastavenia žiadne.
Control s DXR (a DXR s DLSS)
Testovacia platforma vlastná scéna (kapitola Polaris); API DirectX 12, prednastavený grafický profil High; extra nastavenia DXR a DLSS (performance).
DXR (native)
DXR s DLSS (performance)
Counter-Strike: GO
Testovacia platforma benchmark (prelet nad mapou Dust 2); API DirectX 9, prednastavený grafický profil High; 4× MSAA; extra nastavenia žiadne.
Cyberpunk 2077
Testovacia platforma vlastná scéna (Little China); API DirectX 12, prednastavený grafický profil Ultra; extra nastavenia žiadne.
Cyberpunk 2077 s DLSS
Testovacia platforma vlastná scéna (Little China); API DirectX 12, prednastavený grafický profil Ultra; extra nastavenia DLSS (performance).
DLSS (performance)
Cyberpunk 2077 s DXR (a DXR s DLSS)
Testovacia platforma vlastná scéna (Little China); API DirectX 12, prednastavený grafický profil Ultra; extra nastavenia Ray Tracing zapnutý (Ultra).
DXR
DXR s DLSS (performance)
DOOM Eternal
Testovacia platforma vlastná scéna; API Vulkan, prednastavený grafický profil Ultra Nightmare; extra nastavenia žiadne.
F1 2020
Testovacia platforma benchmark (Australia, Clear/Dry, Cycle); API DirectX 12, prednastavený grafický profil Ultra High; TAA; extra nastavenia Skidmarks blending off*.
*na grafických kartách GeForce je voľba Skidmarks blending vypnutá. Na grafických AMD táto možnosť totiž chýba. Celková kvalita Skidmarks je ale inak na GeForce aj AMD nastavená na High.
Poznámka: Hra podporuje aj DLSS 2.0 a FidelityFX (CAS) pre upscaling a sharpening, ale vzhľadom na relatívnu hardvérovú nenáročnosť v natívnych nastaveniach sa im v štandardných testoch venovať nebudeme. Nejaké to meranie na prianie však možné je, ak si oň napíšete.
FIFA 21
Testovacia platforma vlastná scéna (Autumn/Fall, Overcast, 9pm, Old Trafford); API DirectX 12, prednastavený grafický profil Ultra; extra nastavenia žiadne.
Forza Horizon 4
Testovacia platforma vlastná scéna; API DirectX 12, prednastavený grafický profil Ultra; 2× MSAA; extra nastavenia žiadne.
Mafia: DE
Testovacia platforma vlastná scéna (z parkoviska Salieriho baru k bráne nadzemnej trati); API DirectX 11, prednastavený grafický profil High; extra nastavenia žiadne.
Metro Exodus
Testovacia platforma benchmark; API DirectX 12, prednastavený grafický profil Extreme; extra nastavenia žiadne.
Metro Exodus s DXR a DLSS
Testovacia platforma benchmark; API DirectX 12, prednastavený grafický profil Ultra; extra nastavenia DXR.
DXR (native)
DXR s DLSS (performance)
Microsoft Flight Simulator
Upozornenie: Výsledky z tejto hry na výpočet priemerného herného výkonu nepoužívame. To preto, že sa vplyvm aktualizácií často mení výkon v hre a keď sa tak stane, začíname databázu výsledkov budovať odznova. Na kontrolu konzistencie výsledkov MFS pred testom každej novej grafickej karty prechádzame testovaciu scénu s MSI RTX 3080 Gaming X Trio.
Testovacia platforma vlastná scéna (Paris-Charles de Gaulle, Air Traffic: AI, 14. február, 9:00) autopilot: od 1000 po náraz o terén; API DirectX 11, prednastavený grafický profil Ultra; TAA; extra nastavenia žiadne.
Red Dead Redemption 2 (Vulkan)
Testovacia platforma vlastná scéna; API Vulkan, prednastavený grafický profil Favor Quality; extra nastavenia žiadne.
Red Dead Redemption 2 (Dx12)
Testovacia platforma vlastná scéna; API DirectX 12, prednastavený grafický profil Favor Quality; extra nastavenia žiadne.
Shadow of the Tomb Raider
Testovacia platforma vlastná scéna; API DirectX 12, prednastavený grafický profil Highest; TAA; extra nastavenia žiadne.
Shadow of the Tomb Raider s DXR
Testovacia platforma benchmark; API DirectX 12, prednastavený grafický profil Highest; extra nastavenia DXR.
Poznámka: Hra podporuje aj DLSS a FidelityFX CAS, ale vzhľadom na to, že ide o starší titul a meraní je viac než dosť, sa tomuto nastaveniu v štandardných testoch venovať nebudeme. Nejaké to meranie na prianie však možné je, ak si oň napíšete.
Total War Saga: Troy
Testovacia platforma benchmark; API DirectX 11, prednastavený grafický profil Ultra; 4× AA, extra nastavenia žiadne.
Wasteland 3
Testovacia platforma vlastná scéna; API DirectX 11, prednastavený grafický profil Ultra; extra nastavenia žiadne.
Súhrnný herný výkon a výkon za euro
Priemerný výkon počítame tak, aby mala každá hra na výsledku rovnakú váhu. Ako presne sa dopracovávame k výsledku sa dozviete v tomto článku.
Výkon za euro
CompuBench 2.0 (OpenCL)
Testovacia platforma benchmark; API OpenCL; extra nastavenia žiadne.
Game Effects
Advanced Compute
High Quality Computer Generated Imagery and Rendering
High Quality Computer Generated Imagery and Rendering
Computer Vision
SPECviewperf 2020 a SPECworkstation 3
Testovacia platforma benchmark; API OpenGL a DirectX; extra nastavenia žiadne.
SPECworkstation 3
Testy FLOPS, IOPS a rýchlosť pamätí
Testovacia platforma benchmark; verzia aplikácie 6.32.5600; extra nastavenia žiadne.
3D rendering
LuxMark
Testovacia platforma benchmark; API OpenCL; extra nastavenia žiadne.
Blender@Cycles
Testovacia platforma render BMW a Classroom; renderer Cycles, 12 dlaždíc; extra nastavenia sú OpenCL pre grafické karty Radeon a CUDA pre GeForce. Tak, ako to bude používať väčšina ľudí. OpenCL s GeForce je vždy pomalé, pretože path tracing nepodporuje akceleráciu GPU a počíta ho CPU. Nvidia OptiX sa na podporovaných kartách (GeForce RTX) testuje samostatne a výsledky dávame do oddeleného grafu zvlášť.
Blender@Radeon ProRender
Testovacia platforma render BMW a Classroom; renderer Radeon ProRender, 1024 vzoriek; extra nastavenia žiadne. Extra nastavenia sú OpenCL pre grafické karty Radeon a CUDA pre GeForce. Nvidia OptiX sa na podporovaných kartách (GeForce RTX) testuje samostatne a výsledky dávame do oddeleného grafu zvlášť.
Blender@Eevee
Testovacia platforma render animácia Ember Forest; renderer Eevee, 350 obrázkov; extra nastavenia je OpenCL.
Úprava fotografií
Adobe Photoshop: Testovacia platforma Pugetbench; extra nastavenie žiadne.
Affinity Photo: Testovacia platforma vstavaný benchmark; extra nastavenie žiadne.
Adobe Lightroom: Testovacia platforma vlastný 1-gigabajtový archív 42 surových fotiek (CR2) z DSLR; extra nastavenie žiadne.
Broadcasting
OBS Studio a XSplit: Testovacia platforma benchmark hry F1 2020; extra nastavenia sú povolenia kodérov AMD VCE/Nvidia Nvenc (AVC/H.264), výstupné rozlíšenie 2560 × 1440 px (60 fps), cieľový bitrate 19 700 kb/s.
Lámanie hesiel
Testovacia platforma Hashcat; extra nastavenia žiadny. Testy si môžete jednoducho i sami vyskúšať. Stačí si stiahnuť binárku a v príkazovom riadku zadať podľa číselného kódu šifru, ktorá vás zaujíma.
Zahrievanie GPU
Zahrievanie VRAM
Upozornenie: Ak nameraná hodnota pri vybranej grafickej karte chýba, znamená to, že sa nedá nadetegovať interným snímačom.
Čistá spotreba grafickej karty
Analýza napájania z 3,3 V vetvy
Výkon na jednotku wattu
Frekvenčná charakteristika zvuku
Merania prebiehajú v aplikácii TrueRTA, ktorá zaznamenáva zvuk v škále 240 frekvencií v zaznamenávanom rozsahu 20–20 000 Hz. Pre možnosť porovnania naprieč článkami exportujeme do štandardných pruhových grafov dominantnú frekvenciu z nízkeho (20–200 Hz), stredného (201–2000 Hz) a vysokého (2001–20 000 Hz) spektra.
Na ešte podrobnejšiu analýzu zvukového prejavu je však dôležité vnímať celkový tvar grafu a intenzitu všetkých frekvencií/tónov. Ak by ste v grafoch a tabuľkách nižšie niečomu nerozumeli, odpovede na všetky otázky nájdete v tomto článku. Ten vysvetľuje, ako správne čítať namerané údaje nižšie.
Záver
GeForce RTX 4090 medzi ostatných grafickými kartami výrazne vyčnieva. Na v podstate bezkonkurenčnom postavení, čo sa týka rýchlosti, v testoch nič nezmení ani neskoršie doplnenie Radeon RX 7900 XTX. Zrýchlenie v porovnaní s RTX 3090 je takmer 60-percentné a rozoberať RTX 4090 v súvislosti s iným rozlíšením ako UHD (2160p) nemá príliš význam. Aj preto budú všetky nasledujúce konštatovania vychádzať z fungovania v takomto prostredí, v rozlíšení 3840 × 2160 px. Pod 60 fps v priechode náročnou testovacou scénou nepadá ani Cyberpunk 2077 na vizuálnych nastaveniach „Ultra“ bez RT grafiky. S ray tracingom je chod pomalší, ale ako na jedinej grafickej karte je na ako-tak „hrateľnej“ úrovni.
Priemerná snímková frekvencia drvivej väčšiny testovaných hier je trojciferná, v prípade Shadow of the Tomb Raider aj s maximálnym nastavením RT grafiky, hoci jej podiel v tejto hre je pomerne malý. V Battlefield V je ray-tracingovej práce viac a fps zostáva stále vysoké (prepady fps sú od nekomfortnej zóny ďaleko). RTX 4090 skrátka predstavuje voľbu, po ktorej sa ani náročný hráč nechce nejaký čas zaoberať modernizáciou zostavy.
Špičkový a neohrozene najvyšší medzi hernými grafickými kartami je aj výpočtový výkon, obzvlášť s akceleráciou tensorových jadier (napríklad v Blenderi, ale aj v mnohých iných aplikáciách). Do profesionálneho prostredia za „hernú“ cenu má RTX 4090 dobré predispozície aj pre veľkú pamäť, 24 GB. To podobne ako RTX 3090 (Ti) alebo RX 7900 XTX. Oproti Radeon RDNA 3 je tu však výhoda podpory Nvidia CUDA (grafické karty AMD pod OpenCL rýchlostne často výrazne zaostávajú).
Daňou za elitnú rýchlosť je mimoriadne vysoká spotreba, ktorá sa pri vysokom zaťažení pohybuje v rozmedzí 400–450 W. S tým prirodzene súvisia vysoké nároky na chladenie, čo sa premieta jednak do nadštandardne veľkých rozmerov, jednak do vyššej hlučnosti. Tá sa u testovacej karty Gigabyte Gaming OC 24G drží ale v podstatne nižšej hladine, než to bolo u Aorus RTX 3080 Xtreme 10G. Koeficient hlučnosti na jednotku spotreby je pomerne priaznivý. Taká o 85 W úspornejšia RX 6900 XT s 360 mm vodníkom vo vrcholovom vyhotovení Sapphire (Toxic LE) dáva o sebe vedieť viac.
Ilúzie o tichej karte vám robiť nebudeme, k tej s nedostanete ani v režime s BIOSom „Silent“. S ním sme nezaznamenali výraznejšiu zmenu, ale vzhľadom k spotrebe je hlučnosť chladiča uspokojivá. Hlavne na pomery Gigabyte, ktorý je známy v záujme čo najdlhšej životnosti nastavovaním agresívnejšej regulácie so strmými krivkami otáčok. Tej sa nastavenia úplne nevyhli ani teraz, čo vidieť na relatívne nízkom zahrievaní (tak GPU ako i pamätí) – priestor na stíšenie ventilátorov tu rozhodne je.
Najväčším prekvapením je zvukový prejav cievok. Namiesto „najhlučnejších očakávaní“ sú cievky Gigabyte RTX 4090 Gaming OC 24G tichšie ako u kariet z opačného výkonnostného spektra. To je v tejto triede pre náročných používateľov veľká motivácia. Najprv ku kúpe tohto modelu (Gigabyte Gaming OC 24G) a potom k manuálnemu ladeniu jeho ventilátorov. Ich chod sa ani nevyznačuje výraznými tónovými špičkami.
Za chladič a vlastne za celkové vyhotovenie karty (vrátane cievok na PCB) si Gigabyte rozhodne zaslúži pochvalu. A to ani nejde o top model, takže je tu na pomery grafických kariet RTX 4090 aj atraktívny pomer ceny k výkonu. Ten je z celkového pohľadu, samozrejme, slabší, ale tak to bolo a zrejme i bude u najvýkonnejších kariet vždy. V priaznivých podmienkach (to znamená pri poriadnom chladení) sú navyše u karty Gigabtye Gaming OC 24G špecifikované frekvencie GPU výrazne presahované. To aj pri prevádzke na hranici limitov spotreby. Aj vtedy je taktovacia frekvencia GPU aspoň +200 MHz oproti tomu, čo Gigabyte garantuje v rámci ooficiálnych parametrov.
Hoci sa s GeForce RTX 4090 spája aj veľmi vysoká spotreba, treba zdôrazniť, že naprieč generáciami (z Ampere na Ada Lovelace) je jej nárast percentuálne neúmerne nižší vysokému nárastu herného a výpočtového výkonu. Energetická efektivita stúpla o zhruba 50 %, pokiaľ RTX 4090 porovnávame s RTX 3090. Efektivita pri nízkej záťaži, ako je dekódovanie videa, prehliadanie webu či iba nenáročné vykresľovanie 2D obrazu, je porovnateľná. Výraznejší nárast RTX 4090 je iba popri viac-monitorových systémoch.
Takže kľúčové body: Cena pod 1900 eur, efektívny chladič, akusticky veľmi dobre zvládnuté cievky a nadčasový výkon v súčasnosti najrýchlejšieho GPU Nvidia GeForce. Za súbor výhodných vlastností udeľujeme grafickej karte Gigabyte RTX 4090 Gaming OC 24G ocenenie „Editor's Choice“.
Ľubomír Samák, redaktor HWCooling.net
Za spoluprácu na zabezpečovaní testovaného hardvéru ďakujeme e-shopu Datacomp