Náplasť na „príliš drahú 4080“
Nvidia urobila zrejme dobre, že upustila od pôvodného plánu s dvoma RTX 4080, kde jedna (s lepšie vybaveným GPU a 16 GB VRAM) mala byť výkonnejšia a druhá (12-gigabajtová) pomalšia. Tej i z hľadiska lepšej orientácie lepšie sedí konečné označenie RTX 4070 Ti. Tieto grafické karty sú postavené na jadre AD104, ktoré je s 295 mm2 oproti tomu (AD103) v RTX 4080 plošne menšie o približne 22 %. V takomto pomere je RTX 4070 Ti „ukrátená“ aj o počet blokov SM (60) a shaderov má 7680. Frekvenčne je však GPU v RTX 4070 Ti vždy rýchlejšia, základný takt je vyšší o 105 MHz (2310 MHz). V praxi je však taktovacia frekvencia obvykle výrazne vyššia – MSI pre testovaný variant Suprim X v booste garantuje aspoň 2775 MHz.
Jeden z hlavných rozdielov RTX 4070 Ti oproti RTX 4080 je vo veľkosti videopamäte, tá je o 4 GB menšia (12 GB), ale stále sú použité rýchle moduly GDDR6X. Pripojené sú ale „iba“ 192-bitovou zbernicou, takže priepustnosť je nakoniec o nižšia o takmer 30 %.
MSI RTX 4070 Ti Suprim X 12G v detailoch
Z nejakých, povedzme všeobecnejších parametrov sa presunieme ku konkrétnym detailom, ktoré sa týkajú vlajkového vyhotovenia MSI – Suprim X. Okrem neho MSI má aj lacnejšie varianty Ventus 3X (OC) a Gaming (X) Trio (dokonca aj v bielej), no najrýchlejšia možnosť s najefektívnejším chladičom stelesňuje práve Suprim X. Eventuálne je s rovnakým chladičom k dispozícii aj Suprim bez „X“ s o trochu nižšími frekvenciami.
Telo RTX 4070 Ti Suprim X je obrovské. Do dĺžky je to 338 mm a na výšku 73 mm. Chladič je o trošičku (úmerne menšiemu TDP) nižší ako RTX 4080 Suprim X, ale stále musíte počítať s tým, že grafická karta okrem svojho vlastného obsadí ďalšie tri sloty PCI Express. Výrobcovia základných dosiek (a špeciálne Gigabyte) s ohľadom na „hrubé“ grafiky svoje základné dosky celkom dobre optimalizujú – druhý slot PCIe si obvykle od prvého držia dobrý odstup a medzipriestor efektívne vypĺňajú pozície M.2 na SSD.
A nakoniec ešte jeden rozmer, od ktorého závisí kompatibilita so skrinkou – šírka. Tá je u RTX 4070 Ti Suprim (X) 142 mm. Pre väčšinu skriniek sa nejedná o mieru, ktorá by presahovala podporu, ale pri modeloch s vertikálne rozdeleným interiérom na dve časti buďte obozretní. V nich sa totiž už môže stať, že bude grafická karta narážať na bočnicu skrinky.
Súčasťou chladiča Tri Frozr 3S sú tri ventilátory s priemerom 95 mm. Pozoruhodný je pri nich to, že špičky lopatiek sú pospájané po trojiciach akýmsi rámčekom. Ten má hlavne spevňujúcu úlohu a eliminuje vlnenie na koncoch lopatiek. Tým sa znižujú nielen vibrácie, ale sa i potláčajú rezonančné frekvencie zvuku, ktoré znepríjemňujú používateľský komfort.
Väčšina krytu karty je kovová, z hliníku. Backplate i predná časť medzi ventilátormi. Plastové prvky (časti s tmavšou farbou) sú v menšine a vždy sa vyznačujú vysokou pevnosťou (jedná sa o riadne tvrdený materiál). Všetky časti k sebe dobre lícujú a celkový dojem z konštrukcie je veľmi dobrý, príslušnosť k triede najdrahších vyhotovení si Suprim X obháji pomerne ľahko.
Externé napájanie je realizované jedným 16-pinovým konektorom (12VHPWR) s dutinkami Astron. Hoci sú to tie s menšou styčnou plochou (s pinmi) s vyšším prechodovým odporom, ale vzhľadom na nižšiu spotrebu je adaptér spôsobilý. Svedčia o tom aj termovízne testy, ktoré sme robili pri výkonnejšej RTX 4080 Suprim X s rovnakým adaptérom v balení.
Podsvietenie ARGB LED je z troch strán. Svetlovodivé pásy sú medzi ventilátormi, zboku (s podsvietením nápisu Suprim a loga MSI) a nakoniec i zozadu, kde je osvetlené logo Suprim, útvar vyskladaný z trojuholníkových dlaždíc, ktorý na znak prémiovosti symbolizuje diamant.
Súčasťou príslušenstva je okrem napájacieho adaptéru podložka pod myš s tematickou príslušnosťou k značke Suprim, ale hlavne výškovo nastaviteľný držiak. Ten grafickú kartu podpiera zozadu, aby si držala rovinu a nadmerne nezaťažovala slot PCI Express. „Zdvihák“ MSI je robustný a vďaka gumenej základni stabilný aj pri manipulácii s počítačom.
Článok pokračuje ďalšími kapitolami:
Metodika: výkonnostné testy
Herné testy
Najväčšia vzorka testov je z hier. Vzhľadom na to, že sa prevažne budú testovať GeForce a Radeony, teda grafiky primárne určené na herné použitie, je to vcelku prirodzené.
Testovacie hry sme vybrali v prvom rade s ohľadom na to, aby bola rovnováha medzi titulmi lepšie optimalizovanými na GPU jedného (AMD) či druhého výrobcu (Nvidia). Zohľadňovali sme ale takisto popularitu titulov, aby ste si v grafoch našli „tie svoje“ výsledky. Dôraz bol kladený aj na žánrovú pestrosť. Zastúpené sú tak hry typu RTS, FPS, TPS, automobilové závody ako i letecký simulátor, tradičné RPG a športovú zástavu dvíha najhrávanejší futbal. Zoznam testovacích hier nájdete v knižnici kapitol (9–32) s tým, že každá hra má na čo najlepšiu prehľadnosť tú svoju, niekedy i dve (kapitoly), čo má ale svoj dobrý dôvod, o ktorý sa s vami v ďalšom texte podelíme.
Skôr, než sa pustíme do herných testov, tak na zahorenie so zahriatím na prevádzkovú teplotu každá grafická karta prejde testami v 3DMarku. To je na začiatok taká dobrá syntetika.
Výkon v hrách testujeme naprieč troma rozlíšeniami s pomerom strán 16:9 – FHD (1920 × 1080 px), QHD (2560 × 1440 px) a UHD (3840 × 2160 px) a vždy s najvyšším profilom grafických detailov, ktorý je možné nastaviť rovnako na všetkých aktuálnych grafických kartách GeForce a Radeon . Proprietárne detaily na objektívnosť záverov vypíname a nastavenia s ray-tracingovou grafikou sú testované zvlášť, keďže ich nižšia trieda GPU nepodporuje. Ich výsledky nájdete v doplňujúcich kapitolách. Okrem natívneho ray tracingu aj po nasadení Nvidia DLSS (2.0) a AMD FidelityFX CAS.
Ak má hra vstavaný benchmark, tak používame ten (výnimka je iba Forza Horizon 4, kde pre jeho nestabilitu – sem-tam zvykne štrajkovať – jazdíme po svojej trati), v ostatných prípadoch merania prebiehajú na vlastných scénach. Z tých cez OCAT zachytávame časy za sebou idúcich snímok do tabuliek (CSV), ktoré do zrozumiteľnej reči fps interpretuje FLAT. Obe tieto aplikácie sú z dielne kolegov z magazínu gpureport.cz. Okrem priemernej snímkovej frekvencie do grafov zapisujeme aj minimálnu. Tá sa na celkovom zážitku z hrania podieľa významnou mierou. Na čo najvyššiu presnosť sú všetky merania opakované trikrát a konečné výsledky tvoria ich priemernú hodnotu.
Výpočtové testy
Otestovať grafickú kartu komplexne aj z pohľadu výpočtového výkonu je zložitejšie, než urobiť závery z herného prostredia. Už len z toho dôvodu, že sa takéto testy obvykle viažu na drahý softvér, ktorý si „len tak do redakcie“ nekúpite. Na druhej strane sme našli spôsoby, ako vám ten dostupný výpočtový výkon priblížiť. Jednak vďaka dobre stavaným benchmarkom, jednak sú tu aj nejaké voľne dostupné a pritom relevantné aplikácie a do tretice sme i niečo investovali do tých platených.
Testy zahajuje CompuBench, ktorý počíta rôzne simulácie (mimo iné aj z hernej grafiky). Potom prechádzame na populárny benchmark SPECviewperf (2020) , ktorý integruje čiastkové operácie z populárnych 2D a 3D aplikácií, medzi ktorými je 3Ds max či SolidWorks. Detaily o tomto testovacom balíčku nájdete na webe spec.org. Od rovnakého tímu je i SPECworkstation 3, kde je GPU akcelerácia v testoch Caffe a Folding@Home. V grafoch nájdete aj výsledky 3D renderu LuxMark 3.1 a pozoruhodný teoretický test GPGPU obsahuje aj AIDA64 s meraniami FLOPS, IOPS a rýchlostí pamätí.
Najväčšiu porciu testov si z pochopiteľných dôvodov ukrojilo 3D renderovanie. To napríklad aj v rámci praktických testov Blendery (2.91). Okrem Cycles grafiky potrápime aj renderermi Eevee a radeon ProRender (nech má nejaký spriaznený test aj AMD, keď už je väčšina optimalizovaná na karty Nvidie s proprietárnymi frameworkami CUDA a OptiX). Zaujímavý by bol isteže aj add-on pre V-ray, na ten však momentálne redakčná kasa nestačí, ale možno sa nám podarí časom získať nejakú „press“ licenciu, uvidíme.
Aplikačné testy chceme do budúcna rozvíjať. Výhľadovo určite nejakým pokročilým testovaním AI (zatiaľ sme neprišli na rozumný spôsob) vrátane odšumovania (tam by už nejaké nápady boli, ale pre časovú tieseň sme ich zatiaľ nezapracovali).
Grafické karty sa dajú dobre uchopiť aj pri úpravách fotografií. Na získanie predstavy o výkone v populárnom Photoshope používame naskriptovaný PugetBench, ktorý simuluje reálnu prácu z rôznymi filtrami. Medzi nimi sú i také, ktoré používajú GPU akceleráciu. Komplexný benchmark napovedajúci o výkone rastrovej a vektorovej grafiky je potom i v alternatívnom Affinity Photo. V Lightroome sú zase pozoruhodné farebné korekcie (Enhance Details) surových nekomprimovaných fotiek. Tie aplikujeme dávkovo na 1 GB archív. Všetky tieto úlohy vedia akcelerovať tak GeForce ako i Radeony.
Zase z iného cesta sú potom testy dešifrovania v Hashcate s výberom šifier AES, MD5, NTLMv2, SHA1, SHA2–256/512 a WPA-EAPOL-PBKDF2. Nakoniec ešte v broadcastových aplikáciách OBS a Xsplit meriame, o koľko sa zníži herný výkon počas nahrávania. To už neobstarávajú shadrery, ale kodéri (AMD VCE a Nvidia Nvenc). Tieto testy poukazujú na to, akú má ktorá karta približne rezervu typicky na online streamovanie.
Možnosti hardvérovej akcelerácií je, samoi zrejme, viac, typicky pre strih a prevody videa. To je už však čisto v réžii kodérov, ktoré sú v rámci jednej generácie kariet jedného výrobcu vždy rovnaké, takže nemá zmysel ich testovať na každej grafike. Naprieč generáciami je to už iné a testy tohto typu sa skôr či neskôr objavia. Už len doladiť metriku, kde bude na výstupe vždy rovnaký bitrate a zhoda pixelov. To je na objektívne porovnávania dôležité, pretože kodér jednej firmy/karty síce môže byť v konkrétnom profile s rovnakými nastaveniami rýchlejší, ale na úkor nižšej kvality, ktorú má (ale i nemusí mať, to je len príklad) iný kodér.
Novinka: Od 18. 11. 2022 testujeme všetky grafické karty už iba v režime a aktívnou technológiou Resizable BAR. Dôvody, prečo v meraniach bez ReBARu ďalej nebudeme pokračovať sú tri.
Hlavný dôvod je ten, že nové základné dosky počnúc modelmi s čipsetmi Intel Z790 a AMD X670(E) ho už majú vynútený, čo predtým nebývalo a v nastaveniach PCIe sa vyžadovalo sa ručné zapnutie ReBAR. Kto ho nevypne bude teda fungovať s aktívnym ReBARom, čo je z pohľadu hier, kde pridáva výkon, dobre. Je to do istej miery možno aj preto, že grafické karty Intel bez ReBAR sa, zdá sa, nesprávajú korektne a grafických kariet, ktoré s ním budú počítať, bude do budúcna zrejme pribúdať. Dôvod číslo dva pre testy iba s ReBARom už poznáte.
A nakoniec je pravda i to, že testovať všetky testy na dvakrát (s ReBARom i bez neho) s trojnásobnou opakovateľnosťou, je časovo extrémne náročné. Stále však platí to, čo sme tvrdili viackrát – platforma s ReBARom je, čo sa týka výsledkov meraní, menej stabilná. Naprieč časom sa môžu niektoré veci v procese ladenia (s ovládača na ovládač) meniť a vo vzájomnom porovnaní nemusia „dávať logiku“. Keď teda niekde uvidíte, že v iných testoch pomalšia karta v nejakom konkrétnom prípade predbieha nejakú výkonnejšiu, tak si spomeňte na tieto slová.
Nevýhoda meraní s aktívnym ReBARom je skrátka to, že všetky porovnávajúce testy nemusia byť vždy perfektne konzistentné. A je možné, že sa budú i naďalej objavovať prípady, kde ReBAR výkon skôr znižuje, než by ho pridával. S týmito vecami treba pri štúdiu výsledkov počítať. To neplatí iba pre naše testy, ale pre testy všetkých osttaných, ktorí s každou novou otestovanou grafickou kartou nepretestovávajú aj všetky staršie modeli v porovnaní.
Metodika: ako meriame spotrebu
Spôsob merania spotreby sme ladili pomerne dlho a ešte nejaký čas ho ladiť budeme. Ale už teraz máme k dispozícii prípravky, s ktorými môžeme spokojne fungovať.
Aby ste dostali presnú hodnotu celkovej spotreby grafickej karty je treba mapovať interný odber na slote PCI Express a externý na prídavnom napájaní. Na analýzu slotu PCIe bolo treba zostrojiť medzikartu, na ktorej meranie spotreby prebieha. Jej základ sú odpory kalibrované na presnú hodnotu (0,1 Ω) a podľa výšky úbytku napätia na nich vieme vypočítať prúd. Ten následne dosadzujeme do vzorca k zodpovedajúcej hodnote výstupného napätia ~ 12 V a ~ 3,3 V. Úbytok napätia je pritom natoľko nízky, že VRM grafickej karty nijako nerozhodí a na výstupe je stále viac než 12/3,3 V.
Na podobnom prípravku pracujeme aj pre externé napájanie. Pri ňom sú však dosahované podstatne vyššie prúdy, je nevyhnutná aj dlhšia kabeláž a viacero priechodov medzi konektormi, čo znamená, že úbytok napätia bude treba odčítavať na ešte menšom odpore 0,01 Ω, súčasný stav (s 0,1 Ω) máme zatiaľ nestabilný.
Dokým to poriadne vyladíme budeme na merania na kábloch používať prúdové kliešte Prova 15, ktoré takisto merajú s peknou presnosťou, akurát majú rozsah do 30 A. To ale stačí aj na OC verziu RTX 3090 Gaming X Trio. V prípade, že by bola nejaká karta cez rozsah, je vždy možnosť realizovať meranie spotreby na dvakrát (najprv na jednej a potom na druhej polovici 12 V vodičov).
A prečo sa vôbec trápime s takýmito prípravkami, keď má Nvidia analyzátor spotreby PCAT? Pre úplnú kontrolu nad meraniami. Zatiaľ čo naše zariadenia sú transparentné, tak to od Nvidie používa procesor ktoré môže (ale samozrejme i nemusí) merania rôzne prifarbovať. Po testovaní grafiky AMD na meracom prístroji Nvidia by sme asi pokojne nezaspávali.
Na čítanie a záznam meraní používame riadne skalibrovaný multimeter Keysight U1231A, ktorý vzorky posiela do XLS. Z neho získavame priemernú hodnotu a dosadením do vzorca s presnou hodnotou výstupných napätí na vetve získavame podklady do grafov.
Čiarové grafy s priebehmi budeme rozoberať pre každú časť napájania zvlášť. Aj keď podiel na 3,3 V je obvykle zanedbateľný, monitorovať ju treba. Ťažko povedať, čo táto vetva presne napája, ale obvykle je odber na nej konštantný a keď tak sa mení iba s ohľadom na to, či sa vykresľuje statický alebo dynamický obraz. Spotrebu meriame v dvoch náročnejších hrách (F1 2020 a Shadow of the Tomb Raider) a jednej menej náročnej (CS:GO) s nastavením najvyšších grafických detailov a rozlíšenia UHD (3840 × 2560 px).
Potom v pri 3D renderingu v Blenderi s použitím renderera Cycles na známej scéne Classroom. Okrem testov s vysokou záťažou je však dôležité mať prehlaď o odbere vo webovom prehliadači (tým je v našom prípade akcelerovaný Google Chrome), kde trávime tiež dosť času. Jednak teda pri sledovaní videa alebo pri prechádzaní stránkami.
Obvyklej priemernej záťaži tohto typu zodpovedá stránka FishIE Tank (HTML5) s 20 rybičkami a webové video v našich testoch spotreby zastupuje vzorka s kodekom VP9, dátovým tokom 17,4 mb/s a 60 fps. Naproti tomu testujeme spotrebu videa i offline, v prehrávači VLC. To na vzorke HEVC (45,7 mb/s, 50 fps). A nakoniec ešte odber grafickej karty zaznamenávame aj na pracovnej ploche nečinných Windows 10. S jedným i s dvoma aktívnymi monitormi UHD@60 Hz.
Metodika: merania hluku a zvuku
Merania hluku…
Hlučnosť, tak ako aj ostatné prevádzkové vlastnosti, ktorým, sa budeme ďalej venovať, meriame v rovnakých režimoch ako spotrebu, aby sa jednotlivé veličiny pekne prekrývali. Zaznamenávame v nich okrem hladiny produkovaného hluku aj frekvenčnú charakteristiku zvuku, vývoj frekvencií GPU a jeho zahrievanie.
V tejto časti opisu metodiky si uvedieme niečo k spôsobu merania hlučnosti. Používame Hlukomer Reed R8080, ktorý priebežne kalibrujeme skalibrovaným kalibrátorom Voltcraft SLC-100. Malý prídavok na hlukomeri je límec v tvare paraboly, ktorý má dve funkcie. Zvyšuje citlivosť, aby bolo možné rozlíšiť produkovaný zvuk aj pri veľmi nízkych otáčkach. Je tak možné medzi sebou lepšie porovnávať aj veľmi tiché karty s čo najväčším pomerovým rozdielom. V opačnom prípade (bez tejto úpravy) by sa mohlo jednoducho stať, že nameriame naprieč viacerými grafickými kartami rovnakú hladinu hluku i napriek tomu, že je v skutočnosti trochu iná.
Tento parabolický štít dáva význam ešte i z toho dôvodu, že z vonkajšej vypuklej strany (od chrbta) odráža všetky parazitné zvuky, s ktorými počas testovania bojuje každý, kto to s presnosťou meraní myslí aspoň trochu vážne. Ide o rôzne praskania tela či predmetov v miestnosti pri bežnej ľudskej aktivite.
Na zaistenie vždy rovnakých podmienok pri meraní hladiny hluku (a neskôr aj zvuku) používame okolo bench-wallu akustické panely s penovou plochou. To z dôvodu, aby sa zvuk do snímača hlukomera odrážal vždy rovnako bez ohľadu na momentálnu situáciu predmetov v testroome. Tieto panely sú z troch strán (zvrchu, sprava a zľava) a ich účelom odzvučniť priestor, v ktorom hlučnosť grafických kariet meriame. Odzvučniť znamená zamedziť rôznym odrazom zvuku a kmitaniu vĺn medzi plochými stenami. Nemýľte si to s odhlučnením, to máme v testlabe dlhodobo vyriešené dobre.
Snímač hlukomera je počas meraní umiestnený na statíve vždy pod rovnakým uhlom a v rovnakej vzdialenosti (35 cm) od slotu PCI Express, v ktorom je nainštalovaná grafická karta. Ku karte samotnej je to samozrejme vždy bližšie, záleží od jej hĺbky. Naznačený referenčný bod aj uhly snímača sú nemenné. Okrem „aerodynamickej hlučnosti“ chladičov meriame aj hladinu hluku pískajúcich cievok. Vtedy na moment ventilátory zastavíme. A na úplnosť treba dodať, že pri zvukových meraniach vypíname takisto ventilátor v zdroji ako aj na chladiči CPU. Meraná je tak vždy čisto grafická karta bez akýchkoľvek skreslení inými komponentmi.
… a frekvenčnej charakteristiky zvuku
Z rovnakého miesta meriame aj to, aká je frekvencia produkovaného zvuku. Jedna vec je hladina hluku (alebo úroveň akustického tlaku v decibeloch) a druhá vec jeho frekvenčná charakteristika, zafarbenie.
Podľa údaju o hladine hluku sa síce viete rýchlo zorientovať, či je grafická karta tichšia lebo hlučnejšia, respektíve kde sa na škále nachádza, no stále ide o mix rôznych frekvencií. Nehovorí teda o tom, či je produkovaný zvuk skôr dunivý (s nižšou frekvenciou) alebo piskľavý (s vysokou). Rovnakých 35 dBA vám tak za istých okolností môže byť prijemných, ale i nepríjemných – záleží na každom individuálne, ako vníma rôzne frekvencie. Z toho dôvodu okrem hladiny hluku budeme v aplikácii TrueRTA pri grafických kartách merať aj frekvenčnú charakteristiku zvuku.
Výsledky budú interpretované jednak formou spektrografu s rozlíšením 1/24 oktávy a na lepšie porovnanie s ostatnými grafickými kartami do štandardných pruhových grafov vytiahneme dominantnú frekvenciu nižšieho (20–200 Hz), stredného (201–2000 Hz) a vyššieho (2001–20 000 Hz) spektra tónov a k nemu i intenzitu, resp. hladinu hluku. Na merania používame mikrofón miniDSP UMIK-1, ktorým presne kopíruje polohu hlukomeru s tým, že takisto má límček, a to i s rovnakou ohniskovou vzdialenosťou.
Na záver tejto kapitoly treba poznamenať, že merania hluku a frekvenčnej charakteristiky zvuku budú na väčšine kariet prebiehať iba v záťažových testoch, keďže mimo záťaž a pri nižšom zaťažení (vrátane dekódovania videa) je prevádzka obvykle pasívna s odstavenými ventilátormi. Na druhej strane musíme byť pripravení aj na výnimky s aktívnou prevádzkou v idle alebo grafické karty s duálnym BIOSom, z ktorých ten výkonnejší ventilátory nikdy nevypína a tie sa točia aspoň na minimálnych otáčkach.
Nakoniec rovnako ako pri meraní hladiny hluku v jednom z testov zaznamenávame aj frekvenčnú charakteristiku pískajúcich cievok. Nejaké dramatické rozdiely tu však neočakávajte. Obvykle pôjde o jednu a tú istú frekvenciu a cieľom je skôr odhaliť nejakú prípadnú anomáliu. Zvuk pískajúcich cievok je samozrejme vzhľadom na scénu premenlivý, no my však meriame vždy na rovnakej (v CS:GO@1080p).
Metodika: testy zahrievania
Ochudobnení nebudete ani o testy zahrievania. Aby ale malo vôbec zmysel monitorovať teploty na kritických súčastiach nielen grafickej karty, ale čohokoľvek v počítači, je dôležité nasimulovať reálne prostredie počítačovej skrinky so zdravou cirkuláciou vzduchu. Od tej sa potom odvíja aj celkové správanie grafickej karty ako takej. Otvorený bench-table je v mnohých prípadoch nevhodný a výsledky z neho môžu byť skresľujúce. Preto počas všetkých testov nielen zahrievania, ale i merania spotreby či vývoju frekvencií grafického jadra používame veterný tunel s rovnovážnym prúdením.
Dva ventilátory Noctua NF-S12A sú na vstupe a rovnaký počet ich je aj na výduchu. Pri testovaní rôznych konfigurácií systémového chladenia sa nám to ukázalo ako najefektívnejšie riešenie. Ventilátory sú pritom vždy nastavené na 5 V a rýchlosť zodpovedajú približne 550 ot./min. Stálosť vzduchu na vstupe je počas testov riadne kontrolovaná, teplotne sa pohybuje v rozmedzí 21–21,3 °C pri vlhkosti ±40 %.
Zahrievanie odčítavame z interných snímačov cez GPU-Z. Táto malá jednoúčelová aplikácia umožňuje aj záznam vzoriek zo snímačov do tabuľky. Z nich je potom už jednoduché vytvoriť čiarové grafy s priebehmi či priemernú hodnotu do pruhových grafov. Termokameru tu veľmi nevyužijeme, keďže väčšina grafických kariet má backplate, ktorý znemožňuje meranie zahrievania PCB.
Kľúčové pre grafy zahrievania bude tak odpočet teplôt internými snímačmi, podľa ktorých sa koniec koncov odvíja aj regulácia frekvencií GPU. Vždy to bude zahrievanie grafického jadra a pokiaľ budú snímače aj na VRAM a VRM, tak vytiahneme do článku aj tieto hodnoty.
Testovacia zostava
Poznámka.: V čase testovania sú použité grafické ovládače AMD Adrenalin 21.10.3, zostavenie OS Windows 10 Enterprise je 19043.
3DMark
Na testy používame 3DMark Professional a z testov Night Raid (DirectX 12) vhodný na porovnanie slabších grafík, pre výkonnejšie je potom Fire Strike (DirectX 11) a Time Spy (DirectX 12).
Age of Empires II: DE
Testovacia platforma benchmark, API DirectX 11; prednastavený grafický profil Ultra; extra nastavenia žiadne.
Assassin’s Creed: Valhalla
Testovacia platforma benchmark; API DirectX 12; prednastavený grafický profil Ultra High; extra nastavenia žiadne.
Battlefield V
Testovacia platforma vlastná scéna (War stories/Under no flag); API DirectX 12, prednastavený grafický profil Ultra; TAA high; extra nastavenia žiadne.
Battlefield V s DXR
Testovacia platforma vlastná scéna (War stories/Under no flag); API DirectX 12, prednastavený grafický profil Ultra; TAA high; extra nastavenia DXR.
Poznámka: Hra podporuje aj DLSS, ale vzhľadom na to, že ide o starší titul a meraní je viac než dosť, sa tomuto nastaveniu v štandardných testoch venovať nebudeme. Nejaké to meranie na prianie však možné je, ak si oň napíšete.
Borderlands 3
Testovacia platforma benchmark; API DirectX 12, prednastavený grafický profil Ultra; TAA; extra nastavenia žiadne.
Control
Testovacia platforma vlastná scéna (kapitola Polaris); API DirectX 11, prednastavený grafický profil High; extra nastavenia žiadne.
Control s DXR (a DXR s DLSS)
Testovacia platforma vlastná scéna (kapitola Polaris); API DirectX 12, prednastavený grafický profil High; extra nastavenia DXR a DLSS (performance).
DXR (native)
DXR s DLSS (performance)
Counter-Strike: GO
Testovacia platforma benchmark (prelet nad mapou Dust 2); API DirectX 9, prednastavený grafický profil High; 4× MSAA; extra nastavenia žiadne.
Cyberpunk 2077
Testovacia platforma vlastná scéna (Little China); API DirectX 12, prednastavený grafický profil Ultra; extra nastavenia žiadne.
Cyberpunk 2077 s DLSS
Testovacia platforma vlastná scéna (Little China); API DirectX 12, prednastavený grafický profil Ultra; extra nastavenia DLSS (performance).
DLSS (performance)
Cyberpunk 2077 s DXR (a DXR s DLSS)
Testovacia platforma vlastná scéna (Little China); API DirectX 12, prednastavený grafický profil Ultra; extra nastavenia Ray Tracing zapnutý (Ultra).
DXR
DXR s DLSS (performance)
DOOM Eternal
Testovacia platforma vlastná scéna; API Vulkan, prednastavený grafický profil Ultra Nightmare; extra nastavenia žiadne.
F1 2020
Testovacia platforma benchmark (Australia, Clear/Dry, Cycle); API DirectX 12, prednastavený grafický profil Ultra High; TAA; extra nastavenia Skidmarks blending off*.
*na grafických kartách GeForce je voľba Skidmarks blending vypnutá. Na grafických AMD táto možnosť totiž chýba. Celková kvalita Skidmarks je ale inak na GeForce aj AMD nastavená na High.
Poznámka: Hra podporuje aj DLSS 2.0 a FidelityFX (CAS) pre upscaling a sharpening, ale vzhľadom na relatívnu hardvérovú nenáročnosť v natívnych nastaveniach sa im v štandardných testoch venovať nebudeme. Nejaké to meranie na prianie však možné je, ak si oň napíšete.
FIFA 21
Testovacia platforma vlastná scéna (Autumn/Fall, Overcast, 9pm, Old Trafford); API DirectX 12, prednastavený grafický profil Ultra; extra nastavenia žiadne.
Forza Horizon 4
Testovacia platforma vlastná scéna; API DirectX 12, prednastavený grafický profil Ultra; 2× MSAA; extra nastavenia žiadne.
Mafia: DE
Testovacia platforma vlastná scéna (z parkoviska Salieriho baru k bráne nadzemnej trati); API DirectX 11, prednastavený grafický profil High; extra nastavenia žiadne.
Metro Exodus
Testovacia platforma benchmark; API DirectX 12, prednastavený grafický profil Extreme; extra nastavenia žiadne.
Metro Exodus s DXR a DLSS
Testovacia platforma benchmark; API DirectX 12, prednastavený grafický profil Ultra; extra nastavenia DXR.
DXR (native)
DXR s DLSS (performance)
Microsoft Flight Simulator
Upozornenie: Výsledky z tejto hry na výpočet priemerného herného výkonu nepoužívame. To preto, že sa vplyvm aktualizácií často mení výkon v hre a keď sa tak stane, začíname databázu výsledkov budovať odznova. Na kontrolu konzistencie výsledkov MFS pred testom každej novej grafickej karty prechádzame testovaciu scénu s MSI RTX 3080 Gaming X Trio.
Testovacia platforma vlastná scéna (Paris-Charles de Gaulle, Air Traffic: AI, 14. február, 9:00) autopilot: od 1000 po náraz o terén; API DirectX 11, prednastavený grafický profil Ultra; TAA; extra nastavenia žiadne.
Red Dead Redemption 2 (Vulkan)
Testovacia platforma vlastná scéna; API Vulkan, prednastavený grafický profil Favor Quality; extra nastavenia žiadne.
Red Dead Redemption 2 (Dx12)
Testovacia platforma vlastná scéna; API DirectX 12, prednastavený grafický profil Favor Quality; extra nastavenia žiadne.
Shadow of the Tomb Raider
Testovacia platforma vlastná scéna; API DirectX 12, prednastavený grafický profil Highest; TAA; extra nastavenia žiadne.
Shadow of the Tomb Raider s DXR
Testovacia platforma benchmark; API DirectX 12, prednastavený grafický profil Highest; extra nastavenia DXR.
Poznámka: Hra podporuje aj DLSS a FidelityFX CAS, ale vzhľadom na to, že ide o starší titul a meraní je viac než dosť, sa tomuto nastaveniu v štandardných testoch venovať nebudeme. Nejaké to meranie na prianie však možné je, ak si oň napíšete.
Total War Saga: Troy
Testovacia platforma benchmark; API DirectX 11, prednastavený grafický profil Ultra; 4× AA, extra nastavenia žiadne.
Wasteland 3
Testovacia platforma vlastná scéna; API DirectX 11, prednastavený grafický profil Ultra; extra nastavenia žiadne.
Súhrnný herný výkon a výkon za euro
Priemerný výkon počítame tak, aby mala každá hra na výsledku rovnakú váhu. Ako presne sa dopracovávame k výsledku sa dozviete v tomto článku.
Výkon za euro
CompuBench 2.0 (OpenCL)
Testovacia platforma benchmark; API OpenCL; extra nastavenia žiadne.
Game Effects
Advanced Compute
High Quality Computer Generated Imagery and Rendering
High Quality Computer Generated Imagery and Rendering
Computer Vision
SPECviewperf 2020 a SPECworkstation 3
Testovacia platforma benchmark; API OpenGL a DirectX; extra nastavenia žiadne.
SPECworkstation 3
Testy FLOPS, IOPS a rýchlosť pamätí
Testovacia platforma benchmark; verzia aplikácie 6.32.5600; extra nastavenia žiadne.
3D rendering
LuxMark
Testovacia platforma benchmark; API OpenCL; extra nastavenia žiadne.
Blender@Cycles
Testovacia platforma render BMW a Classroom; renderer Cycles, 12 dlaždíc; extra nastavenia sú OpenCL pre grafické karty Radeon a CUDA pre GeForce. Tak, ako to bude používať väčšina ľudí. OpenCL s GeForce je vždy pomalé, pretože path tracing nepodporuje akceleráciu GPU a počíta ho CPU. Nvidia OptiX sa na podporovaných kartách (GeForce RTX) testuje samostatne a výsledky dávame do oddeleného grafu zvlášť.
Blender@Radeon ProRender
Testovacia platforma render BMW a Classroom; renderer Radeon ProRender, 1024 vzoriek; extra nastavenia žiadne. Extra nastavenia sú OpenCL pre grafické karty Radeon a CUDA pre GeForce. Nvidia OptiX sa na podporovaných kartách (GeForce RTX) testuje samostatne a výsledky dávame do oddeleného grafu zvlášť.
Blender@Eevee
Testovacia platforma render animácia Ember Forest; renderer Eevee, 350 obrázkov; extra nastavenia je OpenCL.
Úprava fotografií
Adobe Photoshop: Testovacia platforma Pugetbench; extra nastavenie žiadne.
Affinity Photo: Testovacia platforma vstavaný benchmark; extra nastavenie žiadne.
Adobe Lightroom: Testovacia platforma vlastný 1-gigabajtový archív 42 surových fotiek (CR2) z DSLR; extra nastavenie žiadne.
Broadcasting
OBS Studio a XSplit: Testovacia platforma benchmark hry F1 2020; extra nastavenia sú povolenia kodérov AMD VCE/Nvidia Nvenc (AVC/H.264), výstupné rozlíšenie 2560 × 1440 px (60 fps), cieľový bitrate 19 700 kb/s.
Lámanie hesiel
Testovacia platforma Hashcat; extra nastavenia žiadny. Testy si môžete jednoducho i sami vyskúšať. Stačí si stiahnuť binárku a v príkazovom riadku zadať podľa číselného kódu šifru, ktorá vás zaujíma.
Zahrievanie GPU
Zahrievanie VRAM
Upozornenie: Ak nameraná hodnota pri vybranej grafickej karte chýba, znamená to, že sa nedá nadetegovať interným snímačom.
Čistá spotreba grafickej karty
Analýza napájania z 3,3 V vetvy
Výkon na jednotku wattu
Frekvenčná charakteristika zvuku
Merania prebiehajú v aplikácii TrueRTA, ktorá zaznamenáva zvuk v škále 240 frekvencií v zaznamenávanom rozsahu 20–20 000 Hz. Pre možnosť porovnania naprieč článkami exportujeme do štandardných pruhových grafov dominantnú frekvenciu z nízkeho (20–200 Hz), stredného (201–2000 Hz) a vysokého (2001–20 000 Hz) spektra.
Na ešte podrobnejšiu analýzu zvukového prejavu je však dôležité vnímať celkový tvar grafu a intenzitu všetkých frekvencií/tónov. Ak by ste v grafoch a tabuľkách nižšie niečomu nerozumeli, odpovede na všetky otázky nájdete v tomto článku. Ten vysvetľuje, ako správne čítať namerané údaje nižšie.
Záver
Herný výkon RTX 4070 Ti je približne 20 % (bez raytracingovej grafiky) až 25 % (s RT) pod RTX 4080. Tým je veľmi tesne nad top modelmi grafických kariet GeForce a Radeon z predošlej generácie. RTX 4070 Ti je oproti nim ale vždy úspornejšia a efektívnejšia voľba, hoci v porovnaní s RTX 4080 je efektivita nižšia.
Z pohľadu hrubého výkonu je RTX 4070 Ti nejakých 75–80 % z RTX 4080, ale pri spotrebe blízko 90 % (z RTX 4080). Je to i z dôvodu, že RTX 4070 Ti chýbajúce výpočtové jednotky čiastočne kompenzuje vyššími frekvenciami (s agresívnejším napájaním), čím „naháňa“ hlavne herný výkon. Ten je ale i tak na jednotku spotreby stále podstatne vyšší ako u RTX 3080 (+ cca 70 %) či RX 6900 XT (+ cca 50 %).
Na hranie je RTX 4070 Ti vhodná do rozlíšenia 1440p (obzvlášť k monitorom s veľmi vysokou obnovovacou frekvenciou obrazu) alebo do 2160p, kde je škrtenie CPU najnižšie. Až na svetlé výnimky (typu Cyperpunk 2077) herné fps pod 60 v drvivej väčšine hier na RTX 4070 Ti nepadajú ani v rozlíšení UHD s grafickými detailmi nastavenými na maximum. S ray-tracingom je to už „horšie“ a pre plynulý alebo plynulejší chod treba aplikovať DLSS. Napríklad hru Control tak (s DLSS na „performance“) vyškriabete z priemerných 34 na 103 fps, Cyperpunk 2077 zase z nehrateľných 18 na 73 fps. Hry s menej rozsiahlou RT grafikou, ako je trebárs aj Shadow of the Tomb Raider či Battlefield V, sú na RTX 4070 Ti svižné aj v natívnom rozlíšení UHD.
K zrýchleniu v hrách oproti RTX 3090 (Ti) dochádza v drvivej väčšine prípadov, ale existujú aj situácie, kde je možné pozorovať opačný trend. Medzi také patrí aj Total War Saga: Troy či paradoxne dokonca hardvérovo nenáročný Age of Empires II: DE. V tejto hre je nízka aj spotreba a zjavne tak nie sú poriadne vyťažené prostriedky GPU.
Značne nadpriemerný nárast herného výkonu napríklad oproti RTX 3080 je v DOOMe Eternal, až do 20 %. Než porovnanie so staršími grafickými kartami nás bude výhľadovo zaujímať to, ako RTX 4070 Ti, ale i RTX 4080 budú stať oproti konkurenčnému Radeonu RX 7900 XT.
Pre tých, čo grafickú kartu nekupujú na hranie: Výpočtový výkon dostupný pre 3D renderovanie je medzi RTX 4080 a RTX 3080. Od oboch je RTX 4070 Ti vzdialená zhruba 25–28 %, v jedom prípade (RTX 3080) do plusu, v druhom (RTX 4080) do mínusu. Pokiaľ vás zaujíma výkon v aplikáciách Autodesku (3Ds Max, Creo, Maya, …) alebo akcelerácia grafických editorov (Adobe Photoshop či Affinity Photo), máme otestované.
A teraz adresnejšie k testovanému vyhotoveniu RTX 4070 Ti – Suprim X. Dosahované frekvencie GPU sú v booste nadštandardne vysoké, 2840–2860 MHz čo sa lacnejších modelov tykať nebude.
Chladič je perfektný, teploty GPU ani pamätí do vysokých hodnôt nepúšťa a súčasne je aj pri maximálnom výkone je bez ohľadu na BIOS (Silent/Performance) mimoriadne tichý, jeden z najtichších v testoch. Je prakticky na úrovni tichej RTX 3050 Ventus 2X 8G OC s menej než polovičnou spotrebou. Zase to ale trochu kazia cievky, ktoré sú podstatne nepríjemnejšie ako aerodynamická zložka zvuku. Ich intenzita hluku je síce menšia ako u RTX 4080, ale stále sú hlasnejšie ako napríklad na RTX 3090 Gaming X Trio. Pritom technicky je celkom dobre možné urobiť výrazne tichšie cievky, ale zrejme je hlas ľudu v tejto veci príliš slabý, aby výrobcov nejakým spôsobom motivoval. Tak či onak je ale vyhotovenie grafickej karty MSI RTX 4070 Ti Suprim X je na špičkovej úrovni a veľa priestoru na to, aby iné nereferenčné varianty v niečom vynikali, nevytvára.
Ľubomír Samák, redaktor HWCooling.net
Za spoluprácu na zabezpečovaní testovaného hardvéru ďakujeme e-shopu Datacomp