Majitelé GeForce RTX 3080 hlásí pády ve hrách. GPU nestabilní při boostu nad 2000 MHz?

24. 9. 2020

Sdílet

 Autor: Nvidia
GPU Ampere se nevyhnuly porodní bolesti, již v prvním týdnu se objevilo poměrně dost stížností na padání her, možná kvůli nestabilitě OC modelů RTX 3080.

Dnes vychází GeForce RTX 3090; první model generace Ampere, jímž je GeForce RTX 3080, ale Nvidia vydala už před týdnem. Vypadá to ale, že kromě špatné dostupnosti (která je nejspíš způsobená kombinací vysokého zájmu a pozdního startu výroby a tím malých zásob před vydáním) trpí právě tato karta možná ještě jednou nemocí.

Poměrně rychle vzhledem k tomu, že se do rukou uživatelů asi ještě dostalo jen omezené množství kusů, se totiž objevily zprávy o tom, že RTX 3080 jsou někdy nestabilní a způsobují při zátěži pády her.

Problémy hlášené u nereferenčních karet

Je třeba říct, že se to pravděpodobně netýká GPU jako takového, protože tato hlášení jsou jen u některých modelů od partnerských výrobců. U těch majitelé hlásí, že když GPU boost dosáhne frekvencí nad 2,0 GHz, tak při určité frekvenci (údajně 2010 až 2040 MHz) hra spadne, jakoby GPU zřejmě přestalo být stabilní a někde začalo generovat chyby. Nemluvíme tu u uživatelském přetaktování, jde o frekvence, které boost automaticky nastavuje při běžném přetaktování.

Tovární přetaktování už ale asi roli hraje, protože tyto problémy jsou hlášeny na OC verzích karet, které mají rovnou z továrny zvýšené frekvence proti referenčním parametrům. Má jít například o Zotac RTX 3080 Trinity, MSI RTX 3080 Ventus 3X OC, ale prý také o karty Gaming Trio od MSI, Gigabyte RTX 3080 Gaming OC nebo nějaké modely Evga (model XC3).

Evga GeForce RTX 3080 XC3 Gaming Evga GeForce RTX 3080 XC3 Gaming (Zdroj: Evga)

Ze začátku to vypadalo, že s kartami Founders Edition od Nvidie problémy nejsou, nicméně na fóru Nvidie už jedno takové hlášení také je. Verze Founders Edition nemají tovární přetaktování a jejich takty jsou proto výchozí. Je asi možné, že toto hlášení je zrovna způsobené nekvalitním zdrojem nebo něčím podobným a ne přímo nestabilitou přetaktovaného GPU.

Ještě je asi brzo hodnotit, zda jde o to, že GPU nezvládá stabilně takty, na které ho nereferenční karty nastavují, a bude nutné boostování omezit aktualizací firmwaru (což sníží výkon). Teoreticky by mohlo jít třeba i o interakci s dalším hardwarem, například málo kvalitními zdroji, nebo málo stabilním PCI Expressem. Teoreticky může jít o systémy s hraničně přetaktovaným CPU, kde latentní problém se stabilitou při zatížení GPU způsobí, že „přeteče pohár“ a kombinace CPU, GPU shodí běžící hru.

Nemusí ani nutně jít o problém hardwaru. Nelze vyloučit ani softwarovou chybu ovladače, i když to, že jsou pády spojené s překročením určité frekvence, by na hardware ukazovalo. Teoreticky by mohlo jít i o softwarovou chybu v kódu řídícím frekvence.

Nicméně nejpravděpodobnější vysvětlení je asi to, že GPU GA102 samotné je stabilní a plně validované na svých referenčních taktech, avšak má příliš malou rezervu pro přetaktování (protože frekvence jsou už v základu vyhnané vysoko) a výrobci karet při tvorbě modelů s OC nebyli dostatečně konzervativní a zvolili frekvence, které nejsou zaručeně funkční.

MSI GeForce RTX 3080 Ventus 3X OC MSI GeForce RTX 3080 Ventus 3X OC (Zdroj: MSI)

Výrobci měli asi málo času na testování

To je samozřejmě selhání, protože OC karta by měla také být dostatečně otestovaná a výrobce by měl nejdříve ověřit, zda bude bez problémů běhat. Ale výrobci karet zde možná mají určitou omluvu – Nvidia jim totiž údajně dala velmi málo času. I po dostupnosti samotného hardwaru a PCB neměli výrobci k mání ovladač, ten prý dostali až cca tři týdny před uvedením karet na trh (tj. samotným startem prodejů, kdy samotná expedice z továrny musela být stihnutá mnohem dříve).

Toto znamená, že mohli testovat interakci PCB, GPU a chladiče třeba jen s nějakou simulací tepelného výkonu a možná nějakými vybranými úlohami, ale nemohli de facto chod karet, které vyráběli, skutečně vyzkoušet ve hrách. Pravděpodobně mohla vzniknout situace, kdy omezené možnosti testování stability pod zátěží, které výrobci měli k dispozici, propustily potenciální problém, protože omezené testování nestabilitu nevyvolalo.

Zde by tedy měli ostudu dílem výrobci karet, kteří se spolehli na nedostatečné testování a riskovali, ale dílem také Nvidia, která jim nedala dost času (a je možné, že Ampere je na OC choulostivější, než předchozí čipy).

Zda budou nestabilitu těchto karet řešit aktualizace firmwaru nebo ovladačů, zatím netušíme. Zatím nebylo oznámeno žádné řešení nebo to, že by byla příčina pádů nalezena a pracovalo se na odstranění (oficiální vyjádření od výrobců nebo Nvidie ještě není). Je možné, že problém bude pouze ve výstupní kontrole a binování/testování čipů. Pak budou nestabilní kusy prostě staženy zpět a nahrazeny v rámci reklamací a u nových by problém měly odbourat více důkladné testy u výrobce (kde karty/čipy, které nevyhoví, půjdou do nižší edice karty bez OC).

bitcoin_skoleni

Jako dočasné řešení těchto chyb mohou uživatelé nastavením offsetu snížit (třeba o 50 až 100 MHz) frekvence GPU, což by mělo problému předejít.

Galerie: Výkon Nvidia GeForce RTX 3080 ve světových recenzích

Zdroje: VideoCardz, ComputerBase, Overclockers UK, Nvidia forums, Tom's Hardware (forum), Reddit