Nvidia řeší nestabilitu GeForce RTX 3080. Nový ovladač mění boost, může snížit výkon

30. 9. 2020

Sdílet

 Autor: Evga
Nvidia vydala nový ovladač 456.55, který má řešit pády her na GeForce RTX 3080, připisované kondenzátorům. Podle prvních testů ale asi mění boostování. Zřejmě snižuje maximální frekvence GPU, takže by zde mohl být nějaký dopad na výkon.

Minulý týden se na webu začaly množit stížnosti čerstvých majitelů karet GeForce RTX 3080, podle nichž některé (zřejmě hlavně nebo pouze nereferenční) karty mají problém se stabilitou – když GPU boost dosáhne určité frekvence, GPU začne chybovat a hra spadne. Zdá se, že řešení těchto problémů bude nakonec softwarové jen v rámci ovladače. Nicméně zdá se vede ke snížení frekvencí, takže může nastat určitý propad výkonu, naštěstí asi drobný.

S příčinou nestability je to poněkud komplikované. Karty v některých případech nezvládají takty, které jim nastavuje automatický boost, ale není úplně jasné, zda je problém čistě ve výši nastavených taktů, nebo je zde souhra se stavbou PCB. To je referenční navržené Nvidií a je možné, že jí stanovené specifikace nebyly v některých detailech odpovídající – nebo alespoň ne pro OC karty, zatímco pro čistě referenční takty možná ještě ano.

Více: Majitelé GeForce RTX 3080 hlásí pády ve hrách. GPU nestabilní při boostu nad 2000 MHz?

Na vině kondenzátory?

První analýzy hovořily o tom, že problém je v tom, jaké jsou osazené kondenzátory pro filtraci napětí. Tyto kondenzátory jsou na spodní straně PCB hned pod GPU a karty mají v tomto místě otvor v backplatu, takže osazení lez snadno zkontrolovat. Nvidia ve specifikacích dovoluje osazení polymerovými tantalovými kondenzátory (POSCAP nebo také SP-CAP), nebo keramickými vícevrstvými MLLC. Tyto součástky mají různé vlastnosti – MLCC asi podávají kvalitnější filtrovací „výkon“, ale POSCAPy zase mají delší životnost a lépe snášejí vysoké teploty. Nedá se tedy jednoduše říct, že POSCAPy jsou horší.

GPU má pod sebou šest pozic, kde může být šest POSCAPů (ty jsou velké černé), nebo lze jeden POSCAP na pozici nahradit skupinkou například deseti MLCC – ty jsou malé světlé, snadno tedy poznáte, co bylo zvoleno. Vypadá to ale, že čistě POSCAPy nebo také konfigurace 5×POSCAP + 10× MLCC má více hlášených problémů s pády her. Evga, MSI a Asus už zdá se upravily svoje karty tak, aby POSCAPy byly maximálně na čtyř pozicích, Asus je na některých kartách za skupinky MLCC nahradil všude. Konfigurace s pěti či šesti POSCAPy se tedy zdá se ukázala méně robustní, než se čekalo.

ASUS ROG STRIX kondenzatory VideoCardz Provedení karty RTX 3080 ROG Strix od ASusu ukazuje obě varianty kondenzatorů. Vlevo šest POSCAPů na předprodukčním vzorku, vpravo sériová karta se samými MLCC (Zdroj: VideoCardz)

Ovšem řešení záhady asi není tak snadné. Většina výrobců přesnou příčinu nikde neuvádí a například Gigabyte upozorňuje, že jde i o volbu konkrétních součástek a pouze to, jak osazení vypadá na pohled, ještě nemusí nic znamenat. Také Nvidia si stojí za tím, že všechny konfigurace jsou legitimní a dle specifikací a nelze z nich tedy soudit nic o tom, že by karta měla vadu. Jen Evga výslovně uvádí, že měnila POSCAPy za MLCC pro zlepšení funkce karet.

Problém kondenzátorů byl, ale ne na kartách, které se prodávají zákazníkům?

A jen kondenzátory zřejmě skutečně nejsou klíč k pádům her. Jak Evga, tak Asus a také MSI tvrdí, že výměna POSCAPů za MLCC kondenzátory byla provedena již před startem sériové výroby – více POSCAPů tedy může maximálně být na vzorcích, které byla zaslány do recenzí. Potenciální problémy byly asi identifikovány ještě pře začátkem výroby, nebo byla PCB ručně přepájena.

Kondenzatory na PCB GeForce RTX 3080 od Palitu Kondenzátory na PCB GeForce RTX 3080 od Palitu (Zdroj: techPowerUp)

Jak Evga, tak MSI a Asus uvádějí, že v prodeji mají být jen karty, které už jsou opravené. Ovšem to by znamenalo, že ti, kdo kartu koupili z oficiálních obchodů (a nejde tedy o ilegálně prodaný předprodukční vzorek), by neměli pády/nestabilitou trpět, což zdá se úplně neplatí.

MSI stands behind its design decisions for its GeForce RTX 30 Series graphics cards catalog which consists of GAMING models and VENTUS models. MSI utilizes a mixed capacitor grouping in its designs to benefit from the strengths of both SP-Caps and MLCCs. (MSI)

It is false that POSCAP capacitors independently could cause a hardware crash. Whether a graphics card is stable or not requires a comprehensive evaluation of the overall circuit and power delivery design, not just the difference in capacitor types. POSCAPs and MLCCs have different characteristics and uses, thus it is not true to assert that one capacitor type is better than the other. (Gigabyte)

During our mass production QC testing we discovered a full 6 POSCAPs solution cannot pass the real world applications testing. It took almost a week of R&D effort to find the cause and reduce the POSCAPs to 4 and add 20 MLCC caps prior to shipping production boards, this is why the EVGA GeForce RTX 3080 FTW3 series was delayed at launch. There were no 6 POSCAP production EVGA GeForce RTX 3080 FTW3 boards shipped. (Evga)

Nvidia řeší problémy globálně ovladačem

Nvidia situaci poněkud zamíchala, protože tento týden vydala opravu v ovladači, která tento problém zdá se řeší snížením taktů karet. Jak Gigabyte, tak MSI oficiálně uvádějí, že pokud máte s kartou problémy, měl by je tento ovladač vyřešit. Začíná to tedy vypadat, že možná i modely s již upraveným osazením kondenzátorů tuto opravu budou potřebovat.

Tato oprava se nachází v ovladači 456.55. V poznámkách Nvidia uvádí, že „zlepšuje stabilitu“, aniž by se však přímo vyjádřila k problémům hlášeným u nereferenčních karet. Nicméně výrobci karet ve svých vyjádřeních na tento ovladač přímo ukazují, takže je zřejmě opravdu určen k řešení tohoto problému. Také uživatelé, kteří ho již nainstalovali, hlásí, že jim pády ustaly (zda je účinný 100 %, nebo budou někde třeba i nějaké reklamace hardwaru, to ještě ukáže čas, doufejme ale, že bude aktualizace stačit).

NVIDIA posted a driver this morning that improves stability. Regarding partner board designs, our partners regularly customize their designs and we work closely with them in the process. The appropriate number of POSCAP vs. MLCC groupings can vary depending on the design and is not necessarily indicative of quality.

Například podle Gigabyte a MSI je tento ovladač oficiálně jediným řešením, které je potřebné. Tvrdí tedy, že u prodejích karet by současné provedení kondenzátorů mělo být plně adekvátní (pokud tedy budete mít tento nový ovladač).

Oprava je podle všeho provedena změnou GPU Boostu, Nvidia zřejmě snížila maximální hodnoty, které může dosáhnout (a které způsobovaly pád). Nemusíte zatím panikařit, redukce je zdá se opravdu malá. Snížený pracovní takt by logicky měl snižovat výkon, ale bavíme se o hodnotě, která ho zřejmě srazí maximálně dejme tomu o jedno procento, pokud ne méně.

Snížení taktů dle webu PCWorld

To, že aktualizace ovladače snižuje takty, není nikde oficiálně řečeno, ale tuto informaci máme od recenzenta webu PCWorld Brada Chacose. Ten měl na test předprodukční kartu Evga v provedení FTW3 s šesti POSCAPy (prodejní model už je změněn) a ačkoliv většině recenzentů snad díky screeningu vzorků nic nehaprovalo, jeho karta replikovatelně padala v benchmarku hry Horizon Zero Dawn. Nový ovladač nestabilitu odstranil, ale Chacos zdokumentoval, že za cenu (drobného) snížení taktu.

S předchozími ovladači (456.38) běžel benchmark většinu času na 2010 MHz bez problémů, ale poté v jedné scéně takt stoupnul na 2025 MHz a hra spadla. Mělo to být prakticky při každém pokusu.

Crash hry na GeForce RTX 3080 PCWorld Crash hry na GeForce RTX 3080 (Zdroj: PCWorld)

Ovladač 456.55 chybu odstraňuje a benchmark smrtící scénou projede bez viditelného problému. Ovšem při monitorování taktů je vidět, že hra drží původních 2010 MHz již jenom ve svém menu, kde je asi nižší zátěž GPU. Při samotném hraní/benchmarku se frekvence s novým ovladačem držela mezi 1980 MHz až 1995 MHz. V kritickém momentu testu stoupla, ale teď již jen na 2010 MHz. Tento rozdíl zřejmě stačí k tomu, aby filtrace napětí dokázala udržet GPU stabilní. Je pozoruhodné, že rozdíl je jen 15 MHz (na druhou stranu, asi není ponechána moc velká rezerva).

Snížení frekvencí GPU zaznamenal také Andreas Schilling z HardwareLuxx:

https://twitter.com/aschilling/status/1310839749385613312

Dlužno říct, že to, o kolik se frekvence sníží, by se teoreticky mohlo u různých nereferenčních karet různit. Také zatím nevíme, zda jsou snížené takty jen u karet ostatních výrobců (tedy těch s deskou PG132), nebo Nvidia snížila takto frekvenci i svým vlastním kartám Founders Edition (ty mají PCB PG133 a nejsou z továrny přetaktované).

Kdo myslíte, že může za problém s nestabilitou u GeForce RTX 3080?

Shrnuto stručně – momentálně je řešení problémů zřejmě bez ohledu na provedení karty na bedrech nového ovladače 456.55. Pokud jste majitelem RTX 3080, měli byste ho nainstalovat (dřív nebo později budete stejně muset, neboť tato změna asi bude součástí všech následujících) a případné nestability řešit až tehdy, pokud zůstanou i po této aktualizaci.

Tip: Nvidia GeForce RTX 3080 vydána. Výkon, spotřeba a výsledky v recenzích

bitcoin školení listopad 24

Galerie: Výkon Nvidia GeForce RTX 3080 ve světových recenzích

Ideální by bylo přeměřit testy

Určitá potíž je v tom, že pokud změna boostu opravdu vede byť i k miniaturnímu snížení výkonu, měly by se teď správně přeměřit všechny recenze. Drobná korekce FPS třeba o to jedno procento sice nijak nepohne s celkovým hodnocením a výhodností grafiky GeForce RTX 3080, ale principiálně teď vlastně všechny výsledky naměřené v testech před ovladačem 456.55 přestaly platit, protože už neodpovídají (jakkoli to může být o nepatrný rozdíl – problém je vlastně hlavně v tom, že nevíte, kolik si od grafu případně v duchu odečíst).

Zdroje: Nvidia, VideoCardz, PCWorld