Kauza odumírání procesorů Intel ještě neskončila, problém pokračuje. Intel našel další spouštěč

27. 9. 2024

Sdílet

 Autor: Ľubomír Samák
Fyzická degradace procesorů Intel Core 13./14. generace, která se projevuje nevratnou ztrátou stability, má podle Intelu celkem čtyři příčiny a jedna z nich teprve čeká na opravu. Zatím tedy tato CPU stále ještě nejsou v bezpečí.

Mohlo se zdát, že kauza s nestabilitou a selháváním procesorů Intel Raptor Lake (Core 13. a 14. generace pro desktop) už skončila – a Intel by si to určitě přál – když minulý měsíc začaly vycházet BIOSy s opravami mikrokódu. Ale není tomu tak. Firma nyní vydala nové prohlášení, podle kterého ani tehdejší opravy ještě nejsou dostatečné, a majitelé budou potřebovat ještě jednu aktualizaci, aby se zamezilo pozvolnému selhávání těchto procesorů.

Intel ve středu vydal na svém komunitním webu (kde od počátku informace k celé věci zveřejňuje, byť by si vzhledem k dopadu asi zasloužily větší viditelnost) aktualizaci k problému nestability a degradování procesorů Raptor Lake. Tato navazuje na červencové informace, v kterých Intel potvrdil, že nestabilita je hardwarový problém způsobený degradací vlivem vysokého napětí, kterému jsou procesory podrobovány během běžného používání. Rozebírali jsme to v předchozích článcích.

Intel v té době ještě uváděl, že analýzy pokračují s cílem vyloučit další možné faktory a potvrdit, že problém je skutečně plně identifikován (a opraven). Tento týden firma doplnila další informace a potvrdila, že zkoumání dokončila a již oficiálně potvrzuje, že problém s vysokým napětím je skutečně ústřední příčina. Tím se myslí, že by už měla být vyloučená možnost, že za nestabilitou stojí ještě jiné faktory, které dosud řešené nejsou. To je tedy dobrá zpráva.

Čtyři příčiny degradace

Nicméně součástí této zprávy je také to, že byly objeveny další faktory, které tuto již identifikovanou příčinu (vysoké napětí) v praxi procesorům dodávají. Ač je totiž „vražedná zbraň“ jedna, k jejímu použití v procesoru dochází více cestami. Intel nyní uvádí, že příliš vysoké napětí dodané do procesoru může vzniknout z celkem čtyř příčin. První tři faktory jsou už nějakými způsoby řešené:

1) Zvyšování spotřeby procesoru nad doporučené hodnoty. Toto tedy Intel skutečně dál považuje za součást problému a znamená to, že firma stále říká, že na deskách by měly být nastavené limity spotřeby dle profilů „Intel Default Settings“, nikoliv odemčené limity vedoucí k vyššímu výkonu. Znamená to, že procesory budou mít definitivně snížený výkon proti tomu, kde byly při vydání v recenzích.

Obrat v kauze nestabilních procesorů Intel: Hrozící ztráty výkonu s Intel Default Settings vyjasněné? Přečtěte si také:

Obrat v kauze nestabilních procesorů Intel: Hrozící ztráty výkonu s Intel Default Settings vyjasněné?

2) Druhý faktor je, že procesory ignorovaly „předpis“, že maximální boostová frekvence dostupná pomocí tzv. Thermal Velocity Boostu má být používaná jen při teplotě do 70 °C. Tak to oficiálně má být, ale v recenzích jsme většinou viděli, že tato podmínka byla ignorována s cílem dosahovat na vyšší výkon a lepší skóre v benchmarcích. Thermal Velocity Boost ale zvyšuje i napětí a v kombinaci s vyšší teplotou se zvyšovalo i riziko poškození čipu.

Letos v létě Intel sdělil, že toto opravdu byl problém. Ačkoliv toto porušování specifikace bylo po nějaké dva roky dobře známo, Intel teď o této věci mluvil jako o „chybě nalezené v mikrokódu“. Nicméně je možné, že podobně jako v případě nikým nerespektovaných limitů spotřeby šlo o záměrnou snahu zvýšit výkon faktickým přetaktováním, ovšem bez oficiálního přiznání.

Intel stále nenašel řešení nestabilních procesorů Raptor Lake. Mají chybu v TVB, ale příčina je jinde Přečtěte si také:

Intel stále nenašel řešení nestabilních procesorů Raptor Lake. Mají chybu v TVB, ale příčina je jinde

Každopádně tato „chyba“ byla opravena mikrokódem 0×125. Týká se jen modelů Core i9, kterým může oprava o něco zhoršit maximální výkon v jednovláknových programech (protože při korektním fungování nebude Thermal Velocity Boost aktivován tak často jako dřív).

3) Třetí příčinou příliš vysokých napětí, dosud označovanou za hlavní v tom smyslu, že má asi největší díl odpovědnosti, je samotné řízení napětí v procesorech. To bylo příliš neopatrné a dovolovalo procesoru požadovat nebezpečně vysoká napětí ve snaze kompenzovat podpětí (Vdroop) při náhlých změnách zátěže. Ukázalo se ale, že místo aby došlo jen ke kompenzaci propadu, reálně se tvořily vysoké špičky napětí, které procesor postupně poškozují, až přestane korektně fungovat.

Intel o tomto degradování eufemicky mluví jako o „Vmin shift“, čímž se myslí, že se postupně zvyšuje napětí, které procesor potřebuje ke korektnímu fungování. To ale neznamená nic jiného než degradaci, polopaticky řečeno se děje to, že CPU se najednou chová jako přetaktované a vyžaduje pro stabilitu vyšší napětí (nebo podtaktování), i když přetaktované není. Jak se stav postupně zhoršuje, muselo by přidané napětí být čím dál vyšší, spotřeba CU se zhoršuje a dříve nebo později bude procesor v podstatě vadný.

Intel našel defekt procesorů Raptor Lake, chystá opravu. Jsou k tomu ale dvě špatné zprávy Přečtěte si také:

Intel našel defekt procesorů Raptor Lake, chystá opravu. Jsou k tomu ale dvě špatné zprávy

Proč procesory Intel postupně umírají? Uniklé interní dokumenty odhalují víc detailů Přečtěte si také:

Proč procesory Intel postupně umírají? Uniklé interní dokumenty odhalují víc detailů

Řešením ze strany Intelu bylo, že řízení napětí omezí požadavky procesoru na maximálně 1,55 V, což má předejít nebezpečným špičkám. Těžko ale nyní říct, zda budou eliminované zcela, nebo jen v dostatečné míře na to, aby se degradace významně omezila. Oprava přišla v aktualizaci mikrokódu 0×129 a je důrazně doporučeno, abyste ji aplikovali tím, že do desky nahrajete nejnovější BIOS.

Vyjádření Intelu k problému nestability a degradace procesorů Raptor Lake (25. září 2024)

Vyjádření Intelu k problému nestability a degradace procesorů Raptor Lake (25. září 2024)

Autor: Intel, snímek Cnews

Objevena další příčina vedoucí k nebezpečnému napětí, bude další aktualizace

4) Nově ovšem Intel přidal další, separátní čtvrtý problém, což zřejmě znamená, že pro eliminaci nebezpečných špiček napětí inženýři potřebovali udělat další změnu v řízení napětí. Není úplně jasné, v čem přesně spočívá, Intel píše, že problémem je to, že „mikrokód a BIOS požadovaly [od regulátorů napětí] příliš vysoká napětí“.

Tato formulace asi znamená, že algoritmy starající se o řízení (a volbu) napětí nebyly dostatečně precizní nebo nereagovaly dostatečně rychle na výkyvy a musely být různě změněné – nemusí jít asi o opravu nějakého jednoho konkrétního „bugu“. Podle Intelu by se změny měly týkat zejména chování procesoru během nízkých zátěží a nečinnosti. To tedy definitivě potvrzuje, že procesory nebyly poškozovány jen dlouhou vysokou zátěží za vysokých teplot a spotřeb, ale ony nebezpečné výkyvy napětí možná měly nejvíc na svědomí rychlé přechody mezi nečinností a boostem, jak jsme usuzovali v předchozích článcích. Tudíž neplatí, že se nemusíte bát, když procesor nepoužíváte na náročné věci a hraní, ale „jen na běžné věci“.

Ať už jsou ale detaily této chyby v řízení napětí jakékoli, opět bude řešená opravou mikrokódu. Tentokrát bude opravná aktualizace mít označení 0×12B. Tato opravná verze má v sobě začleněné i předchozí opravy 0×125 a 0×129 (jde o hexadecimální číslo, 12B je víc než 129). Po verzi mikrokódu 0×12B nebo vyšší tedy pátrejte, když budete chtít ověřit, zda už máte svůj počítač opravený.

Intel Core i9-13900K

Intel Core i9–13900K

Autor: Ľubomír Samák

Tato oprava mikrokódu bude distribuována jako součást aktualizace UEFI (BIOSu) základní desky, takže do procesoru je nutno dostat ji touto cestou. Samotný mikrokód CPU se nedá nahradit permanentně, funguje to tak, že deska ho aktualizuje při naběhnutí PC. Procesory Raptor Lake tedy bude nutné už vždy provozovat v deskách s opravenými BIOSy, jinak jejich (sebe)poškozování bude zase pokračovat.

Intel teď pracuje s výrobci základních desek na tom, aby byly vydány BIOSy zahrnující tuto opravu, zatím ale nevíme, kdy přesně by měly vyjít – podle firmy to může trvat několik týdnů. Pokud máte procesor Core 13. nebo 14. generace, kontrolujte během následujících dejme tomu dvou měsíců, zda výrobce základní desky nevydal aktualizaci BIOSu, a raději ji vždy co nejrychleji instalujte. To, že obsahuje mikrokód 0×12B, asi obvykle bude uvedeno v popisu změn. Aktualizaci BIOSu s opravou budete potřebovat, i pokud máte značkový počítač HP, Acer, Asus, Dell, Lenovo a tak podobně, v tomto případě aktualizaci musí dodat výrobce PC.

Oprava může procesor mírně zpomalit

Intel připouští, že oprava bude mít nějaký negativní dopad na výkon. Firma říká, že dle jejího interního měření bude pokles výkonu obvykle asi jen malý, v rámci běžné variace při testování. To ale neznamená, že CPU nebudou konzistentně pomalejší. Pokud by dopad na výkon nebyl, volil by Intel jinou formulaci (že „se nečeká signifikantní dopad na výkon“). Zde tedy asi je v benchmarcích nějak viditelný.

Změny v řízení napětí nejspíš vyžadují, aby se o něco zpomalilo nabíhání maximálního turbo boostu, které je na dostatečném napětí závislé – změny taktu teď asi budou méně agresivní. Dopady na výkon asi nebudou u dlouho trvajících pravidelných zátěží procesoru (na vyšších modelech i7 a i9), ale mohou se objevovat u krátkých úloh nebo tam, kde se zátěž stále mění a přerušuje. Každopádně toto berte jako nutné zlo, nemá smysl kvůli tomuto zhoršení výkonu aktualizace odmítnout.

bitcoin_skoleni

Next-gen Arrow Lake má být bez problémů

Intel dále opět zopakoval, že problém se týká jen desktopových procesorů Core 13. a 14. generace (Raptor Lake, Raptor Lake Refresh), ale nikoli modelů pro notebooky. A podle firmy také nebude postihovat novou generaci procesorů Core Ultra 200 (Arrow Lake) na platformě LGA 1851, která vyjde příští měsíc.

Zdroj: Intel