Intel našel defekt procesorů Raptor Lake, chystá opravu. Jsou k tomu ale dvě špatné zprávy

24. 7. 2024

Sdílet

Balení procesoru Intel Core i9-14900KS Autor: Intel
Balení procesoru Intel Core i9-14900KS
Oficiální prohlášení Intelu bohužel potvrdilo, že procesory Core 13. a 14. generace podléhají degradaci – a reakce Intelu je dost vyhýbavá, takže problémům nemusí ještě být definitivní konec.

Krátce poté, co se Intel oficiálně vyjádřil ke zprávám, že vadami či nestabilitou procesorů Raptor Lake jsou postižené i procesory v noteboocích (což podle firmy není pravda), konečně přichází také s novými informacemi k hlavnímu problému. Totiž k široce hlášeným problémům procesorů Core 13. a 14. generace pro desktop, které jsou nestabilní ve hrách, a co hůř, vykazují symptomy postupného selhávání (degradace). To je zřejmě skutečností.

Hlasy hlásící nebo probírající problémy procesorů, které se dostaly do širšího povědomí zhruba okolo letošního února, v posledních dnech hodně zesílily, zejména když se k tomu začali vyjadřovat populární youtubeři. A je třeba dodat, že problémy potvrdilo hodně firem vyvíjejících hry, ale nepřímo třeba i Nvidia, která na Intel ukázala (protože nestabilita CPU často končila chybou zdánlivě implikující ovladače GPU).

Intel dlouho k problému mnoho neříkal a pouze potvrdil, že o problémech ví. Firma ovšem s výrobci desek vyvinula aktualizace BIOSů, které zavedou tu novinku, že ve výchozím stavu budou procesory mít doporučená nastavení, jako jsou limity spotřeby – což doteď nebyla pravda a prakticky všechny desky nastavovaly vyšší limity (aniž by to do té doby Intelu vadilo).

Procesory Intel Raptor Lake jsou nestabilní ve hrách. Vymstilo se honění frekvence až na krev? Přečtěte si také:

Procesory Intel Raptor Lake jsou nestabilní ve hrách. Vymstilo se honění frekvence až na krev?

Problémy se selháváním procesorů Raptor Lake. Intel problém analyzuje, ale zatím mlčí Přečtěte si také:

Problémy se selháváním procesorů Raptor Lake. Intel problém analyzuje, ale zatím mlčí

Obrat v kauze nestabilních procesorů Intel: Hrozící ztráty výkonu s Intel Default Settings vyjasněné? Přečtěte si také:

Obrat v kauze nestabilních procesorů Intel: Hrozící ztráty výkonu s Intel Default Settings vyjasněné?

Intel stále nenašel řešení nestabilních procesorů Raptor Lake. Mají chybu v TVB, ale příčina je jinde Přečtěte si také:

Intel stále nenašel řešení nestabilních procesorů Raptor Lake. Mají chybu v TVB, ale příčina je jinde

Problém vadných procesorů Intel Core 13. a 14. generace je horší a častější, než se myslelo. A stále nevyřešený Přečtěte si také:

Problém vadných procesorů Intel Core 13. a 14. generace je horší a častější, než se myslelo. A stále nevyřešený

Poté Intel v červnu oficiálně potvrdil informace, že nalezl problém ve fungování Thermal Velocity Boostu, který mohl k problémů přispívat (tento problém bude opraven aktualizací mikrokódu), ale podstatné bylo, že nešlo o hlavní příčinu.

Potřetí Intel vydal prohlášení minulý týden, kdy řekl, že podle toho, co firma o problému ví, se týká jen desktopových procesorů, ale notebookové čipy nepostihuje. Tím reagoval na zprávy, které právě mluvily o problémech pozorovaných údajně i na mobilních CPU.

Týká se kauza vadných procesorů Intel i notebooků? Firma ujišťuje, že problém mají jen desktopové čipy Přečtěte si také:

Týká se kauza vadných procesorů Intel i notebooků? Firma ujišťuje, že problém mají jen desktopové čipy

Nová reakce: Finální řešení, nebo budou problémy pokračovat?

Intel teď vydal prohlášení, ve kterém oznamuje nalezení problému, kvůli kterému procesory byly vystaveny vyššímu napětí, než jaké do nich z napájecí kaskády mělo být pouštěno, přičemž opravením tohoto problému má být řešena nestabilita procesoru.

Nicméně rychle se vynořily pochybnosti, že nemusí jít o kompletní řešení. Formulace prohlášení je totiž taková, že hovoří o řešení nějakých problémů s chybným napětím, ale nikde závazně neříká, že zrovna tyto chyby jsou úplně prvotní a hlavní zdroj problémů, které se posledního půl roku řeší. Podobně jako zmíněná oprava Thermal Velocity Boostu může jít o další dílčí faktor, ale ne nutně poslední.

Tudíž zatím lze říci, že touto opravou by se měla situace pro uživatele, kteří mají to štěstí, že si jeden z procesorů Core 13. a 14. generace pořídili, určitě zlepšit. Ale nemusí to být úplný konec problémů a tuto kauzu ještě budeme muset sledovat dále. Budeme rádi, pokud se v tomto mýlíme, snad se v následujících dnech dočkáme ještě nějakých doplňujících informací a vyjasnění.

Formulace Intelu působí dost vyhýbavě a záměrně vágně, ale je klidně možné, že Intel skutečně doufá, že má skutečně řešení, které problém úspěšně definitivně opraví – jenže opatrnost mu zatím velí ještě to výslovně neslibovat, dokud tato oprava nebude masově nasazena a bude vidět i v masovém měřítku, že opravdu problémy všude eliminuje. Oprava je, zdá se, stále ještě ve fázi aktivního testování.

Co přesně Intel uvádí, můžete vidět zde (překlad je náš lidský, nikoliv vyrobený generativní AI):

Na základě rozsáhlého analyzování desktopových procesorů Core 13. a 14. generace, které nám byly vráceny kvůli problémům s nestabilitou, jsme zjistili, že v některých procesorech Core 13. a 14. generace pro desktop působilo zvýšené napětí, které způsobovalo nestabilitu. Naše zkoumání vrácených procesorů potvrzuje, že zmíněné zvýšené napětí bylo způsobené algoritmem v mikrokódu procesoru, který vedl k tomu, že procesor při řízení VRM nastavoval vyšší napětí, než měl.

[Poznámka Cnews: Procesor typicky sděluje napájecím obvodům desky zpětnou vazbou, jak vysoké napětí mu mají dodávat; toto znamená, že zde abnormální napětí nebylo způsobeno deskami, ale chybnými požadavky z CPU.]

Intel vydá opravu mikrokódu, která řeší základní příčinu způsobující to, že procesory byly zvýšeným napětím vystavovány. Pokračujeme v ověřování, abychom zajistili, že scénáře nestability, které byly na procesorech Core 13. a 14. generace pro desktop hlášené, jsou vyřešeny. Intel momentálně plánuje, že tato oprava bude partnerům dodána v polovině srpna (augusta) poté, co projde kompletním ověřením.

Intel je připraven situaci pro své zákazníky napravit a nadále vyzýváme všechny, kteří momentálně problémům s nestabilitou desktopových procesorů Core 13. a 14. generace čelí, aby se obrátili o pomoc na zákaznickou podporu Intelu.

Oprava bude v polovině srpna

Bohužel se tedy dozvídáme, že oprava bude k dispozici nejdříve za tři týdny, což je nepříjemné. Dodání opravy partnerům znamená, že mikrokód dostanou výrobci základních desek, kteří jej potom budou muset zapracovat do BIOSů pro jednotlivé modely desek a ty vydat. To může v praxi přidat další dny až týdny k datu, kdy se oprava pro vaši konkrétní základní desku objeví, i když je možné, že v tomto případě se budou výrobci desek snažit být co nejrychlejší.

Je trochu otázka, co dělat do té doby, když víte, že se u vašeho počítače procesor potenciálně sebepoškozuje, ale zamezit mu v tom půjde až za měsíc. Řešením je asi snížit ručně napětí (podvoltovat) a ideálně asi také procesor podtaktovat, aby se zachovala stabilita (na maximum 5,0–5,3 GHz, jak se občas doporučovalo). Není ovšem jasné, jak přesně ono chybné nastavování napětí působí. Je možné, že chyba nevede k nějakému pevnému offsetu, a ručním snížením napětí si tedy nepomůžete.

Nicméně to, že nižší modely procesorů s konzervativnějšími takty mají problémy méně často (u 125W Core i5 ale zřejmě i tak nastaly), by mohlo indikovat, že podvoltování může mít přínos. Rozhodně byste jím neměli nic zkazit, takže ho vlastníkům procesorů Core 13. a 14. generace pro desktop doporučujeme dočasně aplikovat.

Intel Core i9-13900K

Intel Core i9–13900K. Jeden z nejvíce postižených modelů

Autor: Ľubomír Samák

Degradace se potvrdila, množství procesorů je asi fyzicky poškozených

Je tu ještě druhá špatná zpráva. Asi si ptáte, jak může zvýšené napětí vést k nestabilitě procesoru, když zvyšováním napětí se naopak stabilita posiluje a přidává se rezerva navíc (ale na úkor spotřeby). Odpověď je podle všeho taková, že toto vystavování vyššímu napětí procesory poškozovalo (a zatím dál poškozuje). Nad určitou úroveň napětí, která závisí na různých faktorech, a nelze tak říci nějaké přesné číslo, dochází totiž k fyzickému poškození křemíkových obvodů.

V tomto případě je proces takový, že uživatelem pozorovaná nestabilita přichází zřejmě až po určité době a není projevem onoho abnormálně zvýšeného napětí, ale projevem toho, že už došlo k poškození procesoru v takové míře, že nadále není schopný stabilního fungování. Přinejmenším ne na výchozích frekvencích, teoreticky se ale ještě může povést ho přimět ke stabilnímu fungování snížením frekvencí, čímž se získá rezerva navíc (otázka ale je, zda je to pak opravdu stabilní, nebo jenom nejste schopní čip tak důkladně otestovat, abyste na jeho potenciálně chybové chování narazili).

Tato informace od Intelu jinými slovy znamená, že problém degradace, který byl od počátku podezříván jako možný mechanismus za pozorovanými problémy, je bohužel reálný. A také to znamená, že procesory, u kterých se objevila nestabilita, jsou fyzicky poškozené. Toto poškození je bohužel nevratné. Intel dokonce i webu Tom's Hardware výslovně potvrdil, že již degradovaným exemplářům oprava nijak nepomůže. A i procesory, které třeba ještě nyní nestabilitou netrpí, také v některých případech mohou být už hodně blízko a nějaké přirozené stárnutí, náhodný výkyv v napájení, stárnutí kondenzátorů na desce měnící parametry VRM nebo uživatelský pokus o přetaktování je teoreticky také mohou v budoucnu dostat za hranu.

Intel neříká, že bude procesory nějak plošně stahovat z trhu nebo spouštět nějaký speciální výměnný program, věc tedy bude řešena přes tradiční reklamační mechanismy. Intel nicméně zákazníky vyzývá, aby je v případě problémů využili.

Co zprávy o problému s oxidací při výrobě?

Současně s tímto vyjádřením na komunitních stránkách Intelu byl publikován stejný text také na Redditu, kde však byly zástupcem firmy, který má komunikaci na subredditu r/intel na starosti, přidány další zajímavé informace. Zejména se tento post vyjadřuje ke zprávám, že za selhávání procesorů Intel je zodpovědná chyba při samotné výrobě křemíku, kdy údajně mělo dojít ke kontaminaci vrstev vodičů či přesněji propojení mezi nimi (via) sloučeninami způsobujícími oxidaci a tím zhoršení parametrů vodičů v čipu.

Tuto informaci publikoval youtubový kanál GamersNexus, který ji mohl dostat jako tip od určitých insiderů nebo partnerů Intelu. Zdá se, že toto není skutečná příčina problémů, ač je na informaci zrnko pravdy. Intel na Redditu potvrdil, že k incidentu s oxidací v jeho továrnách při výrobě došlo u raných sérií procesorů Core 13. generace pro desktop, zejména asi hlavně těch vyrobených v roce 2022, ale nepůjde asi o všechny. Podle Intelu byly procesy zlepšené během roku 2023 a tyto problémy eliminovaly.

Podle Intelu ale tento problém firma jako možnou příčinu také analyzovala, ale vyloučila, že by oxidace byla za aktuální problémy zodpovědná jako jejich ústřední příčina – problém s oxidací při výrobě byl údajně odhalen jen u malého počtu analyzovaných nestabilních procesorů.

Snímek čipu Intel Raptor Lake s 8 jádry P-Core a 16 jádry E-Core

Snímek čipu Intel Raptor Lake s 8 jádry P-Core a 16 jádry E-Core

Autor: Intel

Jednak to pravděpodobně může být tak, že oxidací postižené wafery byly již tehdy identifikovány a procesory z nich vyrobené možná často nebyly schopné projít validací, takže se ani nemusely dostat do prodeje ve velkém počtu. Zejména by toto ale asi nevysvětlovalo problémy u novějších procesorů Core 14. generace, které vyšly až na konci roku 2023.

A problém tohoto druhu by se asi nemusel projevovat nejvíce na čipech používajících vysoké napětí a frekvence a nejméně na těch s nižšími takty. Tato distribuce selhání je naopak konzistentní s oním problémem zvýšeného napětí, který teď Intel přiznal. Rychlejší procesory používají vyšší napětí, takže pokud chyba v algoritmech napětí ještě zvýší, snáze se dostanou za hranu než pomalejší procesor s nízkým napětím, u kterého by „přepal“ musel být výrazně větší.

Je ale možné, že problém oxidovaných exemplářů procesorů není tak malý, jak ho Intel prezentuje. Může ovšem jít o nesouvisející průšvih.

Je už bezpečné procesory Intel kupovat?

Toto je komplikovaná otázka. Přinejmenším bychom raději radili počkat, až bude opravdu k mání BIOS pro vaši desku, který bude mít integrovanou aktualizaci mikrokódu řešící onu chybu způsobující nebezpečné napětí. Ideálně byste asi měli použít funkci BIOS flashback a nahrát aktualizaci z USB disku ještě bez nainstalovaného procesoru, abyste ho uchránili před potenciálním škodlivým vlivem, který by mohl mít starý mikrokód.

Nadále ale asi platí, že ne všechny procesory Core 13. a 14. generace pro desktop jsou stejně náchylné k problémům. Největší problémy jsou s těmi s vysokými takty, nejvíce jsou hlášené problémy u Core i9–13900K a i9–14900K a následují Core i7–13700K a i7–14700K. Problémy ale mohou mít i 65W Core i7 a i9 a 125W modely Core i5–13600K a Core i5–14600K. Nově pořízené procesory by snad měly být v pořádku poté, co budete mít desku s opraveným mikrokódem, ale vyvarujte se nákupu bazarových procesorů. Ty mohou mít v sobě klidně velkou míru nashromážděného poškození a nemáte šanci tušit, jak poškozené CPU kupujete. Předchozí majitel je například může prodávat proto, že narazil na první známku nestability.

Naopak 65W modely Core i5 13. a 14. generace jsou asi celkem bezpečné. Pokud u nich k příliš vysokým napětím vůbec dochází, asi je to v malé míře a není asi velké riziko, že vám časem selžou. Aktualizaci ale raději nainstalujte, až bude k dispozici. Starší procesory Core 12. generace by měly být zřejmě celkově bezpečné. Ovšem řešením této situace, které se samo nabízí, je také zvolit raději procesor AMD…

Důvěra značně narušená

Toto vše ale platí za předpokladu, že po této opravě bude Intel skutečně celý problém mít podchycený a jeho příčiny eliminované. Jak už bylo řečeno, toto ještě není jisté a vyjádření Intelu nevylučuje, že budou přetrvávat další problémy vedoucí k nestabilitě a degradaci. Je možné, že problém bude zmírněn, ale v určité, třeba menší míře přetrvá.

To, že Intelu trvalo pět měsíců od chvíle, kdy byl problém široce rozmáznut v médiích, aby našel a publikoval příčinu (pokud tedy jde o opravdu hlavní příčinu) a bude trvat půl roku, než bude dostupná její oprava, ale nepůsobí dobrým dojmem. Určitá skepse a obava z toho, zda má Intel dobře zvládnuté procesy ověřování a testování svých procesorů, jejich architektury a fyzických výrobních procesů, je teď pochopitelná. Po tomto problému tak asi mohou přetrvávat pochybnosti, zda jsou procesory Raptor Lake dostatečně ověřené v dalších ohledech – včetně toho, zda se v nich nemohou skrývat další faktory vedoucí k postupné degradaci a budoucím problémům než ten teď objevený a řešený. Další vzácnější faktory způsobující degradaci by se totiž mohly ukázat až tehdy, když nynější oprava odfiltruje část případů…

Může se snížit výkon?

Je asi také teoreticky možné, že opravy mikrokódu a opravy řešící problémy s abnormálně zvýšeným napětím povedou k určitému (snad jen drobnému) snížení výkonu v některých situacích. Zejména by se to nejspíš týkalo jednovláknového výkonu při maximálním 1T boostu.

bitcoin_skoleni

To je opět něco na zvážení. Ale zda ke zhoršení výkonu dochází, to se také bohužel dozvíme, asi až když budou opravy dostupné, tedy až za měsíc. Webu Tom's Hardware Intel údajně sdělil, že se dopad na výkon neočekává, ale testování stále probíhá, takže toto asi ještě není jisté.

Zdroje: Intel, Intel (Reddit), HardwareLuxx, Tom's Hardware