Průšvih s nestabilními procesory: Intel hází vinu na výrobce desek – oprávněné, nebo alibismus?

29. 4. 2024

Sdílet

 Autor: Použito se svolením autora: Ľubomír Samák
Intel doporučuje, aby uživatelé v případě problémů nastavili doporučené limity spotřeby a napájení. Problém je, že Intel na jejich překračování léta stavěl a je za to spoluzodpovědný.

Od února se začaly veřejně ventilovat problémy s nestabilními procesory Intel Core 13. a 14. generace (přičemž panují i obavy, zda u nich nedochází k degradaci). Intel dlouho k věci nepodával informace a zdá se, že si s reakcí ještě chce dát chvíli na čas. Nicméně teď poskytl podrobnější předběžné vyjádření, které budí spíš otázky než odpovědi. Všechnu vinu totiž připisuje přetaktování a výrobcům desek, což je poněkud alibismus.

Web Igor’s Lab publikoval vyjádření Intelu, které zřejmě bylo zasláno jako tisková zpráva, ale nenašli jsme ho nikde přímo na webu firmy. Toto vyjádření víceméně ukazuje prstem na různé druhy přetaktování, odemykání limitů spotřeby a napájení, které uživatelé mohou mít zapnuté, jako na možnou či pravděpodobnou příčinu problémů – respektive alespoň příčinu části těchto případů, není řečeno, že všech.

Procesory Intel Raptor Lake jsou nestabilní ve hrách. Vymstilo se honění frekvence až na krev? Přečtěte si také:

Procesory Intel Raptor Lake jsou nestabilní ve hrách. Vymstilo se honění frekvence až na krev?

Problémy se selháváním procesorů Raptor Lake. Intel problém analyzuje, ale zatím mlčí Přečtěte si také:

Problémy se selháváním procesorů Raptor Lake. Intel problém analyzuje, ale zatím mlčí

Intel totiž výslovně uvádí, že zcela prvotní příčina nebyla ještě identifikována a že na jejím analyzování stále pracuje. Nějaké veřejné oznámení či zprávu o aktuálním stavu hledání příčin a řešení má firma naplánováno učinit v květnu (letošního roku). Prohlášení publikované Igor’s Lab je zřejmě jen prozatímní směrnice, která částečně kopíruje doporučení, jaké za cílem omezení problémů vydávají i výrobci PC a vývojáři her, kde se nestabilita projevuje.

Intel uvádí, že část reklamovaných procesorů vykazuje známky zvýšených „minimálních provozních“ napětí a že většina případů je s deskami a procesory schopnými přetaktování a odemykání limitů. A k tomu uvádí, že „zjistil“, že desky s čipsety řady 600 a 700 (tedy ty, na kterých se postižená CPU provozují) často mají výchozí nastavení BIOSu taková, že jsou deaktivované tepelné a napájecí bezpečnostní limity a ochrany, které by normálně měly chránit CPU před příliš dlouhým vystavením vysokému napětí a frekvenci.

Co všechno (odteď) nemáte dělat?

Intel proto teď prý doporučuje, aby na deskách byly takovéto volby vypnuté, respektive aby výrobci desek poskytli uživatelům profil v BIOSu, který bude mít všechny tyto problematické volby deaktivované. To už udělaly například Asus a Gigabyte, patrně za tímto účelem vyjdou aktualizace BIOSů pro všechny relevantní desky, tato část je asi Intelem přímo požadována.

Aktualizace desek Asus řeší nestabilní procesory Intel. Bezpečné nastavení ale pořád není výchozí Přečtěte si také:

Aktualizace desek Asus řeší nestabilní procesory Intel. Bezpečné nastavení ale pořád není výchozí

Není nicméně zmíněno, že by Intel přímo vyžadoval, aby takovýto profil byl výchozí – Intel jen doporučuje uživatelům, aby ho používali jako svá výchozí nastavení. Firma prý také doporučuje výrobcům desek, aby uživatelé byli BIOSem desky varování před možnými důsledky odemykání limitů a přetaktování (o tom, že by toto ony aktualizace BIOSů dělaly, nevíme).

13th and 14th Generation K SKU Processor Instability Issue Update

Intel® has observed that this issue may be related to out of specification operating conditions resulting in sustained high voltage and frequency during periods of elevated heat.
Analysis of affected processors shows some parts experience shifts in minimum operating voltages which may be related to operation outside of Intel® specified operating conditions.

  • While the root cause has not yet been identified, Intel® has observed the majority of reports of this issue are from users with unlocked/overclock capable motherboards.
  • Intel® has observed 600/700 Series chipset boards often set BIOS defaults to disable thermal and power delivery safeguards designed to limit processor exposure to sustained periods of high voltage and frequency, for example:
     – Disabling Current Excursion Protection (CEP)
     – Enabling the IccMax Unlimited bit
     – Disabling Thermal Velocity Boost (TVB) and/or Enhanced Thermal Velocity Boost (eTVB)
     – Additional settings which may increase the risk of system instability:
     – Disabling C-states
     – Using Windows Ultimate Performance mode
     – Increasing PL1 and PL2 beyond Intel® recommended limits

Intel® requests system and motherboard manufacturers to provide end users with a default BIOS profile that matches Intel® recommended settings.

  • Intel® strongly recommends customer’s default BIOS settings should ensure operation within Intel’s recommended settings.
  • In addition, Intel® strongly recommends motherboard manufacturers to implement warnings for end users alerting them to any unlocked or overclocking feature usage.

Intel® is continuing to actively investigate this issue to determine the root cause and will provide additional updates as relevant information becomes available.

Intel® will be publishing a public statement regarding issue status and Intel® recommended BIOS setting recommendations targeted for May 2024.

Mezi problematickými volbami je zmiňována deaktivace ochrany před překročením limitů proudu (CEP), nastavení limitu proudu (IccMax) na „unlimited“, deaktivování teplotního limitu pro Thermal Velocity Boost (ten má být aktivní jen do 70 °C, ale desky ho místo toho běžně používají za všech teplot), zvýšení limitů spotřeby PL1 a PL2 a také deaktivování úsporných C-stavů.

Část těchto věcí je ale vyloženě pofidérní. Například o tom, že by procesor neměl být dlouho vystaven „vysoké frekvenci“ (jak Intel píše), doteď nikde nebylo slyšet a výchozí nastavení procesorů Alder Lake a Raptor Lake 125W třídy sice má 56sekundovou lhůtu tau, po níž se procesor má přepnout z limitu spotřeby PL2 na PL1, ale Intel doporučuje nastavit oba limity na 253 W, takže efektivně tau vůbec používáno není.

Ještě bizarnější je, že Intel uvádí jako možný faktor nestability schéma napájení Ultimate Performance ve Windows (v české verzi schéma napájení označené „Špičkový výkon“). Ten ale nedělá nic jiného, než že používá zcela běžné řízení frekvencí procesoru, které hardware dává operačnímu systému k dispozici. Pokud jen to může vést k nestabilitě, pak je jednoduše chování procesoru vadné a jde o chybu hardwaru či jeho řídicího firmwaru, za kterou je plně odpovědný Intel. Šlo by o nestabilitu CPU bez jakékoli omluvy, kterou sice použití jiného schématu napájení může schovat, ale to neznamená, že Intel nemá problém.

Opravdu Intel nevěděl, co se děje?

Celkově tato doporučení lze interpretovat tak, že Intel v podstatě hodil všechnu vinu na výrobce základních desek, kteří tyto limity na deskách povypínali a udělali z tohoto nastavení výchozí režim, takže uživatel po sestavení počítače místo „stock“ konfigurace v tradičním smyslu má přetaktovaný systém.

Socket LGA 1700

Socket LGA 1700

Autor: Ľubomír Samák

Jenže takto to na platformě Intel funguje už léta a je absurdní, že by to Intel „pozoroval“ až teď. Je prakticky jisté, že o tomto firma dobře věděla celou dobu, takže to, že najednou doporučuje uživatelům, aby si na toto dávali pozor, působí dost licoměrně. Je vysoce pravděpodobné, že Intel doteď výrobce desek, ať už aktivně, nebo mezi řádky, přímo vybízel k tomu, aby měli procesory ve výchozím stavu nastavené takto, tedy přesně k tomu, co jim nyní klade za vinu.

Intel totiž sice všechny limity a ochrany, o kterých je zde řeč, označuje za doporučené, ale jen to. Nejsou povinné a jejich překračování a porušování po léta nijak nepostihoval (a ani v případech, kdy toto deska dělá ve výchozím nastavení).

Za tohoto stavu jsou výrobci desek motivování, či spíše rovnou nuceni je porušovat, aby procesory na jejich deskách měly vyšší výkon, protože když to neudělají oni, udělá to konkurence a předběhne je v benchmarcích. Intel nastavil podmínky tak, že prakticky nevyhnutelně muselo dojít k tomu, co nyní kritizuje. Ale současně tvrdí, že se to děje proti jeho doporučením a záměru.

Cui bono

Je dobré zde zmínit jednu věc. Výsledky výkonu v recenzích dotyčných procesorů jsou ve většině případů provedené na deskách, které tímto stylem odemykají limity procesorů Intel. Je spíš výjimka, aby recenzenti aktivně měnili nastavení desek proti výchozím volbám mimo nastavení profilů XMP u pamětí (které to vyžadují pro své specifikace). I když to recenzenti udělají, nemusí ani vědět, co všechno je třeba změnit, protože nejde jen o limity wattů a ampérů, jak ukázal pohled na „Intel Baseline Profile“ u desek Asus.

V recenzích na tomto odemykání často asi závisí vítězství Intelu v různých testech – mnohovláknových aplikacích, jako jsou Cinebench R23, Blender, ale dost možná už i her. To znamená, že Intel z porušování limitů přímo benefituje – v recenzích jeho CPU vypadají lépe a to musí pomáhat prodejům. Na tyto výsledky se kupující dívali, když se pro procesor Intel rozhodovali, takže pokud jim nyní firma říká „sorry, ale ten výkon vlastně mít nemáte, to vás výrobci desek oblafli“, přijde to mě osobně jako docela velký problém. Je překvapivé, že se zatím neobjevila na toto témě nějaká hromadná žaloba v USA, protože už byly vedeny proti mnohem méně jasným prohřeškům.

Osobně si myslím, že Intel rozhodně byl rád za to, že výkon jeho procesorů byl v recenzích tímto „problémem“ zkreslený výrazně směrem nahoru, firma rozhodně doteď nebyla nikde vidět s varováním, že tyto recenze nejsou reprezentativní pro výkon, který procesory mají skutečně mít na „doporučených specifikacích“.

A není to tak, že by to Intel nemohl udělat jinak, nebo že by neměl moc udělat pořádek. Stačí se totiž podívat do historie a vidíme, že když Intelu vadilo něco, co výrobci desek s jeho procesory dělali, neváhal jim to zakázat. Případem budiž hned několik případů, kdy výrobci desek odemkli přetaktování na zamčených procesorech bez odemčeného násobiče. Intel tuto praktiku důsledně blokoval v aktualizacích mikrokódu (které pak museli výrobci eventuálně začlenit do aktualizací BIOSu, případně už byly v procesorech z výroby). Podobně Intel zarazil aktivování instrukcí AVX-512 na procesorech Alder Lake.

Lze sice říci, že v tomto případě Intel nemůže použít stejné tvrdé metody, protože tím by zablokoval kompletně i volitelné přetaktování, které by si uživatelé chtěli udělat s plným vědomím rizik (což nikdo nežádá a ani nechce), jenže toto také neobstojí, když si to srovnáte se stavem desek pro procesory AMD jak za platformy AM4, tak nyní na AM5.

Tam AMD stanovuje, že ve výchozím stavu deska nebude žádné přetaktování a odemykání výchozích či doporučených limitů provádět, a je to skutečně dodržováno. AMD je přitom mnohem menší a méně mocná firma, takže je prakticky jisté, že kdyby to Intel chtěl zařídit stejně, rozhodně by se mu to podařilo. Tvrdé zablokování v hardwaru zjevně není třeba, vše se dá s výrobci desek dohodnout.

Problém: Uživatel kupoval výkon, který teď mít nebude

Je jasné, že zde došlo k selhání na straně Intelu, který při vydání procesorů Core 13. a 14. generace u desek toleroval tak agresivní odemykání limitů spotřeby (a dalších), že to docela často vede k nestabilitě procesorů. Asi je možné, že management firmy tlačil na co nejvyšší výkon a to, že tyto praktiky v minulosti několik let procházely, otupilo opatrnost nebo moc inženýrů manažerům oponovat.

Podstatný detail je, že rozhodnutí Intelu vedla k tomu, že v testech procesorů byl prezentován výkon dosažený za překročených limitů – nepřímo byl tedy slibován vyšší výkon, než jaký budete mít, když se nyní budete řídit doporučeními Intelu (a pokud máte CPU nestabilní, tak v podstatě musíte). Zde se asi bude namítat, že Intel není přímo odpovědný za to, co ukazují nezávislé recenze, že jde o problém desek, ale opět – Intel při vydání procesorů mlčel a proti těmto recenzím nic nenamítal.

Core i9–13900K

Autor: Ľubomír Samák

Způsobil laxní přístup k limitům degradaci CPU?

Ještě větší průšvih ale Intel může mít, pokud se zjistí, že problém není jenom v tom, že s doporučenými limity budou mít najednou procesory horší výkon. Pokud se potvrdí, že provoz CPU s těmito potichu tolerovanými odemčenými limity vedl k jejich postupnému poškození („degradaci“), může to skončit až tak, že tyto procesory Intel bude muset přijímat zpět k reklamaci a vyměňovat (případně vracet peníze).

Že u procesorů dochází k degradaci, není zatím potvrzeno, ale někteří uživatelé hlásí, že jim ze začátku vše fungovalo a chyby začali pozorovat po pár měsících. Je možné, že pro tato CPU už je pozdě a jen vrácení limitů na doporučené hodnoty je už stabilními nemusí učinit, nebo se poškození později stejně někde projeví.

Pokud se tento problém potvrdí, je za něj nejspíš opět zodpovědný Intel, protože roky nechal výrobce desek postupovat tímto způsobem kvůli zvednutí výkonu. Buď inženýři špatně odhadli, co všechno křemík snese, nebo Intel a výrobci desek poté, co se praktika osvědčila a chvíli fungovala, postupně víc a víc tlačili na pilu a ztratili opatrnost, až limity posunuli tak daleko, že pohár přetekl, a už vedou k relativně častému selhávání procesorů v rukou uživatelů.

Víc informací v květnu

Uvidíme, co Intel k věci řekne v květnu a zda zůstane při tom, že je problém čistě jenom v přetaktování a k degradaci nedochází. Jak už bylo řečeno, Intel zatím říká, že ještě nemá konečnou příčinu celého problému definitivně izolovanou, a to, co jsme zde probírali, je tedy jen předběžné vyjádření a doporučení na dobu, než bude známo více.

bitcoin školení listopad 24

Nicméně i pokud by vše skončilo tím, že se budou masivně znovu zapínat doporučené a doteď ignorované limity na deskách, nemusí to být pro Intel konec problémů. Propady výkonu, které to způsobí, mohou mít následky – nespokojenost uživatelů, ale teoreticky třeba i ty zmíněné hromadné žaloby v USA. Asi bude namístě přihlédnout při hodnocení i k tomu, jak moc výkonu se ztratí. Ale je fakt, že celá tato věc je způsobená tím, že Intel přistupoval ke specifikacím procesorů laxně a neopatrně.

Zdroj: Igor’s Lab