Intel má opět problém s degradujícími čipy. Atomy C2000 odcházejí Ciscu i dalším výrobcům

9. 2. 2017

Sdílet

 Autor: Intel

Intel asi v letošním roce čeká utužení konkurence, které budou čelit jeho CPU, jež to doposud proti AMD měla snadné. Zdá se ale, že Intel bude mít ještě jednu starost. Zřejmě ho čeká stahování některých procesorů z trhu kvůli závažnému hardwarovému problému. Jde do určité míry o podobnou šlamastyku, jaká se stala v roce 2011 s pomalu degradujícími čipsety pro procesory Sandy Bridge, jen to teď zřejmě bude menšího rozsahu.

Možná si vzpomínáte, že jsme minulý měsíc při probírání hospodářských výsledků Intelu zmínili, že firmě koncem roku klesl zisk kvůli „vyšším nákladům spojeným se zárukami“. Ukazuje se, že za touto formulací je hardwarová chyba odhalená v 22nm procesorech Intel Atom řady C2000 pro servery síťovou infrastrukturu (označovaných také „Avoton“ a „Rangeley“). Ty zřejmě trpí syndromem úmrtí po určité době používání. Intel tak byl nucen vyhradit určitý rozpočet na plnění záručních výměn a případně stahování těchto čipů z trhu a tyto peníze stály za nižší marží v Q4 2016.

Rozsah problému se začal vyjasňovat tento měsíc. Firma Cisco, která osmijádrové Atomy Avoton používá v některých síťových prvcích, vydala varování, že některé produkty prodávané do 16. listopadu 2016 obsahují „vadný komponent takt generující“ který po 18 měsících provozu vykazuje zvýšenou poruchovost. Chyba odpovídající těmto rysům byla minulý měsíc uvedena v dokumentaci pro Atomy C2000 (viz erratum s označením AVR54).

Pomalá degenerace křemíku

Zdá se, že na čipech po nějaké době může přestat fungovat výstup hodinového signálu na sběrnici LPC. Zřejmě jde o nějakou formu permanentní degradace samotného čipu. Po jejím projevení systém s procesorem (který je napevno napájený na základní desce) nenaběhne a je jak se říká „po něm“, neboť fungování je na generovaném taktu závislé. Bezprostřední příčinou selhání je, že systém se nedostane k paměti ROM s firmwarem, která je ke sběrnici LPC připojená.

Ze začátku se Cisco nemělo k tomu, přímo Intel v této souvislosti jmenovat, nicméně nyní je již vše v podstatě potvrzeno. Chybu hlásí například i Synology (odcházet by kvůli ní měly například NAS servery DS1815+). Problém má být s procesory Atom C2308, C2338, C2350, C2358, C2508, C2518, C2530, C2538, C2550, C2558, C2718, C2730, C2738, C2750C2758, pokud mají verzi čipu (stepping) B0. Softwarové řešení bohužel asi neexistuje, problém se dá obejít jen přepracováním desek, na kterých jsou čipy osazené. Intel by měl také začít vyrábět nový Stepping Avotonu, který už tímto problémem trpět nebude.

Procesor Intel Atom řady C2000 (Avoton)

Patrně dojde na stahování a výměnu desek a zařízení

Chyba by zřejmě měla postihovat všechny Avotony a výrazně zvyšuje rychlost degradace zodpovědného kousku čipu. U zařízení s těmito procesory lze tedy asi čekat zvýšenou poruchovost o „úmrtnost“ s tímto syndromem, podle Cisca zejména po uplynutí třetího roku provozu. Jak se k závadě postaví jednotliví výrobci desek či routerů, NAS a podobných zařízení, teprve uvidíme. Ideální by ale bylo všechny tyto produkty preventivně svolat do servisu k výměně desek nebo jejich opravě, pokud je možná. Vyměňovat hardware má například už zmíněné Cisco, ovšem jen pokud je v záruce nebo krytý nějakou smluvní podporou. Postoje některých výrobců zařízení s postiženými čipy shrnul dohromady web ServeTheHome.

ICTS24

Jaké přesně povahy je řešení, které má problém Avotonu B0 obcházet na úrovni základní desky, není známo. Teoreticky by mohlo jít i o nějakou úpravu, proveditelnou dodatečně na již vyrobených a používaných deskách, i když pravděpodobnější asi bude, že bude vyžadovat nové PCB. Tam, kde již čip selhal a přestal generovat takt, ale asi bude nutné CPU vyměnit. To u BGA procesorů s velkým počtem kontaktů ale není nic snadného.

Deska ASRock C2750D4I, nesoucí procesor Avoton Deska ASRock C2750D4I, nesoucí procesor Avoton

Zda bude Intel různým partnerům, kteří s Avotony vyráběli servery, NAS, síťové či komunikační prvky, vyplácet nějaké kompenzace, není známo. Zdá se, že firmy nechtějí k situaci nic sdělovat, takže je možné, že vše je pod informačním embargem. Nicméně pro Intel celá věc bude kromě finančního dopadu, který už se i odrazil v účetnictví, stát Intel něco také na pošramocené reputaci. Možná že v době, kdy si na jeho datacentrový byznys brousí zuby několik výrobců čipů ARM (včetně třeba Qualcommu), IBM a ještě AMD s deriváty architektury Zen, bude poškozené renomé bolet nejvíc.