Loni jsme tu měli v určitém smyslu i úsměvnou zprávu o tom, že SSD v serverech HP vyžadují kritickou aktualizaci firmwaru, protože kvůli chybě ve firmwaru (pravděpodobně způsobené přetečením proměnné s příliš malým rozsahem) by se po pevně dané době provozu jak se říká „brickly“ – zkolabovaly bez možnosti přečíst z nich data nebo je obnovit do provozuschopného stavu. Tento případ možná vedl ke kontrole kódu u dalších zařízení, protože nyní byla chyba s predeterminovanou smrtí objevena u dalších SSD. A nutnost aktualizovat firmwary, dokud je čas, je tu opět.
Problém je velmi podobný tomu předchozímu, týká se SSD v serverech, přičemž postižené jsou tentokrát opět servery HPE, ale nyní rovněž Dellu. Nejde ovšem přímo o chybu těchto firem, ale o zásluhu dodavatele SSD, kterým je v tomto případě SanDisk (patřící už pár let pod WD). Přímo výrobce disků také chybu ve firmwarech objevil a nahlásil. Teoreticky je asi možné, že úložiště se stejnou chybou firmwaru mohou být v provozu i jinde.
SSD kvůli tomuto problému odejdou po předem daném časovém úseku provozu, který by zde měl být 40 000 hodin. Zatím by údajně všechny dodané disky měly být této době vzdálené, ale je třeba, aby uživatelé včas (takže nejlépe co nejdříve) na všech systémech s těmito disky provedli update firmwaru v SSD. Pokud je totiž necháte dojít k selhání, tak je už nebude možné oživit a uživatel přijde o data (toto je výslovně uvedeno). Protože pole RAID typicky budou tvořená stejně starými a stejnou dobu běžícími jednotkami jednoho typu, nezachrání data ani redundantní pole. Než bude moci administrátor po odmlčení prvního exempláře zasáhnout a obsah pole rychle zazálohovat, všichni členi pole odejdou do křemíkového nebe.
Postižené systémy a SSD
U HPE je problém opraven ve firmwaru s označením HPD7; firma uvádí, že první SSD by v případě nepřetržitého provozu zřejmě měla selhávat od října 2020 – ale jak už bylo řečeno, uživatelé by nic neměli nechávat náhodě a raději opravu provést v nejbližším příhodném termínu. Postižená SSD můžete vidět v tabulce níže – mělo by jít o SAS disky, takže pravděpodobně nehrozí, že byste je měli v běžném počítači. Objevovat by se měly například v serverech či úložištích HPE ProLiant, Synergy, Apollo 4200, D3000, StoreEasy 1000. Podrobnější bulletin k této chybě se nachází zde.
U Dellu by opět měly být postižené servery PowerEdge a úložiště Dell Storage. Problematické disky mají v těchto produktech označení SanDisk Kilimanjaro a jde také o 2,5palcové SSD disky s 12Gb/s rozhraním SAS. Bližší informace a opravné firmwary, které mají označení verze D417 jsou zde. Tabulka modelů je zde:
Doufejme, že průšvih bude varováním
Nezbývá než doufat, že podobné chyby jsou vzácné. Pokud by se nacházely i v obyčejnějších SSD pro běžná PC, mohlo by to být dost nepříjemné, protože těm se obvykle nedostává tak úzkostlivé a déletrvající podpory jako enterprise hardwaru. Doba provozu 40 000 hodin odpovídá více než čtyři a půl rokům, takže v případě spotřebitelských SSD s tří až pětiletou zárukou by smrt zařízení nastala většinou po jejím konci. Zvlášť pokud máte SSD nějaké malé značky, asi by bylo značné riziko, že se aktualizace firmwaru nedočkáte. Medializace těchto bugů u SAS disků SanDisku ale snad povede k tomu, že si vývojáři budou odteď dávat na takovéto školácké chyby pozor.
Zdroj: ComputerBase.de