Magnetické pevné disky jsou mechanicky poměrně delikátní zařízení a všichni z vás asi vědí, že u nich existují rizika ztráty dat buď vinou „pokažení“ jednotlivých sektorů, nebo katastrofickým celkovým selháním (pro pořádek ale třeba říci, že toto riziko je i u SSD, byť z jiných příčin). Poruchovost jednotlivých značek a modelů je ovšem možné vyvozovat až z velké statistiky. Takové údaje veřejnosti v posledních letech poskytuje společnost Backblaze, která provozuje poměrně velká množství různých spotřebitelských HDD ve svých serverech a vede si záznamy. Kvůli tomuto způsobu použití sice nemusí být údaje stoprocentně platné i pro domácí uživatele, alespoň nějakou představu ale dávají. Backblaze nyní svou zprávu aktualizovala, takže máme o úmrtnosti desktopových pevných disků čerstvé zprávy.
V poruchovosti nastávající v
provozních podmínkách Backblaze stejně jako v minulosti pozitivně
vyhrává Hitachi (HGST). Jeho modely, které firma používá (a to
ve velkých počtech) vykázala za poslední tři roky míru selhání
okolo procenta či procenta a půl ročně
– kde selháním se rozumí nečitelný disk, disk, který
se neudrží v poli RAID, nebo disk, u nějž hodnoty SMART nabudou
definovaných varovných hodnot. Poněkud hůře vychází s 3,84 %
jen 8TB model HUH728080ALE600, jenže od toho má Backblaze jen 45
kusů, takže číslo má velkou potenciální nepřesnost. A také
stále jde o dobrou hodnotu. Za 12 měsíců končících v lednu
Hitachi zaznamenalo 1,03 % selhání z 22 731 kusů.
Napravená pověst Seagate?
Zprávy Backblaze dříve působily
jako varování před značkou Seagate. V jejím případě byl
na vině hlavně 3TB disk ST3000DM001 (v USA okolo toho vznikla
dokonce i hromadná
žaloba), i když s horší spolehlivostí se v Backblaze
setkávali i u některých 1,5TB disků této značky (šlo o
ST31500341AS). Nyní je už ale 3TB disk ze statistiky vyloučen,
jelikož už je od něj používáno jen méně než 45 exemplářů
a méně četné typy se nesledují. Po jeho vyškrtnutí dopadá pro
Seagate vyúčtování vcelku dobře. Novější 3TB model
ST33000615AS, 4TB modely ST4000DM000, ST4000DX000 a 6TB ST6000DX000
naopak v číslech Backblaze vyznívají příznivě (2–5 %
selhání ročně) – nyní je
procento disků, které selhaly během posledního celého ročního
cyklu, jen 3,48 %. Přitom má těchto disků Backblaze velké
množství, Seagate je nejvíce zastoupená značka.
Naproti tomu HDD od Western Digital a
Toshiba má Backblaze málo, a to údajně proto, že se je nákupnímu
oddělení nedaří nakupovat ve větších výhodnějších várkách
(5000–10 000 kusů). Z těchto dvou hráčů, u nichž je tudíž
statistika méně vypovídající, má lepší vysvědčení Toshiba.
V posledním roce vykázala poruchovost 3,06 %, čímž by se dostala
na druhé místo, vzhledem k možné chybě měření (v provozu je
jen 238 disků) bych to ale nazval spíše plichtou se Seagate. Z
podrobného rozpisu to vypadá, že u Toshiby jsou na tom lépe 4TB a
5TB modely (roční poruchovost okolo 2 %) než 3TB (4,22 %), jenže
opět pozor na malý počet disků.
Statistiky selhání pevných disků v serverech Backblaze, dle typu za poslední tři roky
Horší spolehlivost WD Red
Western Digital s 1691 disky řady Red
v provozu má ale spolehlivost horší – v posledním ukončeném
ročním období byla poruchovost přibližně 6,55 %. Podrobnější
rozpis ukazuje, že zhruba takovouto roční (ne)spolehlivost mají
3TB disky WD30EFRX a 6TB WD60EFRX. Backblaze má naopak dobrou
zkušenost s 4TB WD40EFRX, tam je číslo jen 2,14 % ročních
selhání – jenže pozor, těchto modelů je v provozu jen 46,
takže dobrý výsledek může být zkreslen náhodou. Naopak
nadprůměrně zle vypadá s roční poruchovostí 10,56 % 2TB
WD20EFRX (ale zde je stále statistika jen z necelých 150 disků,
takže potenciální nepřesnost je velká).
Důležité je ponaučení, že až na
Hitachi, které nemá slabé modely (ale také je na stejnou kapacitu
dražší), jsou mezi jednotlivými modely značek slušné rozdíly.
Doporučení nelze tedy asi vydat na konkrétní značku, ale spíše
na konkrétní model a kapacity. Pokud chcete tedy dle této
statistiky vybírat HDD pro skladování dat, pak se zaměřte na
modelové kódy v tabulce výše, ke kterým jsou
uvedena nejnižší procenta poruch (ideálně s větším počtem užívaných
exemplářů) a poté si při nákupu zkontrolujte, zda skutečně
dostáváte takový disk. HDD dané kapacity totiž může od jedné
firmy existovat v odlišných verzí, které by kód měl rozlišovat.
Problém je samozřejmě s disky, které ve statistice nejsou
(například WD Green, Blue Black). Částečně lze asi učinit
odhad podle záznamů celé značky, do velké míry to ale bude
výstřel naslepo.
Pozor, poruchovost v serveru nemusí odpovídat běžným PC
Zajímavé je, že spolehlivost se
během jednoho roku globálně zvýšila u všech značek. Nemusí to
ovšem být jen vyšší kvalitou výroby dotyčných disků v době,
kdy sjížděly z továrních linek. Svou roli mohlo hrát lepší
zacházení přímo v rámci datacentra – například lepší
chlazení či tlumení vibrací v serverech. Backblaze totiž
desktopové disky provozuje velmi nahuštěné ve vlastnoručně
navržených rackových šasi, kde jsou štosovány nastojato jeden
vedle druhého (disků je v jednom „šupleti“ až 60, pro což už
výrobci doporučují vyšší modely s aktivní kompenzací vlivu
vibrací ze sousedních zařízení, kdežto Backblaze používá jen
běžné spotřebitelské). Scénář je to netypický a hlavně se
různým vývojem těchto šasi podmínky mohou měnit.
Spolehlivost všech značek se zlepšuje. I díky tomu, že poruchové typy odešly do důchodu
Selhání za poslední měsíce
Backblaze také publikovalo separátní
výsledky jen čistě za první čtvrtletí roku 2016. Na těch je
na jednu stranu zajímavý trend, ale je třeba je příliš
nepřecenit, jelikož v krátkém období hraje větší roli náhoda.
V tabulce můžete vidět, že v absolutních číslech selhaly
poměrně malá množství disků. V případě WD se zdá, že
poruchy vcelku korelují s dlouhodobějším záznamem. Naopak 9,63 %
u ST4000DX000 nesedí – jde o pět disků, může tedy jít o
předszvěst zvyšující se úmrtnosti, ale také i o náhodu. V
případě 3TB Toshiby například nárůst poruchovosti na 8,63 %
zavinilo jediné HDD. Tyto aktuální výsledky tedy asi nejsou
natolik důležité, jako dlouhodobá statistika, kterou jsme
probírali prve.
Statistiky selhání pevných disků dle typu v Q1 2016 (Zdroj: Backblaze)
Zdroj: Backblaze