Fiabilité des disques durs

Dans notre série sur la fiabilité des médias optiques, nous nous interrompons un instant pour parler de celle des disques durs de type magnétique. En effet, l’actualité a récemment apporté deux études intéressantes à mettre en lumière.

Articles récents sur le RAID :

La première publication est un papier du laboratoire de recherche de Google intitulé « Failure Trends in a Large Disk Drive Population » (tendance de défaut dans une grande population de disques durs) qui est assez intéressante parce qu’elle repose sur l’analyse de plus de 100.000 drives installés partout chez Google. Ils ont utilisé une grande quantité de données collectées principalement à travers SMART et tirent des conclusions interessantes ou tout simplement à l’opposé des intuitions courantes :

  • Les températures élevées et les utilisations intensives ne sont pas corrélées de manière positive avec les défaillances (au contraire, plus le drive est chaud, plus il semble être fiable -légérement).
  • Seuls quatre attributs SMART (scan errors, reallocation counts, offline reallocations et probational counts) ont un lien véritable avec la fiabilité du disque dur mais ils ne constituent pas un bon prédicteur des pannes individuelles (56% des disques sont tombés en panne sans aucune alerte sur ces indicateurs).

Un autre rapport de la Carnegie Mellon University intitulé « Disk failures in the real world: What does an MTTF of 1,000,000 hours mean to you? » (pannes des disques durs dans la réalité : qu’est-ce qu’un MTTF de 1.000.000 d’heures veut dire pour vous ?) -présenté à la 5e conférence Usenix à San Jose, en Californie- dénonce le fait que la fiabilité annoncée (et promise) par les fabricants de DD sous la forme des chiffres de MTTF est grossièrement sur-estimée. Bianca Schroeder et Garth A. Gibson insistent sur le fait qu’eux aussi ont récupéré les données provenant de plus de 100.000 disques durs et ils ont remarqué de le taux de remplacement prédit par l’habituel MTTF de 1.000.000 ou 1.500.000 heures des constructeurs devrait se traduire par des taux de remplacement annuel de moins de 0,88%. Mais, ils observent typiquement plus de 1% dans la réalité, avec souvent de 2% à 4% et des pointes à 13%.

Si l’on prend en compte ces études, il semble bien que le média magnétique reste très fiable, mais les fabricants en profitent pour sur-estimer violemment leurs estimations. Est-ce que cela pourrait être une raison supplémentaire pour installer un système de stockage à base de RAID ?