Vorhersagen von Festplattenschäden

Festplatten sind mit das sicherste Speichermedium. Allerdings versagen auch sie manchmal. Um Harddrive-Ausfälle vorhersagen zu können, gibt es seit dem ATA-3-Standard die Self-Monitoring, Analysis and Reporting Technologie, kurz S.M.A.R.T.

Die Kapazität von Festplatten nimmt ständig zu. Immer mehr Daten werden auf einer Platte gespeichert. Doch was tun, wenn die Harddisk crasht? Um das zu vermeiden, gibt es seit dem ATA-3-Standard die Self-Monitoring, Analysis and Reporting Technologie, kurz S.M.A.R.T. Sie ermittelt über Sensoren laufend Daten wie Festplattentemperatur und Laufleistung und ermöglicht mit dem entsprechendem Knowhow Vorhersagen zur Lebensdauer des Drives.

Bereits 1992 führte IBM die Predictive Failure Analysis (PFA) ein. Dieses System teilte dem Benutzer allerdings noch jegliche Parameteränderung des Speichermediums mit. Kurz darauf stellte Compaq zusammen mit Seagate, Quantum und Conner das Intellisafe-System vor: Das System zeichnete ebenfalls Parameteränderungen der Festplatte auf, informierte den User allerdings nur über relevante Änderungen der Sollwerte. Aus einer Kombination beider Systeme entstand schließlich SMART. Leider wurde SMART vor der Verabschiedung des ATA-3-Standards wieder aus der Spezifikation gestrichen und ist auch in der Spezifikation des aktuellen ATA-7-Standards nicht enthalten. Trotzdem halten sich alle Hersteller an die damals festgelegte Spezifikation und man findet heute kaum eine Platte, die das SMART-Datenformat nicht unterstützt.

Doch wie kann man die SMART-Informationen überhaupt abrufen und auswerten? Grundsätzlich muss man SMART lediglich im Bios des Computers aktivieren. Der Rechner wertet dann beim Starten die SMART-Daten aus und warnt, falls eine Festplatte dem Ende ihrer Lebensdauer nähert. Wer mehr über den Zustand seines Datenspeichers erfahren möchte, kann hierfür auf spezielle Software zurückgreifen. Microsoft hat seit Windows 95b einen Treiber zum Auslesen der SMART-Daten in seine Betriebssysteme integriert. Ein entsprechendes Tool stellt der Softwarehersteller allerdings nicht bereit. Es gibt aber zahlreiche Programme für das Abrufen und Auswerten der SMART-Daten und viele sind sogar kostenfrei.

Da es sich bei SMART nicht um einen offiziellen Standard handelt, unterscheiden sich die Festplatten der verschiedenen Hersteller in den erfassten Daten und Sollwerten. Auch sind die Sollwerte oft zu optimistisch gewählt oder die Sensoren liefern falsche Daten. So kommt es beispielsweise vor, dass ein SMART-Temperatursensor bei einer Raumtemperatur von 24 Grad eine Festplattentemperatur von nur 20 Grad anzeigt – ein klarer Fehler. Ein weiters Problem stellen Null-Durchläufe der Zähler dar: Wird ein bestimmter Wert überschritten, beginnt der Zähler wieder von vorne.

Eine Google-Studie über neun Monate und 100.000 Festplatten aller Hersteller im Jahr 2006 ergab eine SMART-Verlässlichkeit von rund 64 Prozent. Zudem stellte sich bei dieser Gelegenheit heraus, dass nicht, wie angenommen, die Beanspruchung der Platten einen wesentlichen Einfluss auf deren Haltbarkeit hat: Übersteht ein Laufwerk das erste Jahr, wird es mit aller Wahrscheinlichkeit auch das vierte noch unbeschadet überleben. Erst danach haben häufige Zugriffe einen Einfluss auf die Lebensdauer.

Mittels der von SMART aufgezeichneten Parameter kann man also recht zuverlässige Aussagen über Zustand und Lebensdauer einer Festplatte machen. Doch wie sehen diese Parameter aus, und was verraten sie? Grundsätzlich gibt es zwei Typen: ausfallrelevante und informierende.

Zu den informierenden gehört beispielsweise der Power On Hours Count. Er speichert die Laufzeit der Festplatte inklusive Standby. Ein weiterer informierender Parameter ist der Load/Unload Cycle Count. Er zeigt die Anzahl der Parkvorgänge eines Laufwerks und kommt meist bei Notebooklaufwerken zum Einsatz. Eine Festplatte ist für rund 300.000 Parkvorgänge vorgesehen. Man kann also bereits aus den informierenden Parametern eine Aussage über die Lebendauer treffen. Hat ein Notebooklaufwerk beispielsweise weit mehr als 300.000 Parkvorgänge hinter sich, steigt die Wahrscheinlichkeit, dass der Parkmechanismus irgendwann nicht mehr richtig funktioniert.

Die ausfallrelevanten Parameter bieten aber eine weitaus bessere Aussagekraft. Ein besonders wichtiger ist hier der Reallocated Sector Count. Er zeichnet die Anzahl der verbrauchten Reservesektoren auf und lässt dadurch Rückschlüsse auf den Zustand der Festplattenoberfläche zu. Die Spin Up Time zeichnet die durchschnittliche Anlaufzeit in Millisekunden auf. Schlechte Werte deuten auf Probleme mit dem Festplattenmotor oder den Lagern hin. Die Seek Error Rate misst nicht korrigierbare Lesefehler und gibt Aufschluss über Positionierungsprobleme der Lese-/Schreibeinheit der Festplatte.

All diese Daten werden in einem Zugriffsgeschützten Bereich der Festplatte abgespeichert und zum besseren Verständnis auf eine Werteskala von 0 bis 100, 200 oder 255 einsortiert. Neue Platten starten mit dem Skalenmaximum. Bei Fehlern oder zunehmendem Alter nähern sich die Werte Null. Ein kritischer Grenzwert (Threshold) ist meist weit über dem Nullwert angesiedelt. Wird der Threshold unterschritten, meldet sich SMART und warnt.

Wer nicht warten will bis die Harddisk kaputt ist und sofort wissen möchte, in welchem Zustand sich die eingebaute Festplatte befindet, kann auf zahlreiche Tools zurückgreifen. Es stehen Profiprogramme wie Smartmontools zum Gratisdownload bereit, die sehr genaue Vorhersagen zulassen, dafür allerdings Knowhow auf diesem Gebiet erfordern. Aber auch grafische, einfach zu bedienende Programme gibt es reichlich.

CNET für mobile Geräte:
Android-App Google Currents App for iOS

Themenseiten: Praxis

Artikel empfehlen:
Fanden Sie diesen Artikel nützlich?
Content Loading ...

Neueste Kommentare 

Noch keine Kommentare zu Vorhersagen von Festplattenschäden

Schreib einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *