Backup vergessen –Ein Erfahrungsbericht

Wir hatten mal wieder so einen Fall, wo sämtliche Backup-Strategien einfach versagt haben. Man plant, setzt um, installiert und hat einen ganzen Haufen Infrastruktur, aber was bringt das im Falle eines Falles? Ein Erfahrungsbericht:

PC tot.

Der Mac eines Kollegen hatte am Wochenende ein neues Update installiert und dabei ist irgendwas schiefgelaufen. Was genau passiert ist, weiß ich nicht.
Jedenfalls hing der Rechner in einer Reboot-Schleife und fuhr nicht mehr hoch.
Das Starten des Systems war nicht mehr möglich. Jegliche Reparaturversuche mit den Systemtools waren ergebnislos. Besonders ärgerlich, ein dringendes Projekt mit einer Deadline in wenigen Tagen liegt natürlich genau auf diesem Rechner.

Aber keine Panik für so einen Fall haben wir mehrere Backups, die Daten sind also vorhanden – dachte ich.

1. TimeMashine im Netzwerk
In unserem Netzwerk gibt es eine Synologyn, die auch Timemashine als Backup im Netzwerk zur Verfügung stellt. Alle Macs sichern dort verschlüsselt ihre Daten.
Leider wurde diese Synologyn vor ein paar Monaten von unserem IT-Dienstleister getauscht. Alle Services sollten normal weiterlaufen und alles sollte wie vorher sein. Für sämtliche Dienste war das auch so – nur nicht für die Timemashine. Die lief seit 2 Monaten nicht mehr. Schade. Schade auch, dass mir das nicht aufgefallen ist. Aber ich bin auch nicht der Administrator dafür und nutze die Timemashine nur als Nutzer. Aber auch auf meinem Mac habe ich nicht gemerkt, dass die Netzwerkverbindung zur Timemashine nicht läuft.

2. Externe HDD
Wir haben neben dem NAS noch eine Cloud und viele Daten liegen dort. Leider hatte der Kollege keinen automatisierten Upload, sondern nur manuelles und es entsprechend lange versäumt, die Daten hochzuladen.

Der Kollege nutzt eine externe HDD, um Daten mit ins Homeoffice zu nehmen oder diese mit anderen Kollegen zu tauschen. Dort kopiert er manuell mehr oder weniger regelmäßig Daten drauf, auch um Speicher auf dem Hauptsystem freizugeben.
Hatte er für das aktuelle Projekt aber nicht gemacht.

3. Cloud Storage
Wir haben neben dem NAS noch eine Cloud und viele Daten liegen dort. Leider hatte der Kollege keinen automatisierten Upload, sondern nur manuelles und es entsprechend lange versäumt, die Daten hochzuladen.

 4. Der Computer
Auch wenn der Computer nicht mehr hochfuhr, konnten über ein externes Boot-Medium auf die Daten zugegriffen werden. Sie waren in diesem Fall alle noch da.
Dies ist nicht immer der Fall.

Da dies die aktuellsten Daten waren, haben wir diese auf eine externe USB HDD kopiert, hat bei über 500 GB aber auch einen halben Arbeitstag lang gedauert.

Ein Backup ist kein lauffähiges System!

Auch wenn wir in diesem Fall „Glück“ gehabt haben, weil die Festplatte nicht kaputt war und so alle Daten gerettet werden konnten. Zeigt sich, dass ein Backup allein noch kein lauffähiges System ersetzt.
Auch nach der Neuinstallation dauerte es ein paar Stunden, bis alle Zugänge, VPN-Verbindungen, Hotkeys usw. wieder gesetzt waren und der Rechner wie gewohnt zum Arbeiten genutzt werden konnte.
Am Ende hat die ganze Aktion fast 1 ½ Arbeitstage gekostet.

Fehlerkorrekturen

Positiv ist eigentlich nur, dass wir viel Infrastruktur zum Datensichern haben.
Negativ ist, dass bei dem Kollegen kein „Zwang“ zum Datensichern herrschte. Die Eigenverantwortung war in diesem Fall einfach ein Fehler. Der „Ausfalls“ der Timemashine im NAS hätte früher auffallen können / müssen.
Auch da fehlte einfach ein Kontrollmechanismus.

Wir brauchen also eine Strategie und Verantwortlichkeiten. Wir sind ein sehr kleines Team und alles ist immer irgendwie gewachsen. Es fehlen aber geordnete Prozesse. Diese zu erstellen wird dann wohl meine Aufgabe.

Konsequenzen

Als kurzfristige Lösung erhalten alle Kollegen nun einen Backup-Client, der sich darum kümmert, die Daten des Systems stündlich zu sichern. Die Kollegen mit dem Mac haben eine zusätzliche externe SSD bekommen und erstellen nun zwei Timemashine Backups. Eins auf dem NAS, das nach einer Netzwerkanpassung wieder funktioniert und ein lokales aus der SSD. Über die genutzte Kingston SSD mit über 1000 MB/S habe ich schon ein Review geschrieben.
Wir werden einen Prozess erarbeiten, bei dem regelmäßiger überprüft wird, ob und wann Backups erstellt worden sind.

Gedanken

Ein paar Gedanken die ich noch zu dem Vorfall hatte:

Das Angestellte Verantwortung für ihr Arbeitsgerät (Computer) übernehmen, scheint überholt zu sein. Für uns Nerds passt das, aber für die meisten Anwender ist der Rechner nur ein Tool, das funktionieren muss. Das ist auf der einen Seite verständlich, aber schade. Hier muss bei uns mir ein Umdenken stattfinden.
Ab wie vielen Angestellten braucht man einen IT-Verantwortlichen?

Die Netzwerkanbindung mit 1000 Gigabit stößt langsam auch an ihre Grenzen. Wir haben über 500 Gigabyte Daten kopiert, im Schnitt mit 45 MB/s. Das hat ewig gedauert. Aber auch wenn das TimeMashine Backup funktioniert hätte, würde das Kopieren übers Netzwerk Stunden dauern. Die neuen SSD’s schreiben mit über 1000 MB/s, das Netzwerk schafft gerade mal 125 MB/s.

Gäbe es eine Möglichkeit boot-bare Backups zu erstellen? Also Backups die man direkt booten kann? (Mit Linux wäre das kein Problem).