Verhalten im Fehlerfall

Verhalten im Fehlerfall

Voraussetzung für einen reibungslosen Betrieb des Clusters ist ein konsistenter Softwarestand. Auf allen beteiligten Servern muss daher eine identische Version der zu schützenden Applikation installiert sein.

Im Fehlerfall wird dann wie folgt vorgegangen:

  1. Registrieren des Fehlers
  2. Versuch, die Ressource wieder zu aktivieren
  3. Übernahme der Ressource durch Node 2
  4. Kaskadierung, N-Way Failover, N+1 Failover möglich
  5. manueller Switchback oder Fallback

Zum Failover kann im LifeKeeper ein automatischer Switchback konfiguriert werden. Dadurch wird erreicht, dass nach der Wiederherstellung der Funktionsfähigkeit eines ausgefallenen Nodes das Cluster wieder den Normalzustand einnimmt. Der Einsatz dieser Option ist genau abzuwägen.

Ein sehr nützliches Feature im LifeKeeper ist die Möglichkeit, für den Fall des geplanten Abschaltens des Servers (shut down) ein Switchover einzuleiten. Dies kann die Verfügbarkeit von Applikationen erhöhen, wenn Server versehentlich außer Betrieb genommen werden oder ein Shutdown durch externe Komponenten wie z.B. unterbrechungsfreie Stromversorgungen ausgelöst wird.

zum nächsten Artikel:

zurück zu: