Monitoring- und Managementprodukte für die IT-Infrastruktur

Zum Einsatz kommen häufig Nagios-basierte Lösungen - vor allem dann, wenn es sich um reine Linux Umgebungen handelt. Vorteile sind die Flexibilität der Nagios Lösung, vor allem im Bereich der individuellen System Anpassbarkeit. Zudem handelt es sich bei Nagios Lösungen um ein seit Jahren etabliertes Konzept in Enterprise Umgebungen. Einige ebenfalls auf Nagios basierende Lösungen sind im Enterprise Umfeld anzutreffen, wie z.B.  Groundwork, Icinga und OPSView.

Ebenfalls flexibel einsetzbar unter Linux und Windows ist die Lösung OPManager: Erweiterbar mit zusätzlichen Features, HelpDesk (Ticket System), Applikationsverwaltung (Updates) und vielen weiteren Features.

Diese Monitoring Systeme können sowohl auf einer für diesen Zweck ausgelegten physischen Hardware als auch in einer virtuellen Maschine eingesetzt werden. Für die Überwachung von Server Hardware und Diensten, die in einer produktiven Umgebung eingesetzt werden, stehen eine Vielzahl von Methoden zur Verfügung, die eine Abfrage ermöglichen. Dies wären z.B.  SNMP, TCP, UDP, SSH, Telnet um nur einige zu nennen. Ebenfalls ist die Möglichkeit gegeben, spezielle Agenten für die Kommunikation zu verwenden. Der Vorteil beim Einsatz eines Agenten ist häufig der wesentlich geringere Aufwand in Bezug auf Firewall Konfigurationen. Ebenso vereinfacht der Agent die Festlegung von firmeninternen Sicherheitsrichtlinien bestimmter Dienste. Die Informationen zur Auswertung werden in diesen Fall vom Agenten lokal gesammelt und über einen anpassbaren Port zur Kommunikation an den Server zur Auswertung übermittelt. Häufig bieten spezielle Agenten auch weitere Features zur Datenauswertung und Reportgenerierung an.

Die folgende Grafik zeigt den Ablauf des System-Monitoring und Management:

Gehen wir von einer gesamteinheitlichen Überwachung der IT-Infrastruktur aus, so ist die Überwachung als solches der entscheidende Punkt für alle daraus resultierenden Aktionen. Hierbei sind sowohl manuelle Interventionen, wie auch vollautomatisierte Abläufe möglich. Ist also eine vom System-Monitoring überwachte Komponente von einem Ausfall betroffen, so werden die Schritte aus der oben stehenden Grafik abgearbeitet. Der Überwachung direkt nachgelagert ist natürlich die Diagnose der Systemressource. Diese automatische Funktion leitet zu einem manuellen Eingriff, indem in der nächsten Stufe eine Benachrichtigung  über den Ausfall der Systemkomponente an verantwortliche Personen oder Personengruppen geleitet wird. Sie kann aber auch als automatische proaktive Diagnose selbstständig skriptgesteuerte  Aktionen zur Wiederherstellung der Systemfunktion ausführen. Wird die Systemkomponente wieder in einen betriebsfähigen Zustand versetzt, ist die Applikationsverfügbarkeit in diesem Fall weiterhin gegeben. Sollte ein Wiederherstellungsversuch scheitern, wird eine Benachrichtigung versendet und zur manuellen Intervention aufgefordert. Dieser Ablauf ist produktunabhängig als Basisfunktionalität für die meisten System-Monitoring-Produkte zu verstehen.

Eine weitere Funktionalität ist das Monitoring der "Quality of Service". Diese Beurteilung wird durch Reportgenerierung getroffen und zeigt z.B. die Verfügbarkeit einer Hard- oder Software über einen vorher definierten Zeitraum an. Anhand der dargestellten Informationen und der dazugehörigen Fehlereinträge können Maßnahmen abgeleitet werden. Denkbar ist beispielsweise der Austausch eines instabilen Netzwerkswitches oder das Patchen fehlerbehafteter Software.

Auftretende bzw. sich abzeichnende Ressourcenmängel lassen sich ebenfalls aus dem Reporting ablesen. Bevor es zu Speicher- oder Performanceengpässen kommt, kann die IT-Infrastruktur zielgerichtet analysiert und Kapazitäten an erforderlicher Stelle erweitert werden.

Die von uns eingesetzten Produkte erfüllen alle genannten Funktionen und können darüber hinaus auch an spezielle Umgebungen angepasst werden.