Monitoring- und Managementprodukte für die IT-Infrastruktur

Zum Einsatz kommen in den meisten Fällen Nagios-basierte Lösungen, vor allem dann, wenn es sich um eine reine Linux Umgebung handelt. Vorteile sind die Flexibilität der Nagios Lösung, vor allem in dem Bereich der individuellen System Anpassbarkeit. Zudem handelt es sich bei Nagios Lösungen um ein seit Jahren etabliertes Konzept in Enterprise Umgebungen. Einige ebenfalls auf Nagios basierende Lösungen sind im Enterprise Umfeld anzutreffen, wie z.B.  GroundworkOPSView und Icinga.

Als ebenfalls sehr flexibel einsetzbar, sowohl unter Linux als auch Windows ist die Lösung OPManager. Erweiterbar mit zusätzlichen Features, HelpDesk (Ticket System), Applikations Verwaltung (Updates) und vielen weiteren Features.

Diese Monitoring Systeme können auf einer für diesen Zweck ausgelegten physischen Hardware als auch in einer Virtuellen Appliance eingesetzt werden. Für die Überwachung von Server Hardware und Diensten die in einer produktiven Umgebung eingesetzt werden, stehen eine Vielzahl von Methoden zur Verfügung, die eine Abfrage ermöglichen. Dies wären z.B.  SNMP, TCP, UDP, SSH, Telnet um nur einige zu nennen. Ebenfalls ist die Möglichkeit gegeben spezielle Agenten für die Kommunikation zu verwenden. Der Vorteil bei dem Einsatz eines Agenten ist häufig der wesentlich geringere Aufwand im Bezug auf Firewall Konfigurationen. Ebenso vereinfacht der Agent die Festlegung von Firmen internen Sicherheitsrichtlinien bestimmter Dienste. Die Informationen zur Auswertung werden in diesen Fall vom Agenten lokal gesammelt und über einen anpassbaren Port zur Kommunikation an den Server zur Auswertung übermittelt. Häufig bieten spezielle Agenten auf weitere Features im Bereich Daten Auswertung und Reportgenerierung an.

Die folgende Grafik zeigt den Ablauf des System-Monitoring und Management:

Gehen wir von einer Gesamteinheitlichen Überwachung der IT-Infrastruktur aus, so ist die Überwachung als solches der entscheidende Punkt für alle daraus resultierenden Aktionen. Sowohl manuelle Intervention als auch vollautomatisierte Abläufe. Ist also eine vom System-Monitoring überwachte Komponente von einem Ausfall betroffen, so werden die Schritte aus der oben stehenden Grafik abgearbeitet. Der Überwachung direkt nachgelagert ist natürlich die Diagnose der Systemressource. Diese automatische Funktion, leitet zu einem manuellen Eingriff indem in der nächsten Stufe eine Benachrichtigung  über den Ausfall der System Komponente an verantwortliche Personen oder Personen Gruppe geleitet wird. Kann aber auch als automatische pro aktive Diagnose, selbstständig, Skriptgesteuert  Aktionen zur Wiederherstellung der Systemfunktion ausführen. Wird die System-Komponente wieder in einen betriebsfähigen Zustand versetzt, ist die Applikationsverfügbarkeit in diesem Fall weiterhin gegeben. Sollte ein Wiederherstellungsversuch scheitern, wird eine Benachrichtigt versendet und zur manuellen Intervention aufgefordert. Dieser Ablauf ist produktunabhängig als Basisfunktionalität für die meisten System-Monitoring-Produkte zu verstehen.

Sehen wir die Grafik weiter an, so kann zu weiteren Funktionalitäten verzweigt werden. Die nachfolgende Funktionalität ist die "Quality of Service". Diese Beurteilung wird durch Reportgenerierung getroffen und zeigt z.B. die Verfügbarkeit einer Hard- oder Software über einen vorher definierten Zeitraum an. Anhand der dargestellten Informationen und der dazugehörigen Fehlereinträge können Maßnahmen abgeleitet werden. Denkbar der Austausch von einem Netzwerkswitch, welcher sich als nicht stabil zeigt, als auch das Patchen von fehlerbehafteter Software.

Ein Fehler der aufgrund von Ressourcen-Mangel entsteht und sich ebenfalls aus den Reporting ablesen lässt, z.B. Speicherkapazitäten, Performance-Defizite etc.  führt zum letzten in der Grafik angegebenen Punkt der Skalierung. Hierbei wird die IT-Infrastruktur zielgerichtet analysiert und Kapazitäten an erforderlicher Stelle erweitert.

Die von uns eingesetzten Produkte erfüllen alle genannten Funktionen und können darüber hinaus auch an spezielle Umgebungen angepasst werden.