Login Registrieren

Visualisierung von NetWorker-Logs und System-Stati

Verfasst von Uwe W. Schäfer am 21. Dezember 2020

Visualisierung und Management von NetWorker Log- und Raw-Dateien sowie Systemparametern

  1. Einleitung

  2. Wer für die Sicherung einer größeren Firma verantwortlich ist, möchte frühzeitig mitbekommen, wenn
    das Backup-System in eine Schieflage gerät. Um das zu erreichen, reicht es nicht, nur die Meldun-
    gen der Sicherungen zu kontrollieren, sondern der Administrator sollte auch die Protokolle der Back-
    up-Software und des Betriebssystems betrachten. Zusätzlich sollten die Betriebssystem-Parameter,
    wie Hauptspeicherverbrauch, Netzwerkauslastung und Ähnliches im Auge behalten werden.


    Ein NetWorker Administrator ist heutzutage aber schon rein zeitlich nicht in der Lage, alle System-
    protokolle und die NetWorker-Protokolle täglich durchzuarbeiten. Die Überwachung läuft folglich
    auf eine Symptom-Bekämpfung hinaus. Wenn ein akutes Problem auftaucht, z.B. eine Sicherung wird
    wiederhollt abgebrochen, dann wird eine Analyse gestartet. Oft wäre das Problem aber bereits im
    Vorfeld zu erkennen gewesen. Man hätte die Backup Probleme vermeiden können, wenn die betref-
    fenden Meldungen früh genug erkannt worden wären.


    Ein Beispiel:
    Ein Kunde berichtete mir in einer meiner Workshops, dass die NDMP Sicherungen in seiner Firma seit
    längerem ein Zeitfenster-Problem haben. Früher wäre alles ohne Probleme gelaufen, aber seit einiger
    Zeit würden die NDMP Sicherungen zu lange brauchen.


    An diesem Problem wurde schon seit Wochen herumgedoktert, auch mit externen Support. Aber leider
    hatten alle Beteiligten immer nur im Umfeld des Storage-Systems und des NDMP-Workflows nach
    Fehlern gesucht. Das eigentliche Problem wurde aber nicht entdeckt. Dabei war das Problem in der
    NetWorker Protokoll-Datei (daemon.raw) durchaus ersichtlich, wenn man danach gesucht hätte. Die
    Ursache des beschriebenen Problems in diesem Beispiel war nicht der NetWorker-Server oder eine
    Konfiguration im NetWorker. Die Ursache des Problems war dem Austausch von Netzwerk-Kompo-
    nenten und damit veränderten Netzwerk-Routen geschuldet. Durch diese Änderung in der Peripherie
    konnten einige NetWorker-Client Maschinen die DataDomain Systeme nicht mehr direkt erreichen.
    Es fand folglich kein Client-Direct-Backup mehr statt, sondern die Maschinen sendeten ihre Daten
    zum NetWorker-Server und dieser übergab die Daten dann an die DataDomain. Durch dieses, um
    mindestens 90% höhere Datenaufkommen, waren die Netzwerk- und System-Komponenten am Net-
    Worker-Server so stark belastet, dass beim Start der NDMP Sicherungen keine Kapazitäten mehr frei
    waren. Wie gesagt, die Meldungen, dass die Client-Sicherungen keinen direkten Weg mehr für ihr
    Backup hatten, waren in den Logs ersichtlich. Es hat nur keiner bemerkt.


    Das Auffinden entprechender Meldungen in der NetWorker daemon.raw wird dadurch erschwert,
    dass alle NetWorker Daemonen ihre Standard-Error-Ausgabe in diese Datei schreiben. Wenn es dann
    noch ein paar Maschinen gibt deren Client-Zertifikat fehlerhaft im NetWorker eingetragen ist, sieht
    man schnell den Wald vor lauter Bäumen nicht mehr. Einige Tausend Meldungen pro Tag sind keine
    Seltenheit. Hier die Spreu vom Weizen zu trennen war folglich das Ziel des vorliegenden Tools.

  3. Das Ergebnis

    Eine WWW-Oberfläche in der:

    • alle wichtigen NetWorker Umgebungsparameter auf einen Blick ersichtlich sind.
    • es möglich ist die daemon.raw Meldungen zu filtern, zu bearbeiten und bei definierten Meldungen
      automatische Aktionen einzuleiten.
    • es möglich ist, Meldungen nach dem Status (NEW, ACCEPTED, ...), dem Verursacher (nsrexecd,
      nsrd,
      ...), nach Meldungs-Texten und ausgewählten Zeiträumen, zu filten und nach allen gezeigten
      Spalten, zu sortieren.
    • es möglich ist den zeitlichen Verlauf von System-Ressourcen der NetWorker-Server Maschine graphisch zu betrachten
    • es möglich ist Datensicherungslangläufer (Long Running Jobs  anzeigen zu lassen.
    • es möglich ist den Speicher- und Swap-Verbrauch der NetWorker-Server Maschine des letzten Monats visualisiert zu betrachten
  4. Weitere Module

    • Überwachung der RetentionLock Definitionen in den NetWorker Workflow-Actions
    • Visualisierung der NetWorker Rap.log Datei
    • Kontrolle der installierten NetWorker Client- und Modul-Versionen
    • Berechnung der DataDomain DeDup-Werte pro Client und SaveSet. Gruppierung der Clients zu Abrechnungzwecken.
  5. Die Zukunft

    Weitere Überwachungsparameter sind in Planung oder bereits in Arbeit.
    zum Beispiel:
    • Erkennen von Backup Anomalien
    • Überwachung der Bootstrap Sicherungen
    • Kontrolle der RetentionLock Funktionalität bei Datenbank Sicherungen
    • Visualisierung der NetWorker Client- und Modul-Logdateien
    • ...

Sollten sie weitere Fragen oder Interesse an einer Live-Demo des Tools haben so wenden Sie sich am besten per Mail an den Autor.