Starte noch heute mit dem Monitoring und erhalte 20% Rabatt auf Deine erste Rechnung. Gültig für alle Versionen.

Eine der Hauptfunktionen des Monitoring Service von Uptrends ist die Alarmierung: Wenn ein Fehler durch die Prüfobjekte entdeckt wird, wirst du durch eine Warnmeldung benachrichtigt.

In Uptrends‘ Anwendung funktioniert dies wie folgt:

Wenn ein Monitoring-Check einen bestätigten Fehler zum Ergebnis hat, wird in der Anwendung von Uptrends ein Alarm erzeugt. Ein Alarm löst das Senden einer Warnmeldung an einen Operator oder an eine externe Anwendung aus.

Für diesen Vorgang sind diese vier Definitionen erforderlich: Prüfobjekt, Fehlerbedingung, Meldedefinition und Integration. Sie geben an, ob und wann ein Alarm erzeugt und welche Art von Warnmeldung gesendet wird.

Mit diesem Artikel sehen wir uns die Grundlagen an, wie ein Check zu einer Warnmeldung wird.

Checks durch Prüfobjekte

Zu Beginn stehen die Checks durch die Prüfobjekte, die in einem von dir bestimmten Intervall ausgeführt werden. Der Check vom Prüfobjekt umfasst Standardüberprüfungen je nach Prüfobjekttyp, zum Beispiel auf Verfügbarkeit. Darüber hinaus kannst du eigene Fehlerbedingungen einrichten. Darunter fallen zum Beispiel Höchstgrenzen zu Ladezeiten oder eine Übereinstimmungsabfrage.

Die Lektion: Konfigurieren von Fehlerbedingungen unter dem Academy-Thema „Alarme“ erläutert genauer, wie Fehlerbedingungen konfiguriert werden.

Wenn das Prüfobjekt ein Problem aufdeckt, weil der Standardcheck fehlschlägt oder eine Fehlerbedingung erfüllt wird, wird ein Fehler gemeldet.

Fehler

Alle Fehler werden unter Fehler Übersicht (Menüelement Dashboards > Verfügbarkeit & Fehler – Fehler Übersicht) aufgeführt. Du kannst ändern, welche Art Fehler (OK, unbestätigt, bestätigt) und für welchen Zeitraum diese angezeigt werden sollen. Diese Einstellungen können für das gesamte Dashboard oben am Dashboard vorgenommen werden. Darüber hinaus lässt sich jede einzelne Kachel auch individuell einrichten. Fahre mit der Maus über die rechte obere Ecke der Kachel, um zu ihren Einstellungen zu gelangen.

Das folgende Beispiel für eine Fehler Übersicht zeigt unbestätigte (gelb) und bestätigte (rot) Fehler eines selbst gewählten Zeitraums:

Das erste Auftreten eines Fehlers wird als unbestätigter Fehler betrachtet. Es kann ein vorübergehendes Vorkommen oder ein Problem am Checkpoint sein. Deshalb wird ein zweiter Check von einem anderen Checkpoint durchgeführt. Wenn dieser Checkpoint ebenfalls denselben Fehler meldet, wird der Fehler als bestätigt erachtet. Nur bestätigte Fehler führen zu einem Alarm.

Weitere Informationen hierzu findest du im Artikel Nicht bestätigte und bestätigte Fehler.

Abfolgen von Fehlern

Es gibt unterschiedliche Szenarien für eine Abfolge von Fehlern, die im Bild unten dargestellt werden:

  • Ein unbestätigter Fehler, gefolgt von einem OK-Ergebnis. Dies erzeugt keinen Alarm.
  • Ein unbestätigter Fehler, gefolgt von einem bestätigten Fehler, dann gefolgt von einem OK-Ergebnis. Dies führt zu einem Alarm, wenn deine Meldedefinition so eingestellt ist, dass sie „einen Alarm, wenn 1 oder mehr Fehler aufgetreten“ sind, generiert.
  • Eine Anzahl (n) unbestätigter und bestätigter Fehler treten nacheinander auf. Dies führt zu einem Alarm, wenn deine Meldedefinition so eingestellt ist, dass sie „ein Alarm, wenn n oder mehr Fehler aufgetreten“ sind, generiert. Alternativ kannst du ein Zeitlimit für Fehler einsetzen. Wenn die Abfolge von Fehlern dieses Zeitlimit erreicht, wenn also beispielsweise ein Fehler länger als fünf Minuten auftritt, wird ein Alarm erzeugt.

Alarme

Die Meldedefinition steuert die Erzeugung von Alarmen für unterschiedliche Eskalationsstufen. Die Eskalationsstufen werden verwendet, um Alarme in Phasen auszulösen und die richtigen Personen auf die richtige Weise zu benachrichtigen. Dabei werden die Dringlichkeit des Problems und die gesteigerte Dringlichkeit bei Fortbestehen des Problems berücksichtigt.

Für jede Stufe kannst du eingeben, ob ein Alarm erzeugt wird, wenn das Zeitlimit überschritten ist (Fehler dauern länger als x Minuten), oder ob eine Alarm erzeugt wird, nachdem eine Anzahl von Fehlern aufgetreten ist (n oder mehr Fehler sind aufgetreten). Alle Fehler müssen bestätigte Fehler sein. Unbestätigte Fehler werden bei diesen Bedingungen nicht berücksichtigt.

Zusätzlich zum ersten Alarm kannst du einen oder mehrere Erinnerungen einrichten. Du kannst eine Maximalzahl an Erinnerungen und das Intervall, in dem sie erzeugt werden sollen, bestimmen. Diese Option ist für jede Eskalationsstufe individuell einstellbar.

Die Lektion: Erstellen von Meldedefinitionen und die Lektion: Erweiterte Alarmierungen – Eskalationsstufen“ unter dem Academy-Thema „Alarme“ enthalten weitere Informationen zur Meldedefinition.

Hinweis: Im Prüfobjekt muss Warnmeldungen generieren aktiviert sein, damit überhaupt Alarme erzeugt werden.

Wenn der Fehler aufgelöst wurde (wenn dieselbe Prüfung also ein OK statt eines Fehlers zurückgibt) wird eine Entwarnungsalarm (OK-Alarm) erzeugt.

Alle Alarme werden in der Alarmierungshistorie (Menüelement Alarme > Alarmierungshistorie) aufgelistet. Die auf einem Fehler beruhenden Alarme werden rot markiert, OK-Alarme grün. Solange der Fehler nicht behoben und kein Entwarnungsalarm erzeugt wird, gilt der Alarm als aktiver Alarm. Alle aktiven Alarme werden unter Meldestatus (Menüelement Alarme > Meldestatus) aufgelistet.

Warnmeldungen

Du hast jetzt bereits ein grundlegendes Alarmierungssystem. Die aktiven Alarme erscheinen auf dem Meldestatus-Dashboard. Um einen Alarm jedoch zu bemerken, müsste dein Operator ständig auf das Dashboard schauen.

Du kannst die Alarmierung weiter automatisieren, indem du Warnmeldungen an Personen oder Systeme sendest, um sie über die Alarmsituation zu informieren. In dem Fall mußt du Integrationen und Eskalationsstufen (in einer Meldedefinition) einrichten.

In den Eskalationsstufen konfigurierst du, wer welche Art Warnmeldung bekommt – auf der Grundlage, wie lange oder wie häufig ein Fehler aufgetreten ist. Zudem können Erinnerungen gesendet werden, damit ein Fehler auch wirklich beachtet wird. Weitere Informationen findest du unter Eskalationsstufen.

Um nach der Erzeugung eines Alarms eine Warnmeldung zu senden, musst du die Alarmierung durch Integrationen innerhalb der Meldedefinition einrichten.

Meldedefinitionen – Registerkarte Eskalationsstufe

Die Integrationen zur Warnmeldung per Telefon (Sprachnachricht), SMS und E-Mail sind bei Uptrends standardmäßig vorhanden. Andere Integrationen mit externen Systemen wie Slack sind vordefiniert, müssen aber von dir eingerichtet werden. Darüber hinaus kannst du eine vollständig benutzerdefinierte Integration für dein externes System einrichten. Klicke auf das Menüelement Alarme > Integrationen, um eine Liste der Integrationen bei Uptrends aufzurufen. Wenn die Integration hier existiert, kannst du sie in deiner Einrichtung unter Alarmierung durch Integrationen nutzen.

Unter Was sind Integrationen? findest du mehr über die Gesamtheit der Optionen zum Senden von Warnmeldungen an Personen oder an externe Systeme. Im Knowledge-Base-Artikel Benutzerdefinierte Integrationen einrichten erfährst du mehr über das Senden einer Mitteilung an ein System, für das keine Standarddefinition zur Integration vorhanden ist.

Dies ist ein Beispiel für Warnmeldungen aufgrund desselben Alarms, per E-Mail und an Slack:

Testen von Warnmeldungen

Du solltest dich darauf verlassen können, dass Warnmeldungen ausgesendet werden, wenn eine Situation entsteht, die deine Aufmerksamkeit erfordert.

Im ersten Schritt solltest du sicherstellen, dass das Senden von Warnmeldungen funktioniert. Der KB-Artikel Testen von Warnmeldungen beschreibt für die unterschiedlichen Integrationen, wie du prüfen kannst, ob die Warnmeldungen tatsächlich gesendet werden.

Im Abschnitt Fehler suchen der Überblicksseite von „Alarme“ in der Knowledge Base findest du Tipps zur Fehlersuche.