Beim Umgang mit KPIs fühlt man sich schnell an den Mathelehrer erinnert, der auf eine Zahl als Antwort grundsätzlich konterte: „5 was? Äpfel? Birnen? Tomaten?“ Ja, dieser schnippische Kommentar hat wohl viele von uns zur Weißglut gebracht. Heute wissen wir, dass der Mathelehrer sich zwar dumm gestellt, aber auch Recht hatte. Denn was hat er da genau gefordert? Kontext!
Doch selbst wenn wir jeder Zahl ihren Kontext mitgeben, ist das Ergebnis wohl unbequem, denn da stehen dann viele Zahlen schwarz auf weiß, wie in einer gefürchteten unformatierten Exceltapete.
Ein Beispiel gefällig? Priorisieren Sie das nötige Troubleshooting auf den ersten Blick:
DE/NUE |
13-05-2020 07:23:33 |
PENDING |
21654 |
1/2 |
DE/STR |
13-05-2020 07:23:43 |
UNKNOWN |
84073 |
2/8 |
FR/LYS |
13-05-2020 07:23:41 |
DOWN |
79234 |
n/a |
PL/WAW |
13-05-2020 07:23:33 |
OK |
12579 |
1/3 |
SE/ARN |
13-05-2020 07:23:34 |
OK |
15846 |
1/3 |
SE/GOT |
13-05-2020 07:23:36 |
PENDING |
83513 |
n/a |
US/NYC |
13-05-2020 07:23:38 |
WARNING |
94314 |
4/3 |
US/LAX |
13-05-2020 07:23:31 |
CRITICAL |
87654 |
3/3 |
DC/DC1 |
13-05-2020 07:23:40 |
PENDING |
99653 |
1/8 |
DC/DC2 |
13-05-2020 07:23:33 |
PENDING |
99646 |
n/a |
Ein Mensch kann da kaum den Überblick behalten. Gehen wir also einen Schritt weiter in Richtung Überblick. Stellen wir uns ein Unternehmen mit einigen Standorten weltweit vor, welches eine eigene IT betreibt, und spicken wir mal in diese IT. Die Administratoren haben einige große Monitore an ihrer Wand, auf denen sie permanent den Status der verschiedensten Systeme überwachen können. Das ist nicht grundsätzlich anders als die kleine fiktive Tabelle oben, aber geht dann doch einen entscheidenden Schritt weiter. Ist der Tunnel nach Warschau gerade „down“? Die Zeile war eben noch signalrot, aber das Problem konnte direkt gelöst werden und sie ist wieder grün. Reicht der Festplattenplatz auf dem Storage noch? Ja, die Zeile ist auch grün. Dafür wird offenbar die Leitungsperformance in New York schlechter, der Indikator ist von grün auf gelb umgesprungen. Möglich, dass sich da gerade alle Kollegen einloggen. Wenn sich das in den nächsten paar Minuten nicht erholt, muss jemand die Lage analysieren und ggf. eingreifen.
Nebenan bei den Kollegen vom First Level Support zeigt der nächste große Bildschirm für alle sichtbar die Länge der Warteschlange. Aktuell ist es ruhig, sodass auch Zeit bleibt, ein paar Rechner zu installieren. Sobald die Anrufer aber länger als 30 Sekunden warten müssen, wird der „Wartezeitbalken“ erst grau, dann rot, und der Teamleiter kann weitere Kollegen in die Telefonie holen. Zu wem gerade keine Anrufe geroutet werden, sieht man natürlich auch auf dem Monitor.
Beide Systeme, sowohl das Monitoringsystem der Administratoren als auch das Call-Center-System, sind so konfiguriert, dass Grenzwerte für einzelne Messpunkte angegeben wurden. In welchem Rahmen muss sich die Latenz des Pings nach New York bewegen, damit der Wert grün erscheint? Ab wann muss gelb angezeigt werden? Und wann rot? Dabei sind solche Grenzwerte nicht generisch, sondern können pro beurteiltem Sachverhalt anders sein. Wenn die Konzernzentrale in Nürnberg Daten mit dem Standort in München austauscht, geht das natürlich erheblich schneller, als wenn Nürnberg Daten nach New York schickt. Die Warnschwellen sind da also entsprechend unterschiedlich definiert.