Business

Fehleranalyse

Um Störungen schnell und nachhaltig beheben zu können, ist es wichtig, dass strukturiert vorgegangen wird. Dieser “Merkzettel” soll als Anregung dafür dienen, dass IT-Teams sich die Punkte notieren, die dabei unterstützen, Störungen strukturiert aufzunehmen, zu analysieren und schnellstmöglich einer nachhaltigen Lösung zuzuführen.

Der Start

  • Stelle das Ticket auf dich um, wenn du es in Arbeit nimmst (assignee + statuscategory “in progress”) damit nicht mehrere parallel – und ohne von einander zu wissen – dasselbe Thema bearbeiten.

Initiale Problembeschreibung

  • Kurze Zusammenfassung des Problems in eigenen Worten:
    Beschreibe das Symptom präzise, z. B. „Anwendung X startet auf meinem Laptop seit heute nicht mehr. Auch ein Rechnerneustart half nicht“.
  • Betroffene Systeme/Applikationen
    z. B. Software-Version, OS, Hardware (Hostname).
  • Auswirkungen
    Wer ist alles betroffen? Was bedeutet das für deren Arbeitsalltag?

Bereits analysierte Punkte

  • Erste Überprüfungen durchgeführt:
    • Netzwerkverbindungen geprüft? [LAN only/WiFi only/mit Tethering – Details]
    • Um welchen Account geht es? (BU account oder @oneqrew.com?)
    • Benutzerrechte/SSO-Status? [Ja/Nein – Details, z. B. Entra Conditional Access]
    • Logs eingesehen? [Ja/Nein – relevante Auszüge anhängen]
    • Originaltext der Fehlermeldung (copy/paste, Screenshots)
    • Basis-Checks (Neustart, Cache leeren, Anmeldung in anonymem Tab)? [Ja/Nein – Ergebnis]
  • Offene Fragen an Melder: [Liste zu beantwortender Rückfragen und zu liefernder Informationen, z. B. „Screenshot angefordert?“]​

Fehlerreproduktion und Eingrenzung

  • Schritte zur Reproduktion:
    1. [Schritt 1, z. B. „Anwendung starten.“]
    2. [Schritt 2]
    3. [Ergebnis: Tritt auf/nicht auf.]
  • Eingrenzung:
    • Tritt bei folgenden Usern auf? [Ja/Nein – getestet bei wem?]
    • Spezifische Bedingungen? [z. B. Nur nach Update, nur mobil.]
    • Workaround gefunden? [Ja/Nein – Beschreibung]​
    • gab/gibt es ggf. weitere Tickets zum Thema die gebündelt werden können um Parallelaufwände zu reduzieren oder aus denen wir lernen können?

z. B. anhand einer Jira Query

Kontext: Wer, Wann, Situation

Stelle sicher, dass der Kontext im Ticket nachvollziehbar ist.

  • Wer: Betroffene Person(en): [Namen, Rollen, Abteilungen, extakter user-account.]
  • Wann: Häufigkeit und Zeitpunkt: [z. B. „Nur montags ab 9 Uhr“, „Erst seit Update YY.MM.“]
  • Situation: Umstände: [z. B. „Nach VPN-Wechsel“, „In MS Teams Meeting“, „Bei hoher Last”, “nur im 2. OG”, “Nur im Wlan”, “nur an dieser docking-Station”]​

Erwartetes vs. Aktuelles Verhalten

  • Erwartetes Verhalten: [Beschreibe normgerecht, z. B. „App startet in <5s ohne Fehler.“]
  • Aktuelles Verhalten: [Genauer Unterschied, z. B. „Fehlermeldung ‚Access denied‘.“]
  • Referenz: [Link zu Dokumentation/Wissensdatenbank oder Standard.]​

Nach der Analyse

  • Priorität prüfen und ggf. korrigieren (Low/Med/High/Crit)
    bei Crit: warm-transfer zu (Name/Team)
Priorisierungsmatrix

Dokumentiere im Ticket

als Kommentar

  • was Du schon raus gefunden hast
  • was aktuell noch bei wem angefragt ist
  • welche Maßnahmen mit welchem Ergebnis vorgenommen wurden,
  • und was als nächste Maßnahmen bereits besprochen wurde
  • Setzte den korrekten Status und stelle sicher, dass das Ticket erfolgreich abgeschlossen werden kann. (weitere Bearbeitung, Delegation, Eskalation)