Inhaltsverzeichnis
- Seminarbeschreibung
- Lernziele
- Seminarinhalte
- Praxisübungen
- Zielgruppe
- Voraussetzungen
- Methodik
Seminarbeschreibung
Das Seminar vermittelt eine schichtenübergreifende Methode zur Diagnose und Wiederherstellung von OSISM-Plattformen. Manager, Automation, Hosts, OpenStack, Ceph, Netzwerk, Identity und Telemetrie werden entlang von Symptomen, Zeitlinien und Abhängigkeiten untersucht.
Im Mittelpunkt steht die kontrollierte Bearbeitung unter Betriebsdruck: Auswirkung begrenzen, Evidenz sichern, Hypothesen prüfen, Service wiederherstellen und anschließend Ursache sowie dauerhafte Maßnahmen belastbar dokumentieren.
Lernziele
- Architektur, Abhängigkeiten und Betriebsziele im Themenfeld „Incident-Triage“ fachlich einordnen.
- Aufgaben im Bereich „Zeitlinie und Evidenz“ mit klaren Vorbedingungen und Prüfpunkten vorbereiten.
- Konfiguration und Umsetzung im Bereich „Manager und Automation“ nachvollziehbar und reproduzierbar durchführen.
- Betriebszustände im Bereich „OpenStack-Diagnose“ mit geeigneten technischen Prüfungen bewerten.
- Typische Fehlerbilder im Themenfeld „Ceph-Diagnose“ systematisch eingrenzen und sicher bearbeiten.
- Änderungen, Nachweise und wiederholbare Verfahren für „Netzwerk-Diagnose“ dokumentieren.
Seminarinhalte
Modul 1: Incident-Triage
- Ausgangslage, Ziel und Abhängigkeiten für Incident-Triage erfassen; dabei Symptom, Auswirkung, Beginn und betroffene Nutzer erfassen.
- Schweregrad, Verantwortliche und Kommunikationsrhythmus festlegen; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
- riskante Änderungen stoppen und Stabilisierung priorisieren; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
- Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.
Modul 2: Zeitlinie und Evidenz
- Ausgangslage, Ziel und Abhängigkeiten für Zeitlinie und Evidenz erfassen; dabei letzte Deployments, Konfigurationsänderungen und Alarme zusammentragen.
- Logs, Metriken, Request IDs und Jobausgaben sichern; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
- Zeitstempel und Ereignisreihenfolge über Systeme hinweg normalisieren; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
- Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.
Modul 3: Manager und Automation
- Ausgangslage, Ziel und Abhängigkeiten für Manager und Automation erfassen; dabei Jobstatus, Queue, Container und Ausführungsumgebung prüfen.
- ersten Automatisierungsfehler von Folgefehlern trennen; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
- sichere Wiederholung oder manuelle Stabilisierung entscheiden; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
- Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.
Modul 4: OpenStack-Diagnose
- Ausgangslage, Ziel und Abhängigkeiten für OpenStack-Diagnose erfassen; dabei API, Datenbank, Messaging und Agentenpfade unterscheiden.
- Scheduling-, Spawn-, Netzwerk- und Volumefehler eingrenzen; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
- Ressourcen- und Dienstzustand nach Wiederherstellung prüfen; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
- Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.
Modul 5: Ceph-Diagnose
- Ausgangslage, Ziel und Abhängigkeiten für Ceph-Diagnose erfassen; dabei Gesundheitswarnungen und betroffene Failure Domain bewerten.
- Clientwirkung, Recovery und Kapazitätslage korrelieren; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
- Wartungsflags und Wiederherstellungsmaßnahmen kontrolliert einsetzen; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
- Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.
Modul 6: Netzwerk-Diagnose
- Ausgangslage, Ziel und Abhängigkeiten für Netzwerk-Diagnose erfassen; dabei erwarteten Paketpfad vom Mandanten bis zum Underlay zeichnen.
- OVN-, OVS-, Host- und Switchzustände vergleichen; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
- MTU-, VLAN-, Routing-, ACL- und Bindingprobleme isolieren; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
- Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.
Modul 7: Identity und Zugriff
- Ausgangslage, Ziel und Abhängigkeiten für Identity und Zugriff erfassen; dabei Anmelde-, Rollen-, Token- und Zertifikatsfehler unterscheiden.
- Service- und Benutzeridentitäten getrennt prüfen; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
- Notfallzugriff ohne Verlust der Nachvollziehbarkeit einsetzen; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
- Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.
Modul 8: Recovery und Nachkontrolle
- Ausgangslage, Ziel und Abhängigkeiten für Recovery und Nachkontrolle erfassen; dabei kleinste wirksame Wiederherstellungsmaßnahme auswählen.
- Servicefunktion, Datenintegrität und Seiteneffekte testen; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
- temporäre Maßnahmen und Rest-Risiko transparent halten; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
- Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.
Modul 9: Post-Incident-Arbeit
- Ausgangslage, Ziel und Abhängigkeiten für Post-Incident-Arbeit erfassen; dabei technische Ursache und begünstigende Faktoren analysieren.
- Runbooks, Alarme, Tests und Architekturkontrollen verbessern; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
- Maßnahmen mit Verantwortung und Termin nachverfolgen; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
- Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.
Praxisübungen
- Planungsübung zu Incident-Triage mit Zielbild, Abhängigkeiten und Abnahmekriterien.
- Konfigurationsübung zu Manager und Automation einschließlich Vorprüfung und kontrollierter Umsetzung.
- Betriebsübung zu Ceph-Diagnose mit Statusprüfung, Messwerten und dokumentierter Entscheidung.
- Störungsszenario zu Post-Incident-Arbeit mit Triage, Ursachenprüfung, Wiederherstellung und Nachtest.
- Dokumentationsübung: Aus den Arbeitsschritten entsteht ein wiederverwendbares Runbook mit Verantwortlichkeiten und Rückfallpunkten.
Zielgruppe
On-Call- und Betriebsteams, Senior-Administratoren, SRE, technischer Second- und Third-Level-Support sowie Incident Manager.
Voraussetzungen
Gute praktische Kenntnisse in Linux und Netzwerken sowie Grundkenntnisse von OSISM, OpenStack und Ceph. Erfahrung mit Logs und Monitoring wird vorausgesetzt.
Methodik
Fachvortrag, moderierte Architekturarbeit, Demonstrationen und praktische Übungen am System. Jeder Arbeitsblock folgt der Reihenfolge Analyse, Vorbereitung, Umsetzung, Prüfung und Dokumentation. Konfigurationsänderungen werden vor der Ausführung kontrolliert und nach der Ausführung durch definierte Funktionsprüfungen bestätigt.
Seminar und Anbieter vergleichen
Öffentliche Schulung
Diese Seminarform ist auch als Präsenzseminar bekannt und bedeutet, dass Sie in unseren Räumlichkeiten von einem Trainer vor Ort geschult werden. Jeder Teilnehmer hat einen Arbeitsplatz mit virtueller Schulungsumgebung. Öffentliche Seminare werden in deutscher Sprache durchgeführt, die Unterlagen sind teilweise in Englisch.
Inhausschulung
Diese Seminarform bietet sich für Unternehmen an, welche gleichzeitig mehrere Teilnehmer gleichzeitig schulen möchten. Der Trainer kommt zu Ihnen ins Haus und unterrichtet in Ihren Räumlichkeiten. Diese Seminare können auf Deutsch – bei Firmenseminaren ist auch Englisch möglich – gebucht werden.
Webinar
Diese Art der Schulung ist geeignet, wenn Sie die Präsenz eines Trainers nicht benötigen, nicht reisen können und über das Internet an einer Schulung teilnehmen möchten.
Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner
-

Lucas Beich
Telefon: + 49 (221) 74740055
E-Mail: lucas.beich@seminar-experts.de -

Paul Goldschmidt
Telefon: + 49 (221) 74740055
E-Mail: paul.goldschmidt@seminar-experts.de
Seminardetails
| Dauer: | 3 Tage ca. 6 h/Tag, Beginn 1. Tag: 10:00 Uhr, weitere Tage: 09:00 Uhr |
| Preis: |
Öffentlich oder Live Stream: € 1.797 zzgl. MwSt. Inhaus: € 5.100 zzgl. MwSt. |
| Teilnehmeranzahl: | min. 2 - max. 8 |
| Teilnehmer: | On-Call- und Betriebsteams, Senior-Administratoren, SRE, technischer Second- und Third-Level-Support sowie Incident Manager. |
| Voraussetzungen: | Gute praktische Kenntnisse in Linux und Netzwerken sowie Grundkenntnisse von OSISM, OpenStack und Ceph. Erfahrung mit Logs und Monitoring wird vorausgesetzt. |
| Standorte: | Stream Live, Inhaus/Firmenseminar, Berlin, Bremen, Darmstadt, Dresden, Erfurt, Essen, Flensburg, Frankfurt, Freiburg, Friedrichshafen, Hamburg, Hamm, Hannover, Jena, Kassel, Köln, Konstanz, Leipzig, Luxemburg, Magdeburg, Mainz, München, Münster, Nürnberg, Paderborn, Potsdam, Regensburg, Rostock, Stuttgart, Trier, Ulm, Wuppertal, Würzburg |
| Methoden: | Vortrag, Demonstrationen, moderierte Architekturarbeit und praktische Übungen am System |
| Seminararten: | Öffentlich, Webinar, Inhaus, Workshop - Alle Seminare mit Trainer vor Ort, Webinar nur wenn ausdrücklich gewünscht |
| Durchführungsgarantie: | ja, ab 2 Teilnehmern |
| Sprache: | Deutsch - bei Firmenseminaren ist auch Englisch möglich |
| Seminarunterlage: | Dokumentation auf Datenträger oder als Download |
| Teilnahmezertifikat: | ja, selbstverständlich |
| Verpflegung: | Kalt- / Warmgetränke, Mittagessen (wahlweise vegetarisch) |
| Support: | 3 Anrufe im Seminarpreis enthalten |
| Barrierefreier Zugang: | an den meisten Standorten verfügbar |
| Weitere Informationen unter + 49 (221) 74740055 |
Seminartermine
Die Ergebnissliste kann durch Anklicken der Überschrift neu sortiert werden.
