SLA / SLO – Verfügbarkeit professionell definieren und absichern
1. Einordnung & strategische Bedeutung
Uptime und Verfügbarkeit sind keine technischen Nebenkennzahlen, sondern geschäftskritische Steuerungsgrößen. Sie definieren, wie zuverlässig IT-Services bereitgestellt werden und wie belastbar ein IT-Dienstleister tatsächlich arbeitet.
Für Venasty Systems sind SLA und SLO nicht primär Vertragsformeln, sondern Werkzeuge zur Qualitätssicherung, Risikokontrolle und transparenten Kundenkommunikation.
2. Grundbegriffe und klare Abgrenzung
2.1 Uptime
Uptime beschreibt den reinen technischen Verfügbarkeitszustand eines Systems oder Dienstes. Sie beantwortet ausschließlich die Frage: „Ist der Service erreichbar, ja oder nein?“
2.2 Verfügbarkeit
Verfügbarkeit ist weiter gefasst als Uptime. Sie berücksichtigt neben der technischen Erreichbarkeit auch:
- Funktionsfähigkeit
- Antwortzeiten
- Fehlerfreiheit
- Nutzerwahrnehmung
3. SLA – Service Level Agreement
Ein SLA ist eine vertraglich definierte Mindestleistung, die ein IT-Dienstleister gegenüber einem Kunden zusichert. Es handelt sich um eine juristische und organisatorische Vereinbarung, nicht um ein Monitoring-Tool.
3.1 Typische Inhalte eines SLA
- Verfügbarkeitsziel (z. B. 99,9 %)
- Messmethode
- Messzeitraum
- Reaktionszeiten
- Eskalationsstufen
- Sanktionen bei Nichteinhaltung
3.2 Typische SLA-Verfügbarkeiten
- 99,0 % ≈ 7,2 Stunden Ausfall / Monat
- 99,5 % ≈ 3,6 Stunden Ausfall / Monat
- 99,9 % ≈ 43 Minuten Ausfall / Monat
- 99,99 % ≈ 4 Minuten Ausfall / Monat
4. SLO – Service Level Objective
SLOs sind interne Zielwerte, die oberhalb des SLA angesetzt werden. Sie dienen der operativen Steuerung und stellen sicher, dass vertragliche Zusagen nicht „auf Kante“ gefahren werden.
4.1 Warum SLOs zwingend notwendig sind
- Puffer gegenüber SLA-Verletzungen
- Frühzeitige Eskalation
- Qualitätskontrolle im Tagesbetrieb
- Interne Leistungsbewertung
4.2 Praxisbeispiel
- SLA: 99,9 % Verfügbarkeit
- SLO: 99,95 % interne Zielverfügbarkeit
5. SLA vs. SLO – saubere Trennung
| Merkmal | SLA | SLO |
|---|---|---|
| Zielgruppe | Kunde | Interner Betrieb |
| Vertraglich bindend | Ja | Nein |
| Zweck | Absicherung | Steuerung |
6. Messmethoden für Verfügbarkeit
Die Messmethode ist entscheidend für die Aussagekraft eines SLA. Unklare Messungen führen zwangsläufig zu Konflikten.
6.1 Externes Monitoring
- Messung aus Kundensicht
- Unabhängig vom internen Systemzustand
- Hohe Aussagekraft
6.2 Internes Monitoring
- Systemnahe Metriken
- Detailtiefe für Fehleranalyse
- Nicht SLA-relevant ohne externe Validierung
7. Typische Fehler bei SLA-Definitionen
- Keine klare Definition von „Ausfall“
- Wartungsfenster nicht geregelt
- Messpunkte nicht dokumentiert
- SLA = SLO (kritischer Anfängerfehler)
8. Wartungsfenster und geplante Downtimes
Professionelle SLAs definieren explizit:
- Geplante Wartungsfenster
- Ankündigungsfristen
- Ausschluss aus der SLA-Berechnung
9. Monitoring als Grundlage für SLA-Nachweise
Ohne sauberes Monitoring sind SLA-Zusagen wertlos. Monitoring liefert:
- Objektive Messdaten
- Historische Nachweise
- Audit-Fähigkeit
- Transparente Reports
10. Fehlerbilder im Betrieb
- Service ist erreichbar, aber unbenutzbar
- Monitoring misst intern „OK“, extern „Down“
- Unklare SLA-Auswertung bei Teilausfällen
11. Fehleranalyse & Behebung
- Messpunkte überprüfen
- Definitionen nachschärfen
- SLA-Reports regelmäßig validieren
- Monitoring-Logik testen (Fail-Simulation)
12. Vorteile sauber definierter SLA/SLO-Strukturen
- Rechtssicherheit
- Planbarer Betrieb
- Vertrauen auf Kundenseite
- Klare interne Steuerung
13. Nachteile und Grenzen
- Initial hoher Abstimmungsaufwand
- Komplexität bei verteilten Systemen
- Fehlinterpretationen bei schlechter Definition
14. Best Practices – Venasty Systems Standard
- SLA immer konservativ formulieren
- SLO immer höher ansetzen als SLA
- Messmethoden dokumentieren
- SLA-Daten regelmäßig reviewen
15. Zusammenfassung
SLA und SLO sind keine Formalitäten, sondern zentrale Steuerungsinstrumente. Professioneller IT-Betrieb beginnt dort, wo Verfügbarkeit nicht gehofft, sondern definiert, gemessen und aktiv gesteuert wird.