Infrastruktur

Monitoring und Observability für SaaS

Logs, Metrics, Traces — wie Sie Ihre SaaS-Anwendung richtig überwachen. Ein praxisnaher Vergleich von Self-Hosted vs Managed Lösungen für den DACH-Raum.

Christoph Dietrich2026-04-2912 Min. Lesezeit

Monitoring und Observability für SaaS

Warum Monitoring nicht optional ist

Jede SaaS-Anwendung, die in Produktion läuft, braucht Observability. Das ist keine Frage des "ob", sondern des "wie". Ohne Monitoring fliegen Sie blind: Sie erfahren von Ausfällen durch Kunden-E-Mails statt durch Alerts. Sie debuggen Probleme mit console.log statt mit strukturierten Traces.

Im DACH-Raum kommt eine weitere Dimension hinzu: Wenn Sie personenbezogene Daten in Logs oder Traces erfassen, greifen DSGVO-Anforderungen. Das beeinflusst die Toolwahl erheblich.

5,6x

Schnellere Fehlerbehebung

Mit strukturiertem Observability vs. Log-Suche

99,9%

Uptime-Erwartung

8,7h Downtime pro Jahr maximal

€340k

Kosten pro Stunde Ausfall

Durchschnitt für mittelständische SaaS

Die drei Säulen der Observability

1. Logs — Was ist passiert?

Logs sind die Grundlage. Jede Anwendung produziert sie. Die Frage ist, wie Sie sie sammeln, strukturieren und durchsuchbar machen.

Strukturierte Logs sind Pflicht. JSON statt Plaintext. Request-IDs in jedem Log-Eintrag. Severity-Level konsequent nutzen.

// Schlecht
console.log("User hat sich eingeloggt")

// Gut
logger.info({ userId: "usr_123", action: "login", ip: "redacted", rid: "req_abc" })

Tools: ELK Stack (Elasticsearch, Logstash, Kibana), Grafana Loki, Datadog Logs

2. Metrics — Wie performt das System?

Metrics sind numerische Zeitreihen: CPU-Auslastung, Response Times, Error Rates, Queue Lengths. Sie zeigen Trends und ermöglichen Alerting.

Die vier goldenen Signale (nach Google SRE):

  • Latency — Wie lange dauern Requests?
  • Traffic — Wie viele Requests kommen rein?
  • Errors — Wie viele Requests schlagen fehl?
  • Saturation — Wie ausgelastet ist das System?

Tools: Prometheus + Grafana, Datadog Metrics, CloudWatch

3. Traces — Wo ist der Bottleneck?

Distributed Tracing verfolgt einen Request durch alle Services. Unverzichtbar bei Microservices, aber auch bei Monolithen mit externen APIs wertvoll.

Tools: Jaeger, Grafana Tempo, Datadog APM, OpenTelemetry (Standard)

Self-Hosted vs Managed: Der Vergleich

Self-Hosted (Grafana + Prometheus + Loki)

Vorteile

  • Volle Kontrolle über Daten — DSGVO-konform auf eigenen Servern
  • Keine laufenden Lizenzkosten, nur Infrastruktur
  • Keine Vendor-Abhängigkeit, Open-Source-Stack
  • Anpassbar an spezifische Anforderungen

Nachteile

  • Setup und Wartung brauchen DevOps-Kompetenz
  • Skalierung der Monitoring-Infrastruktur selbst managen
  • Kein SLA — wenn Grafana ausfällt, müssen Sie selbst fixen
  • Initialer Zeitaufwand: 2-4 Wochen für Production-Ready-Setup

Managed (Datadog / New Relic / Grafana Cloud)

Vorteile

  • Sofort einsatzbereit, kein Infrastruktur-Management
  • Integrierte Dashboards, Alerting, APM aus einer Hand
  • Automatische Skalierung der Monitoring-Plattform
  • Enterprise-Support und SLAs verfügbar

Nachteile

  • Hohe Kosten bei wachsendem Datenvolumen
  • Daten liegen beim Anbieter — DSGVO-Prüfung nötig
  • Vendor Lock-in bei proprietären Agents und Queries
  • Datadog-Rechnung wird oft zur zweitgrößten Cloud-Ausgabe

Kosten im Vergleich

Die Kosten variieren stark je nach Datenvolumen. Hier ein realistisches Szenario für eine SaaS mit 5.000-10.000 aktiven Nutzern:

Monatliche Monitoring-Kosten (5k-10k Nutzer)

Self-Hosted (Hetzner CX41 + Storage)~€65/Mo
Grafana Cloud (Pro)~€180/Mo
Datadog (Pro, 10 Hosts)~€450/Mo
New Relic (Pro)~€350/Mo

Wichtig: Bei Datadog und New Relic explodieren die Kosten mit der Anzahl der Hosts und dem Log-Volumen. Ein Team, das bei 10 Hosts startet, zahlt bei 50 Hosts schnell das Fünffache.

Error Tracking: Sentry

Sentry verdient eine eigene Erwähnung. Es ist kein vollständiges Observability-Tool, aber das beste Error-Tracking auf dem Markt.

Was Sentry kann:

  • Automatisches Grouping ähnlicher Fehler
  • Source Maps für Frontend-Errors
  • Performance Monitoring (Transactions)
  • Release Tracking (welches Deployment hat den Bug eingeführt?)
  • Cron Monitoring (Job-Überwachung)

Kosten: Kostenlos bis 5k Events/Monat. Team-Plan ab $26/Monat. Für die meisten Startups im Free Tier ausreichend.

DSGVO: Sentry bietet EU-Datenresidenz (Frankfurt) im Business-Plan. Alternativ: Self-Hosted Sentry (braucht ~4 GB RAM).

Uptime Monitoring

Externe Uptime-Checks sind die einfachste Versicherung. Sie prüfen von außen, ob Ihre Anwendung erreichbar ist.

Empfehlungen:

  • Better Stack (ehem. Better Uptime) — Status Pages + Alerting, EU-Checks möglich. Ab $24/Mo.
  • Checkly — Synthetische Monitoring + API Checks mit Playwright. Von einem Berliner Team gebaut. Ab $30/Mo.
  • UptimeRobot — Einfach und günstig. Free Tier mit 50 Monitoren.

Alerting: Weniger ist mehr

Das größte Problem bei Monitoring ist nicht zu wenig Alerting, sondern zu viel. Alert Fatigue führt dazu, dass kritische Benachrichtigungen ignoriert werden.

Alerting-Strategie:

  1. P1 (Sofort, Telefon/PagerDuty): Service down, Datenbank nicht erreichbar, Error Rate > 10%
  2. P2 (Slack, innerhalb 1h): Hohe Latenz, Disk > 80%, Certificate expiry < 7 Tage
  3. P3 (E-Mail, nächster Werktag): Erhöhte Error Rate, langsame Queries, Dependencies degraded

Regel: Wenn ein Alert in 30 Tagen nie zu einer Aktion geführt hat, löschen oder stumm schalten.

Implementierungsreihenfolge

Nicht alles auf einmal. Bauen Sie Observability schrittweise auf:

Empfohlene Implementierungsreihenfolge

Woche 1-2

Strukturierte Logs + Uptime Monitoring

JSON-Logging, Request-IDs, UptimeRobot oder Better Stack einrichten

Woche 3-4

Error Tracking mit Sentry

Frontend + Backend Integration, Source Maps, Release Tracking

Monat 2

Metrics + Dashboards

Prometheus/Grafana oder Managed-Lösung, die vier goldenen Signale

Monat 3-4

Distributed Tracing

OpenTelemetry Integration, Jaeger oder Grafana Tempo

Monat 5+

Alerting-Optimierung + Runbooks

Alert-Regeln verfeinern, Incident-Response dokumentieren

DSGVO und Monitoring

Logs enthalten fast immer personenbezogene Daten: IP-Adressen, User-IDs, E-Mails in Error Messages. Daraus folgt:

  • Log-Retention begrenzen (30-90 Tage reichen für die meisten Fälle)
  • PII reduzieren — IP-Adressen anonymisieren, E-Mails nicht in Logs schreiben
  • DPA abschließen wenn Sie Managed-Tools mit EU-Daten nutzen
  • Self-Hosted bevorzugen wenn maximale Datenkontrolle gefordert ist

Fazit: Pragmatisch starten

Für SaaS-Startups im DACH-Raum empfehle ich diesen Stack:

  1. Sentry (Free/Team) für Error Tracking
  2. Better Stack oder Checkly für Uptime Monitoring
  3. Grafana + Prometheus auf Hetzner für Metrics (Self-Hosted)
  4. Grafana Loki für Logs (Self-Hosted oder Grafana Cloud)

Wer das initiale Setup nicht selbst stemmen will, kann das Monitoring als Teil eines Subscription-Development-Modells aufbauen lassen — Schritt für Schritt, ohne den laufenden Betrieb zu unterbrechen.

Gesamtkosten: unter €100/Monat für ein solides Setup. Das ist ein Bruchteil dessen, was eine Stunde ungeplanter Downtime kostet.


Verwandte Themen

Bereit loszulegen?

Buchen Sie ein kostenloses Erstgespräch.

Erstgespräch buchen

Wir suchen Senior Engineers

100% Remote, DACH

Wir respektieren Ihre Privatsphäre

Diese Website verwendet Cookies für essentielle Funktionen und optional für Analyse und Marketing. Datenschutzerklärung