Engineering Kiosk

#38 Monitoring, Metriken, Tracing, Alerting, Observability


Listen Later

Wie würde heutzutage ein moderner Logging, Metriken, Monitoring, Alerting und Tracing-Stack aussehen?

Im Infrastruktur-Bereich gibt es zu jedem Bereich etliche Tools. Cloud-Native ist das Buzzword der Stunde. In dieser Episode erzählt Andy, wie er einen modernen Stack für ein Side-Projekt für die Bereiche Logging, Metriken, Monitoring, Alerting und Tracing aufsetzen würde. Unter anderem geht es dabei um Fragen wie: Was sollte man eigentlich alles loggen? Wie kann man von einem Alert angerufen werden? Wie visualisiert man Daten in schönen Graphen? Brauchen wir Tracing? Und was ist Observability?

Bonus: Engineering Porn und Buzzword-Bingo.


Feedback (gerne auch als Voice Message)


Gerne behandeln wir auch euer Audio Feedback in einer der nächsten Episoden, einfach Audiodatei per Email oder WhatsApp Voice Message an +49 15678 136776


Unsere aktuellen Werbepartner findest du auf https://engineeringkiosk.dev/partners

 

Links
  • Episode #37 Mit IT-Büchern Geld verdienen? Wer liest überhaupt noch Bücher?: https://engineeringkiosk.dev/podcast/episode/37-mit-it-b%C3%BCchern-geld-verdienen-wer-liest-%C3%BCberhaupt-noch-b%C3%BCcher/?pkn=shownotes 
  • Episode #17 Was können wir beim Incident Management von der Feuerwehr lernen?: https://engineeringkiosk.dev/podcast/episode/17-was-k%C3%B6nnen-wir-beim-incident-management-von-der-feuerwehr-lernen/?pkn=shownotes 
  • Sentry: https://sentry.io/
  • Datadog: https://www.datadoghq.com/
  • Splunk: https://www.splunk.com/
  • Elasticsearch: https://www.elastic.co/de/enterprise-search/
  • Logstash: https://github.com/elastic/logstash
  • Kibana: https://github.com/elastic/kibana
  • OpenSearch: https://opensearch.org/
  • Elastic Cloud: https://www.elastic.co/de/cloud/
  • Aiven: https://aiven.io/
  • Fluentd: https://www.fluentd.org/
  • Amazon S3 und S3 Glacier: https://aws.amazon.com/de/s3/
  • Amazon Athena: https://aws.amazon.com/de/athena/
  • Prometheus: https://prometheus.io/
  • VictoriaMetrics: https://github.com/VictoriaMetrics/VictoriaMetrics
  • InfluxDB: https://www.influxdata.com/
  • M3 Metrics Engine: https://m3db.io/
  • Prometheus Node Exporter: https://github.com/prometheus/node_exporter
  • Grafana: https://github.com/grafana/grafana
  • PromQL: https://prometheus.io/docs/prometheus/latest/querying/basics/
  • OpsGenie: https://www.atlassian.com/de/software/opsgenie
  • Jaeger: https://www.jaegertracing.io/
  • Zipkin: https://zipkin.io/
  • OpenTracing: https://opentracing.io/
  • OpenTelemetry: https://opentelemetry.io/
  • yak shaving: https://seths.blog/2005/03/dont_shave_that/
  • Cloud Native Computing Foundation: https://www.cncf.io/


Sprungmarken

(00:00:00) Intro

(00:00:50) Wolfgangs MySQL-Buch

(00:02:11) Heutiges Thema: Wie würde Andy die Themen Monitoring, Alerting, Metriken und Logging bei einem Side Projekt angehen?

(00:04:49) Warum brauchst du Logging, Monitoring, Metriken und Tracing?

(00:07:29) Logging von Exceptions, Warnings und anderen Fehler, Logging und der ELK-Stack

(00:16:06) Was sollte man eigentlich alles loggen?

(00:19:22) Log-Rotation und Log-Retention auf Object-Storage

(00:27:30) Metriken mit Prometheus

(00:31:46) Visualisierung von Metriken mit Grafana

(00:34:25) Intelligente Alerting Systeme und die richtigen Schwellenwerte finden

(00:38:47) Alerts senden und anrufen lassen

(00:43:22) Tracing: Was ist das und brauchen wir das?

(00:48:49) Was ist Observability?

(00:51:42) Iterativer Aufbau seiner Plattform und Alternativen

(00:54:49) Keine bezahlte Werbung

(00:55:14) Outro und Feedback


Hosts
  • Wolfgang Gassler (https://twitter.com/schafele)
  • Andy Grunwald (https://twitter.com/andygrunwald)


Feedback (gerne auch als Voice Message)
...more
View all episodesView all episodes
Download on the App Store

Engineering KioskBy Wolfgang Gassler, Andy Grunwald