August 26, 2025

Observability mit Dr. Heinrich Hartmann von Zalando #91

Listen Later

1 hour 3 minutes

Was passiert eigentlich in einem komplexen System wie der E-Commerce-Plattform von Zalando, wenn ein Fehler auftritt? Um diese Frage zu beantworten, sprechen wir mit Heinrich Hartmann, Senior Principal SRE bei Zalando, über die Disziplin der Observability.

Es geht darum, nicht nur zu wissen, dass etwas kaputt ist, sondern warum. Das Fundament dafür bilden die drei Säulen: Logs (Was ist passiert?), Metriken (Wie schnell war es?) und Traces (Wo war es?). Heinrich erklärt, wie man mit Distributed Tracing eine einzelne Anfrage auf ihrer Reise durch Dutzende von Microservices verfolgt, um die Nadel im Heuhaufen zu finden.

Wir diskutieren außerdem Best Practices für Logging, wie man im Ernstfall bei einem Incident reagiert und wie man mit SLOs (Service Level Objectives) und cleveren Alerts von einem reaktiven zu einem proaktiven Umgang mit Fehlern kommt. Ein kurzer Blick auf den Standard OpenTelemetry rundet das Gespräch ab.

Links zur Folge

Heinrichs Website https://heinrichhartmann.com/

Heinrich auf LinkedIn https://de.linkedin.com/in/heinrich-hartmann-b524a076

Conversations about Software Engineering Podcast mit Heinrich https://www.case-podcast.org/

OpenTelemetry https://opentelemetry.io/

------

Einfach Komplex ist ein Podcast von Heisenware.

Alle Infos und Kontakte findest du

unter heisenware.com

und im Linktree ⁠⁠⁠https://linktr.ee/heisenware

------

Heinrich, Burkhard und Gerrit sprechen heute über:

(00:00:00) Intro und Vorstellung Heinrich

(00:02:00) Logs, Metriken, Traces

(00:10:00) Distributed Tracing

(00:32:00) Logging Best Practices

(00:37:00) Verfügbarkeit & Incident Response

(00:48:00) SLOs, Alerts & Incident Detection

(00:58:00) OpenTelemetry

(01:01:00) Ausblick

...more

View all episodes

View all episodes

Download on the App Store

Download on the App Store

Get it on Google Play

Einfach Komplex – Der Software- und IT-Podcast

By heisenware.com

August 26, 2025

Observability mit Dr. Heinrich Hartmann von Zalando #91

Listen Later

1 hour 3 minutes

Was passiert eigentlich in einem komplexen System wie der E-Commerce-Plattform von Zalando, wenn ein Fehler auftritt? Um diese Frage zu beantworten, sprechen wir mit Heinrich Hartmann, Senior Principal SRE bei Zalando, über die Disziplin der Observability.

Es geht darum, nicht nur zu wissen, dass etwas kaputt ist, sondern warum. Das Fundament dafür bilden die drei Säulen: Logs (Was ist passiert?), Metriken (Wie schnell war es?) und Traces (Wo war es?). Heinrich erklärt, wie man mit Distributed Tracing eine einzelne Anfrage auf ihrer Reise durch Dutzende von Microservices verfolgt, um die Nadel im Heuhaufen zu finden.

Wir diskutieren außerdem Best Practices für Logging, wie man im Ernstfall bei einem Incident reagiert und wie man mit SLOs (Service Level Objectives) und cleveren Alerts von einem reaktiven zu einem proaktiven Umgang mit Fehlern kommt. Ein kurzer Blick auf den Standard OpenTelemetry rundet das Gespräch ab.

Links zur Folge

Heinrichs Website https://heinrichhartmann.com/

Heinrich auf LinkedIn https://de.linkedin.com/in/heinrich-hartmann-b524a076

Conversations about Software Engineering Podcast mit Heinrich https://www.case-podcast.org/

OpenTelemetry https://opentelemetry.io/

------

Einfach Komplex ist ein Podcast von Heisenware.

Alle Infos und Kontakte findest du

unter heisenware.com

und im Linktree ⁠⁠⁠https://linktr.ee/heisenware

------

Heinrich, Burkhard und Gerrit sprechen heute über:

(00:00:00) Intro und Vorstellung Heinrich

(00:02:00) Logs, Metriken, Traces

(00:10:00) Distributed Tracing

(00:32:00) Logging Best Practices

(00:37:00) Verfügbarkeit & Incident Response

(00:48:00) SLOs, Alerts & Incident Detection

(00:58:00) OpenTelemetry

(01:01:00) Ausblick

...more

More shows like Einfach Komplex – Der Software- und IT-Podcast

Bits und so by Undsoversum GmbH

Bits und so

26 Listeners

c’t uplink - der IT-Podcast aus Nerdistan by c’t Magazin

c’t uplink - der IT-Podcast aus Nerdistan

10 Listeners

heiseshow by heise online

heiseshow

2 Listeners

Computer und Kommunikation by Deutschlandfunk

Computer und Kommunikation

9 Listeners

digital kompakt by Joel Kaczmarek

digital kompakt

4 Listeners

kurz informiert by heise online by heise online

kurz informiert by heise online

2 Listeners

Doppelgänger by Philipp Glöckler, Philipp Klöckner

Doppelgänger

12 Listeners

F.A.Z. Künstliche Intelligenz by Frankfurter Allgemeine Zeitung

F.A.Z. Künstliche Intelligenz

0 Listeners

Aha! Zehn Minuten Alltags-Wissen by WELT

Aha! Zehn Minuten Alltags-Wissen

27 Listeners

KI verstehen by Deutschlandfunk

KI verstehen

12 Listeners

Der KI-Podcast by ARD

Der KI-Podcast

19 Listeners

KI-Update – ein heise-Podcast by Isabel Grünewald, heise online

KI-Update – ein heise-Podcast

5 Listeners

Passwort - der Podcast von heise security by Dr. Christopher Kunz, Sylvester Tremmel

Passwort - der Podcast von heise security

3 Listeners

Handelsblatt KI-Briefing - Das News-Update zu Künstlicher Intelligenz by Larissa Holzki

Handelsblatt KI-Briefing - Das News-Update zu Künstlicher Intelligenz

0 Listeners

Wie geht's? mit Robin Gosens by Norddeutscher Rundfunk

Wie geht's? mit Robin Gosens

2 Listeners