Korrelation ist nicht gleich Kausalität, und wer fundierte Entscheidungen treffen will, braucht mehr als gute Vorhersagen. In dieser Folge geht es um Confounder, Spurious Correlations und die Frage, wann Machine Learning kausale Einsichten liefern kann. Mit dabei: DoubleML als Brücke zwischen klassischer Statistik und Machine Learning.
Unterscheidung zwischen Vorhersage und Intervention: Nur Kausalität beantwortet die "Was-wäre-wenn?"-FragePraxisbeispiele: Bugs & Discounts, Eiskonsum & Kriminalität, Salzgehalt & FlussmengeWichtig: Confounder identifizieren und herausrechnen, z. B. durch ZeitreihenzerlegungEinführung in Double ML: ML-Modelle für Response und Treatment, Effektschätzung über ResiduenHerausforderungen: Overfitting-Bias, Regularisierung, verzerrte Effekte bei hoher KomplexitätAlternativen & Ergänzungen: A/B-Tests, strukturelle Gleichungsmodelle, KausaldiagrammeFazit: Vorsicht bei Spurious Correlations, Ceteris-paribus-Fallen und Feature-Interpretation - Kausalität braucht Kontext und MethodeBlogartikel von Scott Lundberg:
Be Careful When Interpreting Predictive Models in Search of Causal Insights
https://medium.com/data-science/be-careful-when-interpreting-predictive-models-in-search-of-causal-insights-e68626e664b6
ICECREAM-Datensatz (verfügbar über das tsapp R-Paket):
https://search.r-project.org/CRAN/refmans/tsapp/html/ICECREAM.html
Victor Chernozhukov et al. (2018):
Double/debiased machine learning for treatment and structural parameters, The Econometrics Journal, Volume 21, Issue 1
https://doi.org/10.1111/ectj.12097
Matheus Facure Alves (2022):
Causal Inference for The Brave and True (kostenfreies Online-Buch)
https://matheusfacure.github.io/python-causality-handbook/landing-page.html
DoubleML (Python & R):
https://docs.doubleml.org/stable/index.html
EconML (Microsoft Research):
https://econml.azurewebsites.net/index.html
Causal ML (Uber Engineering):
https://causalml.readthedocs.io/en/latest/
Vortragsfolien von Prof. Dr. Steffen Wagner:
"Navigating the Ocean of Correlations to the Islands of Causality – Time Series Analyses at its Best", gehalten bei der Machine Learning Week München 2024
https://de.slideshare.net/secret/aArFURFQSBxrzB
📬 Fragen, Feedback oder Themenwünsche?
Schreibt uns gern an:
[email protected]