In der aktuellen Episode nehmen Jochen Fiedler und Esther Packullat vom Streuspanne-Team gemeinsam mit Gast Marcel Hensel, eine Studie unter die Lupe, die verspricht, Weinqualität per Machine Learning allein anhand von Inhaltsstoffen vorhersagen zu können. Marcel ist Postdoc am Lehrstuhl Digital Farming der Rheinland-Pfälzische Technische Universität Kaiserslautern-Landau RPTU. Sie zeigen gemeinsam auf, warum die methodischen Ansätze der Studie grandios danebengehen.
Die Idee klingt spannend: Systematische, blinde Verkostungen treffen auf umfassende Laborwerte. Dabei wurden zahlreiche chemische Parameter wie Aromastoffe, Farbstoffe und pH-Wert gemessen, um Rückschlüsse auf die sensorische Qualität des Weins zu ziehen. Doch bei genauerem Blick offenbaren sich handfeste Fehler, die die Ergebnisse leider komplett entwerten.
Was erwartet Dich in dieser Episode?
• Die Grundfrage: Gibt es objektive Weinqualität? Wie könnte man das wissenschaftlich erfassen?
• Methodische Mängel: Wir beleuchten die Probleme der Studie, einschließlich der willkürlichen Klassifikation von Weinen und das Fehlen einer normierten Qualität.
• Datensatz-Problematik: Mit nur 18 Weinen und der Erzeugung synthetischer Daten – wie kann das funktionieren?
• Die Rolle von Machine Learning: Der Einsatz von ML-Algorithmen und die Risiken, die mit einer schlechten Datenbasis einhergehen.
• Wissenschaftliche Standards: Einblicke in die Herausforderungen der akademischen Publikationskultur und wie sie zu minderwertiger Forschung führen kann.
Was hier als wissenschaftliche Forschung daherkommt, ist am Ende eher eine hübsch verpackte Statistik-Falle – und taugt leider kaum als Grundlage für belastbare Aussagen.
Reinhören und die Wahrheit mit uns entkorken!
Wir erwähnen folgende Links, Artikel und Podcasts in der aktuellen Folge:
P. Bhardwaj, P. Tiwari, K. Olejar Jr et al. (2022). A Machine Learning Application in Wine Quality Prediction. Machine Learning with Applications. 8.
https://s.fhg.de/wein-ki
Zurückspulen lohnt sich: Frühere Episoden
• Podcast »Streuspanne – Künstliche Intelligenz und Statistik – Ist KI nur glorifizierte Statistik? KI hieß mal ML« 👉 www.itwm.fraunhofer.de /ki-statistik
• Podcast »Streuspanne – Künstliche Intelligenz und Statistik – Neuronale Netze: Wie Maschinen das Denken lernen« 👉 www.itwm.fraunhofer.de/ki-neuronale-netze
Gestalte unseren Podcast mit!
Du hast ein Zahlenphänomen entdeckt, das wir besprechen sollen? Oder eine Statistik in den Medien gelesen, die wir in der »Streuspanne« einmal genauer unter die Lupe nehmen sollen? Dann melde Dich gerne über presse(at)itwm.fraunhofer.de bei uns!