Intro (00:00:00)
Thema des Podcasts (00:00:18)
Willkommen zu unserer 27. Folge beim datenleben-Podcast, dem Podcast über Data Science.
Wir sind Helena und Janine und möchten mit euch die Welt der Daten erkunden.
Es wird immer wichtiger Daten in das Große Ganze einordnen zu können.
In unserem Podcast wollen wir deswegen Data Science anhand von Themen erklären, die uns alle betreffen.
Thema der Folge (00:00:38)
Eigentlich war für diese Folge das Thema Meeresspiegel bzw. Wasserspiegel angekündigtAber wie ihr wir hatten Urlaub und 50% von uns waren danach krank, das hat uns ein bisschen die eigentlichen Pläne zerrupftAm 04. Juli 2020 haben wir diesen Podcast das erste Mal auf die Welt losgelassenSeitdem haben wir über 24 Stunden Inhalt produziert; und! es sind viele Hörer*innen dazugekommenHallo ihr alle, wir freuen uns, dass ihr uns hörtWir wollen gleich ein bisschen den Blick zurück werfen und Helena erzählt nochmal, was Data Science ist und ob mensch das überhaupt braucht...Janine erzählt was wir hier eigentlich machen und warum wir das so machen, wie wir es tunUnd wir highlighten Folgen, die aus unserer Sicht einen guten Einstieg anbieten, weil sie sehr elementare Dinge/Probleme/whatever von Data Science aufzeigenWarum ist das Thema interessant? (00:02:20)
Das hier wird eine Art Überblicksfolge, weil datenleben jetzt zwei Jahre alt istData Science revisited: Folge 1 vielleicht ein bisschen geupdatet, aber vermutlich nicht ganz überlappend mit Folge 1Folge 1 wird immer noch am allermeisten gehört, aber da waren wir noch ganz frisch und vielleicht noch nicht so gutDeswegen nutzen wir das Jubiläum, für ein Update, auch für neue Hörer*innen, die dazu kommenEinspieler: Data Science und datenleben (00:02:59)
Stell dir vor du lebst in einer Welt voller Daten... oh wait...Stell dir vor du könnsten automatisiert diese Daten erfassen und auswerten... oh wait...Ich glaube wir brauchen uns diese dinge nicht vorstellen, sie sind längst Realität und für jede einzelne Generation wird das alles um so selbstverständlicherFrüher haben wir noch per Telefonzelle bescheid gegebenHeute können wir prinzipiell die Wege von Menschen ins kleinste Detail nachvollziehenDatenerhebung war noch nie so einfachAber damit geht auch Verantwortung einher... oh und nicht zu vergessen die Fähigkeit die Masse an Daten zu überblickenUnd das können Data Scientists für uns übernehmen, wenn wir als Gesellschaft zwischen den Datenpunkten zu ertrinken drohenData Science heißt für unsSich der Daten bewusst zu werdenDie Daten zu erheben und aufzubereitenDaten und ihre Kontexte kritisch betrachten zu könnenDas Messverfahren zu kennenMenschen dazu befähigen mittels Daten informierte Entscheidungen treffen zu könnenUnser Podcast soll Überblicke und Einsichten in die verschiedenen Themen von Data Science bietenMal am konkreten Alltag gezeigtMal an globalen Themen betrachtetUnd nebenbei auf wichtige Themen wissenschaftlicher und gesellschaftlicher Art eingehenThemen aufzeigen, die unser Leben, unsere Umwelt und unseren Alltag betreffen könnenWas machen wir hier eigentlich und warum so? (00:04:41)
vor 2 jahren haben wir diesen podcast gestartet und es macht uns immer noch spaßFolge 1 ist jetzt lange her, wir dachten, wir gucken uns dieses Thema nochmal kurz und knapp an für alle, die neu zum Podcast gekommen sind und nicht von Folge 1 ab alles nachhörenWer in unsere Folgen Historie schaut, könnte sich vielleicht Fragen, geht es wirklich um Data Science?Klar, wir sprechen zum Beispiel über Standarddatensätze oder Datenvisualisierung, das klingt schon sehr nach Data Science Aber warum auch über Klimawandel, Studien zu Drogen oder über Wahlumfragen reden?Weil Forschung immer Daten erhebt, die ausgewertet werden und weil Data Science sich damit beschäftigt WIE Daten ausgewertet werden könnenWir sind keine Klimaforscherinnen, keine Unfallexpertinnen...Aber unser Zugang zu den Themen basiert nicht darauf alles über die Disziplin zu wissen, mit der wir uns befassen, sondern anzusehen, wie mit den Daten umgegangen wird und werden kannIm Wesentlichen ist das auch die Arbeit von Data Scientists:Es gibt immer wieder neue Kontexte, neue Projekte, in die sich eingearbeitet werden mussEins bleibt dabei immer gleich: Die Expertise im Umgang mit DatenWie suchen wir die themen aus? Danach, was wir selbst an Interessen haben und was wir wichtig finden, dass sich Menschen darüber Gedanken machenWovon wir denken, dass es a) im Kontext Data Science spannend ist Und die b) gut illustrieren, wie Data Science mit unserem Leben, unseren Entscheidungen verzahnt istWir wollen dazu anregen auch auf Basis von Daten informierte Entscheidungen zu treffenEs ist nicht so leicht anhand von Informationen ein garantiertes Ergebnis vorherzusagenHelena hat Star Trek "Strange new Worlds" geguckt und findet die Herangehensweise der Vulkanier nicht zielführend, keine Entscheidungen zu treffen, wenn nicht alle Informationen vorliegen, denn oft gibt es diesen Zeitpunkt nicht, wo alles bekannt ist Nicht zu reagieren, auch wenn zeitkritisch reagiert werden muss, hat auch Einfluss auf das Ergebnis (Beispiel: Pandemie, Handeln war nötig, obwohl vieles anfangs noch unbekannt war)Helena widerspricht den vermeintlich extram logischen Vulkaniern, denn man muss auch mit unvollständigen Informationen informierte Entscheidungen treffenUnd das ist ein Kernpunkt von Data ScienceWas ist Data Science, braucht man das? (00:08:58)
Wir brauchen Data Science, weil wir so viele Daten haben, dass wir Menschen brauchen, die wissen, wie damit umzugehen ist Wir brauchen nicht nur Statistiker*innen, Datan Analysts, sondern auch Menschen, die die Daten erfassen, etc.Beispiel: Flugpläne optimieren, die richtige Frage formulieren, die dann zu einem passenden Ergebnis führt und mit Daten beantwortet werden kannAntworten müssen in einer verständlichen Sprache formuliert werdenProblem: Manchmal werden Dinge vorhergesagt, die nicht eintreffen, weil sich die Gegebenheiten geändert haben, ein Denkfehler dabei war, etc. damit muss man umgehen können'If you're considering going into this field, definitely consider how comfortable you are delivering results that aren't super clear-cut and that you may find out later turned out to be wrong! ' @BecomingDataSci, Twitter
Deutsch etwa: Wenn du vor hast im Bereich Data Science zu arbeiten, denk darüber nach, wie gern du auch Ergebnisse, die nicht so richtig eine klare Antwort geben, kommunizieren möchtest; vor allem, wenn die sich später als falsche herausstellenAlso wie Du damit umgehen kannst und dass du damit umgehen kannst, dich auch mal geirrt zu haben (sehr relevanter Punkt)Verschiede Subbereiche von Data Science Interview - SQL for Data Scientists, ab 33:55Data Analyst -> wertet Daten aus/arbeitet mit DatenData Engineer -> sammeln Rohdaten und verarbeiten so, dass die für andere nutzbar sindMachine Learning SpecialistHelena war im April auf einer Data Scienc Konferenz, da gab es einen Vortrag "Braucht man überhaupt noch Data Scientists"? Dr. Setareh Sadjadi: Do we really need Data Scientists?Überlegung dahinter: Vielleicht braucht es keine Data Scientists, weil es gibt ja die Spezialisierungen Der Vortrag behandelt die Frage, ob sich Data Science als Berufsfeld nicht in kürze selbst überholt hätteEin weiteres Argument ist, dass automatische Machine Learning Tools Leute ersetzen die selbst mit Daten arbeiten und es nur noch die Leute braucht die dann Ergebnisse anguckenAusserdem gäbe es mittlerweile so viele selbst ernannte Data Siencetists, dass der Markt gesättigt seiDie Vortragende selbst berichtet aber davon wie schwierig es ist überhaupt Data Scientists zu finden, daher hält sie das Argument für vorgeschoben dass schon zuviele gäbeUnd wer mit Machine Learning gearbeitet hat, weiß, dass es uns nicht so schnell überflüssig machen wird, wie manche Leute das gerne behauptenEntwicklung der Künstlichen Intelligenz ist viel langer als es nach außen den Anschein macht, es braucht hier noch den Menschen, der sich die Dinge auch ansieht und bewertetData Science scheint also sehr umfangreich zu sein, welche Skills muss man so mitbringen?Auf jeden Fall statistisches Grundwissen und man sollte schon Programmieren können, insbesondere Technische Key Skills:Python oder R -> sind die wesentlichen Programmiersprachen in diesem BereichTools: Jupyter Notebook bzw. RStudio als Entwicklungsumgebungen sinnvollErfahrungen mit verschiedenen Formen von Daten, wie Datenbanken, z.B. SQLGrundverständnis von Cloudsystemen und Softwareadministration, z.B. DockerEs geht bei Data Science nicht nur darum Daten einmalig auszuwerten, sondern das ganze kontinuierlich machen zu könnenDaher schadet es nicht, ein bisschen was mit DevOps-Methoden anfangen zu könnenJe nach Bereich in den man geht, sollte man auch die Erfahrungen sammeln, z.B. Maschine Learning Aber Data Science ist nicht nur Maschine Learning! Es gibt viele Themen, die komplett ohne auskommen und es ist auch nicht immer die beste LösungNicht-Technische Key Skills:Kommunication sowohl mit technischen Personen und nicht-technischen Personen notwendigHartnäckickigkeit, wenn Dinge nicht funktionieren, viel trial and error aushaltenKreativität im Umgang mit den Daten und um neue Lösungswege zu findenTipps für Kreatiefs: Rubber Duck Debugging, Pausen/Spaziergänge, einfach mal schlafen (;Neugier ist wichtig, recherchieren, wie andere Leute Dinge machen, bereit sein mehr zu lernenViele der genannten Dinge sind im Vortrag SQL for Data Scientists (ab 33:55) auf der Women in Data Science Conference enthaltenWas tun um Data Scientist zu werden?Eine Option ist der Quereinstieg aus Informatik oder einer wissenschaftlichen Fachrichtung, insbesondere wenn eh viel mit Daten gearbeitet wurdeEs hilft in Projekten zu sein, wo andere mit Daten arbeiten; man muss nicht alles von Anfang an können, manchmal lernt man einfach während man dran arbeitetEs gibt mittlerweile Data Science als Studiengang an verschiedenen
deutschen Unis:
Studis online: Studiengänge Data Science / Data Management, BachelorStudis online: Studiengänge Data Science / Data Management, MasterVersucht während des Studiums schon thematisch passend zu Arbeiten, viele große Unternehmen und Forschungsinstitute haben sogenannte WerksstudentenjobsErfahrung unter realistischen Bedingungen sammeln kann, ohne dass gleich verlangt wird dass man alles schon kannWelche Folgen empfehlen wir zum Einstieg? (00:24:48)
In welche Folgen lohnt es sich am meisten reinzuhören, als Neuhörer*in?Wir wollen drei Folgen nennen, die besonders gut auf bestimmte Aspekte von Data Science eingehendl013: datenvisualisierungTechnische Einblicke in Datenvisualisierung mit Data ScienceEs geht nicht nur um die Darstellung selbst (Kommunikation von Daten)... sondern auch um das Kennenlernen von Daten (Exploration)... und das überprüfen der Methode/Modelle der Analyse (Verifikation)dl004: racial profilingBeschäftigt sich damit woher Daten kommen und was die Konsequenzen daraus sindWelchen Effekt hat die Herkunft der Daten und was passiert, wenn z.B. Justizbehörden auf Basis von Daten Urteile fällenEin sehr akutes Beispiel ist die Illegalisierung von Abtreibungen in einigen Staaten der USABesonders kritisch vor dem Hintergrund welche Datenspuren wir in unserem Alltag hinterlassen: Einkäufe von Schwangerschaftstests mit EC oder Kreditkarte, Apps, die den Zyklus tracken, etc.Eins Beispiel dafür, wie scheinbar "unschuldige" Daten schädlich genutzt werden können, nur weil sich die Gesetzeslage ändertUnd genau darum geht es in Folge 4, nur eben am Beispiel racial profilingdl023: web scraping weihnachtsmarktWir haben interessante Daten im Internet gefunden und die könnten wir ja mal benutzenWorum es genau geht: Kontext von Daten ist wichtig – Kenne dein MessverfahrenDas sind die Folgen, die wir für einen schnellen Einstieg zu Kernaspekten von Data Science empfehlen, aber natürlich seid ihr herzlich eingeladen alle anderen auch zu hörenFazit (00:29:54)
In unserem Podcast gibt es technische, aber auch gesellschaftliche Themen, in wie fern Daten unser Leben beeinflussenEs gibt aber auch den wissenschaftlichen Teil, zum Beispile die KlimadatenUnser Ziel ist es, nicht nur die technischen Details zu beleuchten, sondern alles was mit Date Science zu tun hat; Auswertungen, Einfluss der Messergebnisse auf unser Leben, was es braucht um Data Scientist zu werden und auch Darstellungen einfach besser zu verstehenWir hoffen das konnte diese Folge ganz gut zeigenAls Data scientist braucht man ein gewisses Maß an Frustrationstoleranz, aber vor allem Spaß am konstruktiven und kreativen Umgang mit Problemen und LösungswegenFähigkeiten in Sachen Programmieren und Statistik können ziemlich wichtig seinInzwischen muss man nicht mehr Quereinsteigen in dieses Feld, sondern es gibt inzwischen StudiengängeDas war es so grob, worum es diese Folge gingNächste Folge: Wasserspiegel Anfang Juli 2022 (00:31:37)
Es geht um das Klima, wir machen mit der klimadaten-Reihe weiterWir hatten in dl007: klimadaten über die Aspekte Waldbrände, Meeresspiegelanstieg und Temperaturkurven geredet und dann zu jedem eine eigene Folge machen wollenDavon sind bereits erschienen: dl008: temperaturkurven und dl014: waldbrändeJetzt geht es in Folge 28 weiter mit Meeres- bzw. WasserspiegelDafür gucken wir uns die letzten beiden Veröffentlichung des IPCC Berichtes anWir gucken uns an wie sich das da mit dem Meeresspiegel und der Klimakrise und grundsätzlich Wasser auf diesem Planeten verhältCall to Action (00:32:27)
Wenn ihr uns weiter hören möchtet, folgt uns auf Twitter unter @datenleben & Mastodon unter @[email protected] Oder besucht unsere Webseite: www.datenleben.deHinterlasst uns gerne Feedback, wir würden uns darüber sehr freuenIhr könnt uns als Data Scientists auch Buchen für Analysen oder ProjekteHabt ihr Fragen oder Themen, die euch interessieren? Dann schreibt uns!Outro (00:33:05)
Schlagworte zur Folge
Data Science, Podcast, Ziel, Inhalt, datenleben
Quellen
Twitter, @BecomingDataSci: "... If you're considering going into this field, ..."Broadcast SAP, Women in Data Science (America Sessions): Interview - SQL for Data Scientists, ab 33:55YouTube, PyData: Dr. Setareh Sadjadi: Do we really need Data Scientists?Wikipedia: DevOpsWikipedia: Quietscheentchen-DebuggingWomen in Data Science Conference: https://www.widsconference.org/Studies-Online: Data Science / Data Management, BachelorStudies-Online: Data Science / Data Management, MasterWeiterführende Links
dl001: data sciencedl013: datenvisualisierungdl004: racial profilingdl023: web scraping weihnachtsmarktdl007: klimadatendl008: temperaturkurvendl014: waldbrände