Intro (00:00:00)
Thema des Podcasts (00:00:18)
Willkommen zur zweiundzwanzigsten Folge beim datenleben-Podcast, dem Podcast über Data Science!
Wir sind Helena und Janine und möchten euch mitnehmen in die Welt der Daten.
Was ist Data Science? Was bedeuten die Daten für unser Leben? Woher kommen sie und wozu werden sie benutzt?
Das sind alles Fragen, mit denen wir uns auseinander setzen.
Wer schon immer mehr über Daten und deren Effekt auf unser Leben wissen wollte, ist hier genau richtig.
Thema der Folge (00:00:44)
Willkommen in 2022!Traditionell möchten wir das vergangene Jahr mit einem Jahresrückblick abschließenAus zuverlässiger Quelle (Downloadzahlen), wissen wir auch, dass das ein begehrtes Thema ist Entsprechend wird das Thema dieses Jahr auch eine Rolle spielen, aber durchaus anders, als letztes Mal... denn wir sind alle furchtbar müde davonEin Schnelldurchlauf durch das Jahr mit ein paar dingen, die herausragen (von wahnsinnig vielen)Natürlich werfen wir dann gleich als erstes erstmal einen Blick auf die PodcastzahlenStellen uns dann der frage: Was nehmen wir mit aus 2021 an Themen oder Erkenntnissen?Helena hat wieder geschaut, welche Data Science Themen es im vergangenen Jahr gabAm Ende fragen wir uns, was uns dieses Jahr wohl erwarten wirdWarum ist dieses Thema interessant? (00:02:24)
Weil es unsere Tradition ist und wir Lust drauf haben, zu schauen: Was ist so liegen geblieben, was gab es noch für Themen, wo wir keine Folge hatten?Und auch einfach mal wieder meta über den Podcast sprechen zu können; der produziert ja auch DatenEinspieler: Jahresrückblick — 2021 im Schnelldurchlauf (00:02:59)
Januar: EU—Austritt Vereinigte Königreich abgeschlossen, Stürmung US-Kapitol, Vereidigung Joe Biden, Kamala Harris wird Vizepräsidentin, Eisverlust entspricht Worst-Case-Szenarien des IPCCFebruar: Marsmissionen der Vereinigten Arabischen Emirate, Chinau und USA erreichen den PlanetenMärz: Containerschiff Ever Given verkeilt sich im Sueskanal, NASA gibt bekannt, eine Kollision mit Asteroid Apophis ist für die nächsten 100 Jahre ausgeschlossenApril: Mietendeckel ist verfassungswidrig, Brandkatastrophe am Tafelberg, Bundesverfassungsgericht stellt fest: Klimaschutzgesetz in Teilen verfassungswidrig Mai: Auseinandersetzung im Gazastreifen eskaliertJuni: Hitzerekord in Lytton (Kanada): 49,6 °CJuli: Hochwasser in West- und Mitteleuropa 2021, Monat ist weltweit der heißeste seit Beginn der Aufzeichnungen, Hitzewelle und Waldbrände in Südeuropa und der Türkei, Waldbrände in Kalifornien, Belarus lässt Geflüchtete an die Grenzen zur EU passierenAugust: Taliban nehmen afghanische Hauptstadt Kabul einSeptember: Vulkanausbruch auf La Palma beginnt, Bundestagswahl 2021 findet stattOktober: Erste Sitzung des neu gewählten Bundestags ohne Merkel, nach 31 Jahren als Abgeordnete und 16 Jahren als KanzlerinNovember: WHO stuft Omikron als besorgniserregend einDezember: Eine Zero-Day-Lücke in Log4j-Version 2 wird bekannt, höchste Warnstufe des BSI, James-Webb-Weltraumteleskop wird ins All geschossen, Atomausstieg: Kernkraftwerke Brokdorf (Schleswig-Holstein), Grohnde (Niedersachsen) und Gundremmingen C (Bayern) abgeschaltetWenn nichts anderes verlinkt ist, ist diese Liste inspiriert durch folgende Zusammenfassungen: Wikipedia: 2021, Statista: Jahresrückblick 2021Wie hat sich datenleben 2021 entwickelt? (00:07:51)
Statt im 4-Wochen-Rhythmus zu bleiben und eine Folge zu machen, haben wir Ende Dezember auf der rC3 einen Vortrag gehaltenUnser Podcast ist 1 Jahr geworden und wir haben noch immer Spaß dran und wollen weiter machenWir sind sehr happy, weil die Zahlen fröhlich vor sich hin wachsenDie Downloadzahlen haben sich in 2021 gegenüber zu 2020 etwa um ein Drittel gesteigertRausgerechnet ist, dass das Jahr 2020 nur ein halbes Jahr für uns war, 2021 ein volles Jahr Wir erfassen wie viele Downloads jede Folge in den ersten 24 Stunden, 7 Tagen, 4 Wochen etc. hatte und da können wir klar sehen, dass die letzten Folgen jeweils immer die erfolgreichsten warenD.h. neue Folgen haben zu diesen Meilensteinen jeweils mehr Downloads als die älteren zum gleichen Zeitpunkt hattenPython lernen!-Folge räumt hier ordentlich ab, hat nach 4 wochen schon die bisher beste performance für die 3-Monats-Marke überholtDanach kommen Drogenkonsum und 3d-modelle aus Fotos, die sich bei den Plätzen 2 und 3 abwechselnDownloads insgesamt in 2021: Platz 1 hat Folge 1: Data Science (wie letztes jahr)Platz 2 hat Folge 13: Daten visualisieren und an Platz 3 ist Folge 21: Python lernen!Was beachtlich ist, weil sie nur knapp 3 wochen Zeit hatte, um ältere Folgenwas lernen wir daraus als podcasterinnen?Folge 1 wird immer und immer wieder gehört, die Folge, in der man als Neupodcasterinnen am wenigsten erfahrung am Mikro hat, ist die, die am häufigsten gehört werden wird – yeah! oder soWir hoffen, sie ist immer noch gut. Gebt uns gerne Feedback!Und: es macht Spaß zu sehen, dass die neuen Folgen so viel mehr gehört werden bei VeröffentlichungAusserdem: Folgen mit Gäst*innen laufen auch immer superThematisch: Klimathemen-Folgen werden weniger oft gehört als die technischeren Folgen, aber auch als die gesellschaftliche ThemenGebt uns Feedback zu unseren bisherigen Themen, wir wollen Folgen machen, die euch interessieren Was sind unsere Lieblingsfolgen 2021?Helena: Daten visualiseren, sehr technische Folge mit vielen Details, war auch bei anderen beliebtHelena: 3D-Modelle aus Fotos, weil es um Datenverarbeitung ging, um etwas völlig neues herzustellen und es ging um einen DatathonJanine: Erdbeben, weil es um den Grund steht, auf dem wir leben, viel gelerntJanine: Python lernen, weil Aufnahme schon Spaß gemacht hat, weil es um "wie lerne/lehre ich" gingWas nehmen wir mit aus 2021 an Themen oder Erkenntnissen? (00:18:05)
Helena: Dieses Jahr an Data Science Themen gar nicht so viel mitbekommenHat ihren Nachrichtenkonsum stark eingeschränkt, weil die Pandemie alles so stark dominiert hat Janine: auch erst Probleme beim Rückblick, bei selbst Erlebtem und was auf der Welt passiert istKonnte viel schlechter einordnen, wann etwas passiert ist, ob in diesem oder dem letzten JahrFragt sich was mit dem Zeitempfinden noch passiert, oder 2022 ein Haken hinter die Pandemie kommtEinfluss auf viele: Katastrophenzustand vs. AlltagspflichtMeme aus zwei Kreisen: apocalyps vs. having to go to work, da wo sie sich überschneiden steht: somehow we endet up hereDas ist wahrscheinlich für viele Menschen sehr erschöpfend2021 bestand einfach aus super viel CopingTrotzdem sind uns noch Dinge eingefallen, fangen wir mit der Bundestagswahl anZur Bundestagswahl 2021 (00:21:32)
Wir haben dazu sogar eine Folge gemacht, bzw. zum Thema Wahlen und UmfragenHelena war Wahlhelferin, in Braunschweig war zusätzlich Kommunalwahl an einem anderen TerminKein Stress mit Maskenverweigerern, genug Stimmzettel waren auch daEs gab einen kleinen Fuckup mit Briefwahlunterlagen, die angeblich ausgehändigt wurdenWenn diese Beantragt wurden, darf man keine Stimmzettel im Wahllokal bekommenMan müsste sie zur Stimmabgabe mitbringenDamit niemand zwei Mal abstimmen kannEs kam dann ein Mensch, der Stimmzettel wollte, laut Unterlagen aber schon Briefwahlunterlagen hatte; dieser Mensch wusste davon aber nichtsErstmal musste er nach Hause geschickt werden, später konnte das noch geklärt werden, es ist ein fehlerhafter Eintrag im System gewesen; der Mensch konnte dann doch noch wählenSuper zu sehen, dass das System an sich funktioniert und alles auch geklärt werden konnteDie Wahl hat dann ja tatsächlich zu einem Regierungswechsel geführtHelena hatte in Wahlumfragen-Folge prognostiziert, dass die CDU die Bundestagswahl gewinnen könnte, wenn über den Sommer durch Ipmfung die Pandemie weitestgehend als beendet erklärt würdeDie Grundvoraussetzung ihrer Vorhersage ist aber nicht eingetreten, daher lässt sich die Richtigkeit der Vorhersage nicht überprüfenWissenschaft und Gesellschaft (00:27:15)
Thema 2021 für Janine ist Wissenschaft und GesellschaftAuch schon das Jahr davor, aber 2021 einfach das aufdringlichste ThematischEs geht um Diskrepanz, die zwischen Wissenschaft/Wissen/-skommunikation und Gesellschaft existiertDas ist eine persönliche Beobachtung, die keine Zahlen hatEindruck aus Gesprächen: Es werden immer wieder Dinge gefragt werden oder erklärt werden müssen, die eigentlich seit über einem Jahr eher Allgemeinwissen für unsere aktuellen Lebensumstände sindWichtiges Thema: Wie wird Wissenschaft nachvollziebar gemacht? Müssen uns auch als Podcasterinnen Gedanken machen, was und wie kommunizierenDass diese Diskrepanz so riesig ist, da spielen vermutlich verschiedene Faktoren reinDie sicher auch andere schon zu genüge analyisiert haben, und hier gar nicht im Detail ausgeweitet werden sollen, aber um es konkret zu machen BeispieleInformationsflut, der wir ausgesetzt sind: Am Anfang der Pandemie schon riesig, aber aufgrund der aktuellen Masse fällt es schwer informiert zu bleiben und vielleicht Widersprüche auch aufzulösenVermutlich stellen wir uns viele Fragen, die nicht mehr so einfach beantwortet werden könnenBeispiel: Am Anfang #FlattenTheCurve, vermeidet jede AnsteckungJetzt ist ein großer Teil geimpft (leider noch nicht alle, die es könnten) und haben eine riesige inzidenz, wie wir sie noch nie hatten, während niemand mehr sagt #FlattenTheCurveWissen verändert sich, aber wir müssen auch damit umgehen, das adäquat anzupassenWie sollen Menschen, die da nicht qualifiziert das noch einordnen können, was ist die Relation zwischen einer Inzidenz von jetzt 500 zu 50 früher? Da spielt das zweite und dritte Problem, das wir in diesem Komplex haben, mit reinZweites problem: Politik und politisches Handeln entspricht gerade nicht dem, was sinnvoll erscheint, wenn man versucht aus alle den Informationen eine Konsequenz zu ziehenStichworte wie: Mehr Home Office, Distanzunterricht, Luftfilter in Schulen etc. kommen hier ins SpielJanine findet die Kommunikation der Informationen überhaupt nicht gut gelungenMaßnahmen so unverständlich wie Masse an Informationen - es fällt schwerer da noch durchzusteigenUnd da resignieren vielleicht auch vieleDrittes Problem: Reden wir eigentlich über das Gleiche?Das war schon immer so, dass nicht; aber in der Pandemie hängen davon Empfehlungen und eigenverwantwortliches Handeln abBeispiel ist hier das Wort "mild" WHO bezeichnet einen Verlauf, der einen Menschen ins Krankenhaus bringt, wo ihm Sauerstoff verabreicht wird, als mild (Ergänzung: Hier als "moderate")Gleichzeitig beruhigen alle: Omikron erzeugt nur milde VerläufeUmgangssprachlich heißt milder Verlauf: ich lag wie mit ner Erkältung flachDie Frage ist: Was passiert da in unseren köpfen, kommt wirklich das richtige an?Wie können wir es schaffen, dass wissenschaftliche Erkenntnisse so kommuniziert werden, dass auch bei der Bevölkerung die richtigen Rückschlüsse getroffen werden können?Wir müssen inzwischen in dieser Pandemie aus den ganzen Informationen Rückschlüsse für uns ziehen, um unser Handeln daran anzupassenDeswegen für Janine Thema in 2021: Wissenschaft, Wissenschaftskommunikation und GesellschaftUnd das Thema ist ja auch nicht neu, die Covid-19-Pandemie hat das nur nochmal zugespitztDas Problem gibt es schon längst, wenn wir auf die Klimakatastrophe sehenAls Podcasterinnen ist das thema Wissens- oder Wissenschaftskommunikation eh wichtig für uns...2021 hat nur einfach sehr drastisch gezeigt, wo Menschen genau hinsehen müssen bei diesen DingenWelche Data Science Themen gab es 2021? (00:35:33)
In der Programmiersprache R wurde in der Version 4.1 veröffentlichtEine besondere Neureung, auf die Nutzer*innen schon lange gewartet haben: Es gibt jetzt die PipeVorher konnte das nur über Zusatzpakete benutzt werden Was ist eine Pipe? Pipe steht für Rohr, siehe z.B. PipelinesData Science: Pipelines = wenn man irgendwo Daten reinkippt und dann fallen unten Ergebnisse rausDie Pipe in R ermöglicht den Code schön kompakt zu schreiben und sehr gut verständlichDas macht einige Dinge einfacher und viel mehr andere Pakete können sich darauf verlassenBis Helena das produktiv einsetzt, dauert es noch, weil das jetzt erstmal alle aktualisieren müssenDas kann ein paar Jahre dauern, bis alle Menschen das aktualisiert habenEs ist aber gut, dass es das Feature jetzt gibtDann gab es 2021 auch noch die Lost Tapes of the 27 ClubDer 27 Club ist eine Gruppe von Musiker*innen, die im Alter von 27 gestorben sindEiner der Vertreter ist Kurt Cobain von NiravanaLost tapes of the 27 Club: keine entdeckten Aufnahmen, sondern von sogenannter KI erzeugte LiederDer KI wurde Musik dieser Künstler*innen gegeben, daraus entstanden dann neue LiederZum Beispiel: Nirvana - Drowned in the Sun (Music Video HD) - Lost Tapes of the 27 ClubEs klingt tatsächlich beeindruckend nah dran, wie haben die das gemacht?Verwendete Software war Magenta von Google: https://magenta.tensorflow.org/Basiert auf tensorflow dem neuronalen Netz Framework von GoogleMagenta ist dafür da, um Noten zu erzeugenMan füttert es dann mit allen Noten und dann erzeugt die KI Noten, die ähnliche Harmonien verwendenÄhnlich wurde dann mit dem Text fortgefahren, um die Songtexte zu generierenAus den Noten wurde dann der Sound kreiert und der Text wurde von Sänger*innen mit ähnlichen Stimmen (Coverbands) eingesungenDamit ist es natürlich möglich Musik in einem bestimmten Stil zu machen und damit kreativ zu arbeitenOrganisiert wurde das ganze von dem Projekt 'over the bridge'Sie wollen damit auf die psychische Gesundheit von Musiker*innen aufmerksam machenDeswegen auch der 27 Club, weil die nicht an natürlichen Umständen gestorben sindOver the Bridge bieten auch Programme zu Suchtproblemen und Depressionen etc. anWas erwartet uns wohl in diesem Jahr? (00:43:59)
Gesellschaftlich: mehr Pandemie, mehr Klimawandel; vor allem den Umgang damit zu lernen, damit wir noch eine vernünftige Zukunft haben und auch die Generationen nach unsWissenschaftlich: Witziger ist vermutlich Wissenschaft Richtung Raumfahrt, hier sind wir gespannt darauf, was das neue Weltraumteleskop an Daten und Bildern liefern wirdPodcasttechnisch: mehr neue Folgen, 4-Wochen-Rhythmus, Themen liegen auch schon rumUnd: Wir nehmen aktuell an einem Datathon an der Stanfort University teil: Women in Data ScienceEs geht um Klimadaten: Mittels Maschinellem Lernen Energieeffizienz von Häusern vorhersagenEventuell gibt das sogar eine Folge dann später im JahrLetztes Jahr haben wir zum Sammeln von Luftdaten aufgerufenDas haben wir gemacht und auch ein paar andere Menschen, ihr könnt auch immer noch einsteigenDazu wird es auch eine Folge geben und wir haben schon ein paar schöne Events in den DatenFazit (00:47:11)
Wie war das Jahr 2021 für Dich?Helena: 2021 ging nicht sehr gut los, ist aber ab der zweiten Hälfte wieder in Schwung gekommenDa gab es wieder mehr spannende Dinge, es war aber vor allem ein sehr anstrengendes JahrEs fehlt der Ausgleich, zum Beispiel Tanzen gehen, 2021 fehlte das noch mehr als 2020Janine: Wirkte alles recht verschliert, aber beim Scrollen durch Bildergalerie festgestellt, dass es im Rahmen der Möglichkeiten (vor allem draußen) viele schöne Momente mit anderen Menschen gabIst sich der eigenen recht priveligierten Situation in dieser Pandemie bewusstFazit: Öfter mal durch die Bilder scrollen, um den dominanten Pandemie-Alltag zu relativierenVermutung: Hamsterrad des Alltags wird durch Pandemie verstärkt -> pandemisches HamsterradNächste Folge: Daten aus dem Internet am 26.02.2022 (00:50:17)
2021 gab es in Braunschweig einen Weihnachtsmarkt mit InfektionsschutzkonzeptGastronomieflächen wurden eingezäunt und eine maximale Personenzahl festgelegt, die aktuellen Besuchsdaten wurden im Internet live veröffentlichtDaten im Internet! Die können gespeichert werden, um sie für eigene Analysen zu benutzenDas ist Thema der nächsten Folge: Wie Daten auslesen, speichern, analysierenCall to Action (00:51:43)
Wenn ihr uns weiter hören möchtet, folgt uns auf Twitter unter @datenlebenOder besucht unsere Webseite: www.datenleben.deHinterlasst uns gerne Feedback, wir würden uns darüber sehr freuenIhr könnt uns als Data Scientists auch Buchen für Analysen oder ProjekteHabt ihr Fragen oder Themen, die euch interessieren? Dann schreibt uns!Outro (00:52:28)
Schlagworte zur Folge
Jahresrückblick, 2021, datenleben, Downloadzahlen, Pandemie, Coronapandemie, Bundestagswahl 2021, Wissenschaftskommunikation, Programmiersprache R, 27 Club, Datathon
Quellen
Wikipedia: EU—Austritt des Vereinigten Königreichstagesschau.de: Berliner Mietendeckel verfassungswidrigWikipedia: Brandkatastrophe am Tafelberg 2021tagesschau.de: Klimaschutzgesetz in Teilen verfassungswidrig mdr.de: Anhaltender Raketenbeschuss auf Israel – Viele Tote im PalästinensergebietWikipedia: Hochwasser in West- und Mitteleuropa 2021Wikipedia: Migrationskrise an der Grenze zwischen Belarus und der Europäischen UnionWikipedia: Vormarsch der Taliban in Afghanistan 2021. Evakuierung und Chaos am Flughafenmdr.de: Das war der Oktober 2021mdr.de: Das war der November 2021Bundesamt für Sicherheit in der Informationstechnik: Kritische Schwachstelle in log4j
veröffentlicht (CVE-2021-44228)
Wikipedia: 2021Statista: Jahresrückblick 2021datenleben: DL021 Python lernen!datenleben: DL020 Drogenkonsumdatenleben: DL018 3d-modelle aus Fotosdatenleben: DL001 Data Sciencedatenleben: DL013 Daten visualisierendatenleben: DL017 Erdbebendatenleben: DL015 Wahlen und UmfragenWorld Health Organization: WHO R&D Blueprint novel Coronavirus COVID-19 Therapeutic Trial SynopsisWHO, Working Group on the Clinical Characterisation and Management of COVID-19 infection: A minimal common outcome measure set for COVID-19 clinical researchhttps://www.r-project.org/https://www.losttapesofthe27club.com/rollingstone.com, Kory Grow: In Computero. Hear How AI Software Wrote a ‘New’ Nirvana SongYouTube.com, VX52 Movies: Nirvana - Drowned in the Sun (Music Video HD) - Lost Tapes of the 27 Clubhttps://magenta.tensorflow.org/widsconference.org: Datathondatenleben: Mitmachfolge: Feinstaubsensor!