Intro (00:00:00)
Thema des Podcasts (00:00:18)
Willkommen zu unserer fünfundzwanzigsten Folge beim datenleben-Podcast, dem Podcast über Data Science.
Wir sind Helena und Janine und möchten euch die Welt der Daten näher bringen.
Was ist Data Science? Welche Daten umgeben uns? Und was können wir aus ihnen lernen?
Es wird immer wichtiger Daten in das Große Ganze einordnen zu können.
In unserem Podcast sprechen wir deswegen über Data Science anhand von Themen, die uns alle betreffen.
Thema der Folge (00:00:43)
Endlich: die Feinstaubfolge, die dank unvorhergesehe ner Dinge eine Luftdaten-Folge geworden istUnd es ist auch eine Folge über Citizen Science, also die Wissenschaft, die mit und aufgrund von Bürger*innen-Beteiligung stattfindetVor über einem halben Jahr haben wir zum Mitmachen aufgerufen, vielen Dank an alle, die es geteilt haben und für die Daten, die wir bekommen habenSind auf Feinstaub gekommen, weil wir in der Waldbrandfolge bereits Sensoren der Sensor.Community angeschaut hattenDamals konnten wir in den Daten der Sensoren die Waldbrände aus Kalifornien ablesenDas und das jährliche Feinstaub-Silvesterfeuerwerk, erschien uns interessant genug mal mit Feinstaubsensoren zu arbeitenZunächst erzählt Helena über ihre Datenauswertungsreise und danach springen wir in die Auswertung von 3 MessstationenWeitere Dinge: haben Sensoren der Sensor.Community mit Daten von offiziellen Messstationen des Umweltbundesamtes verglichenSchließlich noch zwei globale Ereignisse: Saharastaub und ein VulkanausbruchWarum ist das Thema wichtig? (00:02:50)
Feinstaub fanden wir wichtig, weil u.a. durch Straßenverkehr oder Holzöfen entsteht Luftbelastung Das hat Einfluss auf unsere GesundheitAber es geht auch um Citizen Science, das heißt, dass auch Menschen, die keine Wissenschaftler*innen sind, Daten sammelnGerade bei Feinstaub geht es auch um politische Entscheidungen, deswegen sind unzensierte Daten als Vergleiche wichtigEinspieler: Was ist dieser Feinstaub? (00:03:57)
was ist dieser feinstaub?
Feinstaub besteht aus einem komplexen Gemisch fester und flüssiger Partikel und wird abhängig von deren Größe in unterschiedliche Fraktionen eingeteilt. Unterschieden werden PM10 (PM, particulate matter) mit einem maximalen Durchmesser von 10 Mikrometer (µm), PM2,5 und ultrafeine Partikel mit einem Durchmesser von weniger als 0,1 µm. Quelle
Menschen erzeugen Feinstaub: Autos, Kraft- und Heizwerke, Kamine, allgemein durch Heizen und auch sehr viel in der IndustrieStraßenverkehr: Bremsen- und Reifenabrieb; Landwirtschaft: Ammoniak-Emissionen durch TierhaltungAls natürliche Ursache gilt: Bodenerosion, kleinste Partikel, die aufgewirbelt werdenWarum spielt das alles eine Rolle? Weil es sich auf unsere Gesundheit auswirken kannFeinstaubpartikel reizen je nach Größe die Schleimhäute, gelangen in die Bronchien, belasten Lungen und Herz- Kreislaufsystem, was zu ernsthaften Erkrankungen führen oder bestehende verstärken kann EU Grenzwerte gelten seit dem 1. Januar 2005: Tagesgrenzwert PM10 beträgt 50 µg/m3, darf nicht öfter als 35mal im Jahr überschritten werden, zulässiger Jahresmittelwert 40 µg/m3Für PM2,5 gilt seit 2008 ein Zielwert von 25 µg/m3 im JahresmittelEs gibt also gute Gründe, um Feinstaub im Blick zu haben und es ist auch gut, wenn das nicht nur der Staat macht, sondern alle Menschen sich einfach einklinken können und mit eigenen Sensoren zu einem Großen Netzwerk beitragen könnenSo zum beispiel in das große Netzwerk der Sensor.CommunityAuf der Karte der Sensor.Community sind über 14.000 Sensoren registriert aus 73 LändernEs sind ganz verschiedene Sensoren an der Datenerhebung beteiligtU.a. der Feinstaub-Sensor SDS011, der die beiden Partikelgrößen PM10 und PM2.5 messen kannMeist weitere Sensoren enthalten: Temperatur, Luftfeuchtigkeit, LuftdruckJeder registrierte Sensor liefert frei zugängliche Daten ausWer sich daran beteiligt ist Teil eines globalen Sensornetzwerkes das open data Umweltdaten generiertOffen zugängliche Daten sind toll, sie fördern Bürger*innen-Beteiligung, Transparenz, WissenschaftWie können die Daten geladen werden? (00:07:04)
Unsere Idee: Selbst Feinstaubsensoren zu betreiben und auszuwertenAufbau: Zeitspanne ein halbes Jahr, sollte Silvester (Feuerwerk) enthalten, gleiche SensorenDatensammeln: Sensoren aufbauen, anschließen, verbinden und in der Sensor.Community registrierenParallel versucht bestimmte Ereignisse zu erfassen, bei denen wir dachten, da passiert wasWie komme ich an die Daten dann ran, wenn ich sie auswerten möchte?Also wie erreiche ich zum Beispiel die Schnittstelle zu den Daten?Und gleich als zweite Frage hinterher: Was mache ich dann, wenn ich die Daten runtergeladen habe?Haben den Sensor SDS011 benutztSensor.Community bietet die Daten auf ihrem Server in verschiedenen Formen an, die einfach runtergeladen werden könnenEin Ordner für jeden Tag und dann für jeden Sensor mit jeder Sensor-ID eine DateiOder man zieht die Datei, die 1x im Monat jeweils einen Sensor-Typ zusammenfasstDie monatliche Datei für den Sensor SDS011 war das größte Paket: 4GB gezipte CSV-DateiCSV hatten wir ja schonmal erwähnt, sind im Grunde Textdateien, die Tabellen darstellenGezipt heißt, dass die Datei kleiner gepackt wurde, nach dem Entpacken war sie 16GB großHelenas Versuche in R die Daten ohne Entpacken zu laden waren nicht erfolgreich, es wurde immer nur ein Bruchteil der Daten geladen (mit readr::read_delim und vroom::vroom package)Also doch entpacken, aber das Laden scheiterte daran, dass der RAM (Arbeitsspeicher) vollgelaufen istHelena hat deshalb die Daten beim Laden in R direkt gefiltert, das war aber sehr langsamDeswegen hat sie das Filtern manuell auf der Kommandozeile gemachtUnter Linux gibt es da Tools um Textdateien zu verarbeitenIn einer CSV-Datei ist jede Beobachtung eine Zeile und darüber konnte Helena einfach alle Zeilen raussuchen mit den Sensor-IDs, die uns interessiert haben Das waren dann nur noch 40 MB an DatenDamit war es dann möglich die Daten vernünftig zu ladenjsds <- sqldf::read.csv2.sql(
"/tmp/sds/2021-10_sds011.csv",
sep = ";",
sql = "select * from file where sensor_id=XXXXX"
)
cat *csv|grep 12345 >> ~/sds_data.csv
Eine Person hat uns Daten über das Excelsheet eingereichtWir hatten eine Tabelle vorbereitet wo Dinge eingetragen werden konntenLeider stehen an vielen Stellen in den Daten der Sensor.Community verschiedene IDs zu den Sensoren, und im Datensatz steht nur die 'sensor id' und nicht alle IDs, die wir gebraucht hättenZum Glück hatte die Person aber ein paar Probleme mit dem InternetHelena musste also nur noch nach Sensoren suchen die zum gleichen Zeitpunkt Ausfälle hatten, wie im Plot zu sehen warProblem mit dem Laden aller Daten umgangen, indem der Zeitraum eingeschränkt wurdeEs kamen 66 Sensoren in Frage Dann habe ich einen Zeitpunkt genommen, an dem die Daten im Plot ein auffälliges Muster hattenUnd alle Daten zu diesem Zeitpunkt geplottet, und siehe da, es passte genau einer der Sensoren, und er war sogar im richtigen Stadtteil!Fazit: Solche Sachen sind nicht anonym, auch wenn man die IDs weglässt, weil aus der Form in Korrelation mit anderen Daten immer noch erstichtlich werden kann, woher das kommtEs gibt im AirRohr also nicht nur eine ID, sondern jeder einzelne Sensor bekommt eine eigen ID, die mensch dann erstmal rausfinden mussWas haben wir konkret beobachten können? (00:15:34)
Was haben wir also konkret beobachten können? Oder auch nicht beobachten können?Bei Datenerhebung haben wir auch immer wieder draufgeschaut, was da grad passiertSo verschiede Events, die uns da als erstes in den Sinn kamen: Wie wirkt sich Regen aus? Feinstaub durch Straßennutzung bei Trockenheit?Frage, die wir uns immer wieder gestellt haben: Wo kommen Peaks in den Plots her? Sind die nur lokal oder größer umkreis?Schnell war klar: Ursachen von Peaks dann vor allem nachweisbar wenn sie auch beobachet werden, im Nachhinein scheint uns das eher schwerAlles in allem schwebt die riesige Frage darüber: Was ist Kausalität und was vielleicht nur Korrelation?Kausalität wäre ein direkter Zusammenhang zwischen dem Beobachteten Ereignis und dem AnstiegWährend Korrelation nur zufällig während einer Beobachtung den Wert ansteigen lässt, die Ursache daher aber ganz woanders liegtErste Frage, die wir uns gestellt hatten, war, wie sah Silvester in den Daten aus?Silvester: Wie zu erwarten ist es bei allen 3 Teststationen deutlich zu sehenAm stärksten etwa eine halbe Stunde nach MitternachtTrotz Feuerwerksverkaufsverbot - also vermutlich weniger als sonst, aber gut zu sehen immer noch!Grillen: hier erwartet man eine erhöhte Feinstaubkonzentration, zumindest bei Holzkohle und BrikettsJanine hat ein Mal gegrillt, überwiegend Briketts, so um 15:20 wurde der Grill angemachtDabei hat sie live auf den Sensor geguckt, vorher war der PM10 Wert bei 10 etwaAls es dann richtig rauchte, ging PM10 bis auf 70 hoch, aber schnell wieder abgeflautDanach passierte etwa 20 Minuten nichts und Janine hat die konkrete Beobachtung beendetHelenas Beobachtung in den Daten: Nachdem der Grill angemacht wurde, gab es einen kleinen Peak und ging dann wieder runterEine halbe Stunde später kam erst der deutlich größere Anstieg mit mehr FeinstaubEs ist vorstellbar, dass wegwehende Asche auch Feinstaub verursacht, aber nicht schon so kurz nach dem anwerfen des Grills vermutlichSpannend wird es in Kombination mit den Daten von Helga, die auch ein Grillevent in den Daten hat, bei dem auch 30 Minuten nach anmachen des Grills die Werte steigenHelga hat einen Elektrogrill benutzt und trotzdem einen ähnlichen Anstieg wie bei Janine gehabtAlso scheint Feinstaub beim Grillen insbesondere von der Nahrung zu kommen. (Hypothesenbildung)Daraus könnte man eine Versuchsreihe entwickeln: mehrmals grillen mit und ohne Grillgut etc.Straßenkehrmaschine: Janine sah einmal einen Anstieg im Zusammenhang mit StraßenkehrenAllerdings, bei weiteren Beobachtungen hat sich das nicht wiederholt: offenbar nicht für einen großen Anstieg ursächlichMüllabfuhr war auch völlig beliebig und konnte nicht mit Peaks korreliert werdenParty: Auf dem Balkon unter Helga fand eine Party statt, zeitgleich ein deutlicher Anstieg der DatenVermutung: Raucher*innen auf der Party auf dem BalkonRauchen: Janine hatte Besuch und diese Person hat auch draußen geraucht, dabei hat sich der Wert sehr schnell verdoppeltSah so aus, als sei Rauchen die Ursache, Wert war aber vorher sehr niedrigIn den Daten sah es vor allem bei PM10 eher nach Rauschen aus, sagt auch Helena Allerdings der Anstieg bei PM2,5 (für kleineren Feinstaub) war höher, als der bei PM10 - das könnte mehr als Rauschen gewesen sein Hier wäre eine Versuchsreihe mit Raucher*innen auch eine Möglichkeit das zu ergründenSpäter am Abend gab es noch zwei Ausschläge, während noch eine zweite Person da war, die ebenfalls geraucht hat und die natürlich zusammen rauchen gegangen sind, da liegen leider keine Zeiten vor Regen: Anfangs hat Janine oft, wenn es geregnet hat, den Sensor live beobachtet Dabei ist aber überhaupt kein Muster entstanden, das irgendwelche Rückschlüsse erlaubt hätteDie Schwankungen während Regen wirkten dabei sehr beliebig, mal gefallen, mal gestiegenDas müsste man im großen Maßsstab angucken über den gesamten Zeitraum und dazu bräuchte man auch die RegendatenWir haben im AirRohr aber auch noch weitere Sensoren: Temperatur, Luftdruck und LuftfeuchtigkeitBisher haben wir über Korrelation mittels Beobachtung gesprochen, die lässt sich aber auch mathemathisch definierenBeispiel: Man kann anhand der gleichzeitig erfassten Daten von Feinstaub und Temperatur einen Korrelationskoeffizienten erstellenWenn die Korrelation besonders hoch ist, ist der Wert bei 1Immer wenn ein Feinstaub hoch geht und gleichzeitig die Temperatur hochgehen würde, wäre der Korrelationskoeffizient bei 1-1 wäre er, wenn das eine immer hoch geht, während das andere immer runter geht 0 wäre er, wenn es gar keine Korrelation gibtDer Korrelationskoeffizient, auch Produkt-Moment-Korrelation, ist ein Maß für den Grad des linearen Zusammenhangs zwischen zwei mindestens intervallskalierten Merkmalen, das nicht von den Maßeinheiten der Messung abhängt und somit dimensionslos ist. Er kann Werte zwischen − 1 {\displaystyle -1} -1 und + 1 {\displaystyle +1} +1 annehmen. Quelle
Zwischen Temperatur und Luftdruck konnte Helena keine Korrelation findenEs gab aber eine zwischen Temperatur und Luftdruck Nicht überraschend: Barometer (Gerät für Luftdruckanzeige) können benutzt werden, um kurzfristige lokale Wettervorhersagen zu tätigen In Sachen Korrelationen haben wir uns dann noch Messstationen vom Umweltbundesamt dazugeholtStationen vom Umweltbundesamt vs. private Messstationen? (00:31:00)
Wir wollten Messstation des Umweltbundesamtes mit denen der Sensor.Community vergleichenMehr Messpunkte sind besser, deswegen noch zwei weitere UBA-Stationen rausgesucht, mit Sensoren der Sensor.Community in der NäheDas sind jetzt neben Braunschweig noch Leipzig und DuisburgDie UBA Stationen stehen dabei jeweils an größeren Straßen, die privaten Sensoren nicht direkt an der HauptverkehrsstraßeUnd Helena hat natürlich diese Messdaten dann zusammengeworfenWas kam dabei raus?Die verfügbaren Daten der Messstationen sind die Tagesmittel, also der Mittelwert aus 24 Stunden Keine Angaben gefunden von wann bis wann das giltLaut Korrelationskoeffizient gute Korrelation zwischen unseren Sensoren und denen vom UBAAllerdings gibt es eine zeitliche Verzögerung dazwischenBei Zeitreihen spricht man nicht mehr unbedingt von Korrelation, sondern von Kreuzkorrelation, da man dann die Zeitdifferenz mitberücksichtigtIn Braunschweig sind die Tagesmittel um 2 Tage versetztBei Duisburg und Leipzig sind sie um 1 Tag versetzt Mögliche Erklärung 1: Der Feinstaub hat "Reiseweg" von der UBA Station zu der anderen Station Mögliche Erklärung 2: bei einem Tag könnte sein, dass die Zeitpunkte für die das Tagesmittel ermittelt wird unterschiedlich sind: Zum Beispiel von 00:00 bis 24:00 oder von 12:00 an tag 1 bis 12:00 an Tag 2.Bei 2 Tagen erklärt es das nicht unbedingtZeitlich versetzte Korrelation heißt aber, dass der Prozess der Feinstaub erzeugt, also zum Beispiel der Verkehr, ein dies in räumlichen Abstand zu den Messtationen tutUnd dann der Feinstaub eine gewisse Zeit braucht um sich auszubreiten. Beispiel: Diffusion oder WindUnsere Sensoren untereinander waren stärker Korreliert als zum UBAIn Duisburg sind die beiden Sensor.Community Stationen auch sehr stark miteinander korreliert (0.98)Heißt also, wenn dass so gut korreliert, dass lokale Ereignisse wirklich nur geringen Effekt haben und zwar kausal sein können, aber trotzdem im rauschen der umgebung untergehen?Im Grunde ist Rauschen eine Summe ganz vieler kleiner EreignisseAlso kann man (Beispiel Rauchen) durchaus ein kausales Ereignis beobachten, es sieht dann aber am Ende trotzdem wie Rauschen ausWenn man weiß wie ein Ereignis aussehen muss, kann das doch in den Daten gefunden werdenWas macht der Saharastaub in meinem Sensor? (00:40:56)
Mitte März färbte Saharastaub den HimmelDieser wird in der Sahara aufgewirbelt, durch Turbulenzen und Windböen in höhere Luftschichten und wird von dort mit Höhenwinden über den Globus verteiltKleine Randbemerkung: Staub dieser Staub enthält Mineralstoffe, die damit verteilt werden Der Amazonas profitiert davon auch, Saharastaub ist Teil des globalen Nährstoffkreislaufes Es gibt pro Jahr etwa 5-15 Saharastaub Ereignisse, die sich etwa über 10-60 Tage pro Jahr streckenUnd nachdem wir ja eh den Sensor im Blick haben, dachte ich: misst mein Sensor den eigentlich auch?Deswegen haben wir dann beschlossen das auch nochmal näher anzuguckenVergleich der Daten vom 10.3.2022 mit den Daten am 17.03.2022: es ist deutlich zu sehen dass mehr Feinstaub in der Luft istEine Woche vorher, um Wochentagseffekt auszuschließenAm 10.03. war der Wert deutliich unter 30 und am 17.03. im Schnitt zwischen 30-40Wahrscheinlich haben Menschen im Süden und Westen Deutschlands höhere Werte messen können Dort war der Saharastaub deutlich länger und vermutlich auch in höherer Konzentration in der LuftHelena hätte gerne eine Animation über alle Sensoren mit der Ausbreitung der Wolke gemacht Aber uns lagen noch nicht die Märzdaten als Gesamtpaket vorVielleicht hat ja jemand anderes noch Lust das zu machenWer mehr darüber wissen möchte, kann beim Deutschen Wetterdienst vorbeischauenWie können meine Sensoren einen Vulkanausbruch messen? (00:45:27)
Am 15. Januar brach der Vulkan Hunga Tonga–Hunga Ha'apai ausSpannende Twitterthreads dazu sind in diesem Thread zusammengetragen:https://twitter.com/NicosPanoptikum/status/1482269560158003202?s=20&t=9H_rJV0SICcMQEv0KjhMdQDie Druckwelle war so enorm, dass sie sich um die gesamte Erde ausgebreitet hatEs gab auch interessante Sattelitenbilder, die zeigten, wie diese Druckwelle starke Wellenmuster in die wolken "zeichnete"Durch die Bewegung der Luftmassen, hat sich am Rand der sich ausbreitenden Welle kurzfristig der Luftdruck verändertDas konnte von Luftdrucksensoren gemessen werden, auch in dem von JanineDer Vulkanausbruch war buchstäblich auf der anderen Seite der Erde Helena hatte die Idee, die Sensoren aus der Sensor.Community zu nutzen, um die Ausbreitungsgeschwindigkeit der Druckwelle zu bestimmenGestartet wurde erstmal mit ein paar Drucksensoren, die das gleiche Modell hatten wie der von JanineDas waren etwa 140 Sensoren, also alle einfach erstmal geplottet -> Exploration der DatenDabei fielen zunächst zwei Dinge auf:Ein paar Sensoren hatten offensichtlich keine Sinnvollen Daten, hochgeladen, sondern waren eher
rauschen oder ähnliches, die ließen sich manuell aussortieren
Außerdem war die durchschnittliche Zeit zwischen zwei Messpunkten ca. 150sCharakteristische Form der Druckwelle: Ein starker Anstieg und danach ein Abfall unter das vorherige Niveau und sich dann wieder normalisierteHelena hat die Daten nach Zeit gefiltert: ungefähr danach, wann die Druckwelle hier ankamAußerdem alle Messstationen aussortiert, die mehr als 2000km von Braunschweig entfernt warenAnnahme der Auswertung ist, dass sich die Druckwelle als planare Welle bewegt und die Erde flach istDas ist beides auf globalem Maßstab falsch, daher wird ein kleiner Ausschnitt der Welt gewählt, wo das nah genug dran kommt (Typisch Physik^^)Dazu musste sie wissen: Wann ist das Maximum? Wo sind die Messsensoren?Die Orte lagen als GPS-Koordinaten vor, bzw. genauer im WGS84 KoordinatensystemDa die Annahme war dass die Erde im Ausschnitt ausreichend flach ist, wurde das Koordinatensystem transformiert, in eins was x und y in Metern misst, statt in GradGPS ist WGS84, was den Code EPSG 4326 hatUTM32U ist ein Koordinatensystem, was große Teile Deutschlands rastert, planar in MeternUTM32: https://de.wikipedia.org/wiki/UTM-KoordinatensystemWSG84: https://de.wikipedia.org/wiki/World_Geodetic_System_1984EPSG: https://de.wikipedia.org/wiki/European_Petroleum_Survey_Group_GeodesyGemeinerweise hat das R Paket raster latitude und longitude vertauscht gegenüber dem was bei GPS üblicherweise angegeben wurdeAuswertung 1:Schritt 1: Daten als Histogramm plotten, wobei sie in Gruppen von 150s eingeteilt wurdenSchritt 2: Abschnitte auswählen, wo genug (hier über 10) Datenpunkte drin liegenSchritt 3: In die 4 ausgewählten Zeitausschnitte wurden dann jeweils Linien gefitted, die Latitude und Longitude miteinander verbindenSchritt 4: Anschauen der Fits, dabei fällt auf dass 2 der Linien überhaupt nicht passen, 2 aber ganz gut. Eine Linie sah besoners gut aus dabeiProblem: die beiden guten Linien haben nicht die selbe Steigung, daher gibts nicht im eigentlichen Sinne einen Abstand zwischen ihnenLösung/Schritt 5: Die Steigung der besser aussehenden Linie wurde auch für die zweite Linie verwendet, aber die Achsenschnittpunkt wurde neu gefittetSchritt 6: Jetzt wurde der Abstand der beiden Linien(genau die Differenz der Achsenschnittpunkte) durch den Zeitlichen Abstand geteilt und herauskam: 305m/sDas ist etwas langsamer als SchallgeschwindigkeitKlingt soweit auch plausibel, denn der Schall war ja auch noch sehr weit zu hörenWir haben hier aber nur die Druckwelle gemessen, die wir nicht hören konntenEs gab noch andere Luftdrucksensoren und damit noch weiter Daten in der Sensor.CommunityAlle Sensoren zusammen: BMP180, BMP280 und BME280Das waren deutlich mehr Daten, wo Ausreißer nicht mehr manuell vorher gefiltert werden konntenDaher sah die Auswertung aller Daten anders ausAuswertung 2:Schritt 1: Daten als Histogramm plotten, wobei sie in Gruppen von 150s eingeteilt wurdenSchritt 2: Abschnitte auswählen, wo die meisten Datenpunkte drin liegen (3 Stück)Schritt 3: In die 3 ausgewählten Zeitausschnitte wurden dann jeweils Linien gefitted, die Latitude und Longitude miteinander verbindenSchritt 4: Es gibt ziemlich üble Ausreißer, diese werden über die sogenannte 'cooks distance' ermittelt und rausgelöscht.Schritt 5: Nochmal fitten wie in Schritt drei, aber ohne AusreißerSchritt 6: Anschauen der Fits, dabei fällt auf dass die Linien ganz ok passen, aber sie natürlich wieder andere Steigungen habenSchritt 7: Nochmal die Daten fitten, aber diesmal alle Daten zusammen, und alle Daten gehen in die Steigung ein, aber der Achsenschnittpunkt wird pro Gruppe einzeln bestimmtSchritt 8: Nochmal die Fits angucken. Diesmal sieht die Linie für Gruppe 3 etwas unpassend aus, weil die meisten Punkte an einem ähnlichen Ort liegen, und der Achsenschnittpunkt nicht richtig passen könnte, also wird diese Linie aussortiertSchritt 9: Jetzt wurde der Abstand der beiden Linien (genau die Differenz der Achsenschnittpunkte) durch den zeitlichen Abstand geteilt und herauskam: 304 m/sDamit ist die erste Rechnung verifiziert wordenHelena hat auch nach Veröffentlichungen gesucht, die es dazu gab, diese hat sie gefunden: https://rmets.onlinelibrary.wiley.com/doi/10.1002/wea.4171Laut dieser lagen die Geschwindigkeiten der Druckwelle auch so zwischen 305m/s und 311m/s, wir liegen also ganz gut drin.Fazit (01:02:05)
Das Ziel der Folge war es, ein bisschen Spaß mit Sensordaten zu haben und zu zeigen, was damit so gehtZusammenfassend: im Kleinen hat das nicht so einfach funktioniert, wie Janine das dachteAlso zum Beispiel, dass das interpretieren der Daten gerade bei lokalen Ereignissen eher schwierig istWeil Ursachen ggf. einfach im Rauschen verschwindenInsgesamt ist es aber sehr spannend diese Daten im Blick zu haben und sich mit der eigenen Umwelt auseinander zu setzenInteressant fand Janine daran vor allem die globalen EreignisseHelena fand das Thema spannend, weil wir eigene Daten erfasst haben und sie in die Auswertung richtig einsteigen konnte und es kamen Dinge bei raus, mit denen sie anfangs überhaupt nicht gerechnet hatteDas werden wir irgendwann sicherlich nochmal tun Wer Lust auf mehr Sensordaten hat:In der Sensor.Community ist gerade ein Lärmsensor in EntwicklungEs gibt die Option Wetterstationen mit Arduino oder Raspberry Pi zu bauenVisuelle Datenerfassung mittels Nistkastenüberwachung (kombinierbar mit Klimaüberwachung im Nistkasten)Wir hoffen es hat euch gefallen und Lust auf Sensordaten bekommen oder macht das eh schonWas ist DivAirCity? (01:07:20)
Es ging heute auch ein bisschen um Citizen Science dadurch, dass es Daten waren, die alle erfassen könnenUnd als wir dieses Thema angekündigt hatten mit Feinstaub, wurden wir von jemandem vom Hasso Plattner Institut in Potsdam angesprochenDas HPI ist an einem EU-Projekt zum Thema Luftqualität in Städten beteiling: https://divaircity.eu/Kernpunkte des ganzen Projektes sind: Inclusive data, Empowering citizens, Smart cities contracts und knowledge sharingWir unterstützen das Projekt und mal schauen, ob es da noch eine Kooperation oder auch eine Podcastfolge gibtLasst uns gerne wissen, ob euch das interessiert und ihr dazu gerne eine Folge hättetEs ist spannend Forschung live zu beobachtenNächste Folge? Ja, bestimmt (01:08:54)
Unsere Nächste Folge gibt es bestimmt Ende MaiWir können aber noch nicht sagen was, lasst euch einfach überraschen, was dann bei rausgekommen istCall to Action (01:09:19)
Wenn ihr uns weiter hören möchtet, folgt uns auf Twitter unter @datenlebenOder besucht unsere Webseite: www.datenleben.deHinterlasst uns gerne Feedback, wir würden uns darüber sehr freuenIhr könnt uns als Data Scientists auch Buchen für Analysen oder ProjekteHabt ihr Fragen oder Themen, die euch interessieren? Dann schreibt uns!Outro (01:10:05)
Schlagworte zur Folge
Feinstaub, Citizen Science, Luftdaten, Temperatur, Sensor, Sensoren, Luftdruck, Gesundheit, AirRohr
Quellen
datenleben: dl024 waldbrände https://sensor.community/Umweltbundesamt: FeinstaubWikipedia: KorrelationskoeffizientUmweltbundesamt: Luftdaten. StationenDeutscher Wetterdienst: SaharastaubTwitter, @NicosPanoptikum: Heute früh (5:00 MEZ) ereignete sich in der Südsee eine erneute Eruption des Vulkans auf Hunga #Tonga ... Twitter, @chrisoutofspace: Images from GOES-West so far. #TongaWikipedia: UTM-KoordinatensystemWikipedia: World Geodetic System 1984Wikipedia: European Petroleum Survey Group GeodesyGiuseppe Petricca: Monitoring the massive Tonga volcanic explosion of 15 January 2022 from Stornoway, Scotlandhttps://divaircity.eu/