# Entwicklung der Luftqualität (Teil 2)

Zeitreihenanalyse der Luftqualität

Sören Sparmann (Universität Paderborn) 
2025-05-30

## 1 Entwicklung der Luftqualität

**Wie hat sich die Luftbelastung durch Schadstoffe in den letzten drei
Jahrzehnten verändert?**

**An welchen Tagen treten besonders hohe Konzentrationen auf?**

Diesen und weiteren Fragen werden im zweiten Teil der Zeitreihenanalyse
untersucht.

<figure>
<img src="attachment:figures/car_exhaust_cropped.png"
alt="Foto „Car exhaust“ (Ausschnitt) von eutrophication&hypoxia (Ruben de Rijcke) unter der Lizenz CC BY 2.0 via Flickr." />
<figcaption aria-hidden="true">Foto „Car exhaust“ (Ausschnitt) von <a
href="https://www.flickr.com/photos/48722974@N07">eutrophication&hypoxia
(Ruben de Rijcke)</a> unter der Lizenz <a
href="https://creativecommons.org/licenses/by/2.0/?ref=openverse">CC BY
2.0</a> via <a
href="https://www.flickr.com/photos/48722974@N07/4478993066">Flickr</a>.</figcaption>
</figure>

## 2 Daten einlesen

Zunächst werden die Daten erneut mit dem Befehl `read_csv()` eingelesen
und in einem DataFrame `df` gespeichert.

In [2]:
# Bibliothek für das Arbeiten mit tabellarischen Daten importieren
import pandas as pd

# Daten einlesen
df = pd.read_csv('data/air_quality.csv', index_col='time', parse_dates=True)

# Daten anzeigen
df

> **Hinweis**
>
> Der Eintrag `NaN` (Not a Number) bedeutet, dass an der betreffenden
> Stelle kein Messwert vorliegt (z.B. weil keine Messung durchgeführt
> wurde oder ein Messfehler vorliegt).

## 3 Jahresmittelwerte

Um die Entwicklung der Schadstoffbelastung zu analysieren, werden
zunächst die **Jahresmittelwerte** für den gesamten Zeitraum berechnet.

Da die Daten für die Jahre 1989 und 1990 unvollständig sind, wird der
Betrachtungszeitraum auf die Jahre 1991 bis 2024 eingeschränkt, um eine
Verfälschung der Mittelwerte zu vermeiden.

In [3]:
import plotly.express as px

# Daten auf den Zeitraum von 1990 bis 2023 einschränken
df = df.loc['1991':'2024']

# Jahresdurchschnitt ermitteln
annual_mean = df.resample('YS').mean()

# Daten visualisieren
fig = px.line(annual_mean, title='Entwicklung der Luftqualität seit 1991')

fig.update_xaxes(title="Jahr")
fig.update_yaxes(title="Schadstoffkonzentration<br>Jahresmittelwert")
fig.update_legends(title="Schadstoff")

fig.show()

#### Aufgabe 4

1. Wie hat sich die Schadstoffbelastung in den letzten drei Jahrzehnten
 entwickelt?
2. Wie hat sich die COVID-19-Pandemie (2020 - 2023) auf die
 Luftqualität ausgewirkt?
3. Wie lässt sich die Entwicklung der einzelnen Schadstoffe erklären?
 Recherchiere im Internet nach Ursachen für den Rückgang bzw. Zuwachs
 des jeweiligen Schadstoffs! *(1-2 Stichpunkte)*

*(10 Minuten)*

**Antwort**

*Klicke hier, um deine Antwort einzugeben.*

## 4 Durchschnittlicher Jahresverlauf

**In welchem Monaten ist die Schadstoffbelastung in der Luft besonders
hoch?**

Um die Daten anhand der Monate zu gruppieren, muss zunächst der Monat
für jeden Eintrag ermittelt werden. Dazu wird auf das Attribut `month`
(Monat) zugegriffen.

In [4]:
# Monat ermitteln (1 = Januar, 12 = Dezember)
month = df.index.month
month

Index([ 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
 ...
 12, 12, 12, 12, 12, 12, 12, 12, 12, 12],
 dtype='int32', name='time', length=11688)

> **Hinweis**
>
> Anders als zuvor wurden hier die Monate aus verschiedenen Jahren
> gruppiert, um einen mittleren Jahresverlauf zu ermitteln.

Anschließend werden die Daten anhand der Liste der Monate gruppiert und
der Mittelwert berechnet.

In [5]:
# Daten nach Monat gruppieren und mitteln
monthly_mean = df.groupby(month).mean()
monthly_mean

In [6]:
# Monatsnamen verwenden (statt Zahlen)
monthly_mean.index = ['Januar', 'Feburar', 'März', 'April', 'Mai', 'Juni', 'Juli', 'August', 'September', 'Oktober', 'November', 'Dezember']
monthly_mean

In [7]:
# Jahresverlauf
fig = px.line(monthly_mean, title="Durchschnittliche Schadstoffkonzentration in Verlauf eines Jahres")

fig.update_xaxes(title="Monat")
fig.update_yaxes(title="Schadstoffkonzentration<br>Monatsmittelwert [µg/m<sup>3</sup>]")
fig.update_legends(title="Schadstoff")

fig.show()

#### Aufgabe 5

1. Welche Schadstoffe sind eher im Winter / eher im Sommer vorhanden?
2. Wie lassen sich die unterschiedlichen Verläufe erklären? Nenne
 mögliche Ursachen! *(Stichpunkte)*

*(10 Minuten)*

**Antwort**

*Klicke hier, um deine Antwort einzugeben.*

## 5 Durchschnittliche Schaddstoffbelastung nach Wochentag

Auf die gleiche Weise wie zuvor lassen sich die Daten auch anhand des
Wochentags gruppieren. Hierfür wird das Attribut `dayofweek` (Wochentag)
verwendet.

In [8]:
# Wochentag Monday=0, Sunday=6
dayofweek = df.index.dayofweek
dayofweek

Index([1, 2, 3, 4, 5, 6, 0, 1, 2, 3,
 ...
 3, 4, 5, 6, 0, 1, 2, 3, 4, 5],
 dtype='int32', name='time', length=11688)

In [9]:
# Daten nach Wochentag gruppieren
grouped = df.groupby(dayofweek)

# Mittelwert berechnen
weekday_mean = grouped.mean()

# Wochentagsnamen verwenden
weekday_mean.index = ['Montag', 'Dienstag', 'Mittwoch', 'Donnerstag', 'Freitag', 'Samstag', 'Sonntag']

fig = px.bar(weekday_mean, barmode='group', title="Durchschnittliche Schadstoffkonzentration nach Wochentag")

fig.update_xaxes(title='Wochentag')
fig.update_yaxes(title='Schadstoffkonzentration')
fig.update_legends(title='Schadstoff')

fig.show()

### 5.1 Ozon Weekend Effect

Der *Ozone Weekend Effect* in Städten bezeichnet das Phänomen, dass die
Ozonkonzentrationen an Wochenenden oft höher sind als an Werktagen,
trotz geringerer Emissionen von Vorläuferstoffen wie Stickoxiden. Dies
liegt daran, dass an Werktagen Stickoxide aus Verkehr und Industrie als
Ozonzerstörer wirken, während an Wochenenden die geringeren Emissionen
dazu führen, dass weniger Ozon abgebaut wird. Zudem tragen veränderte
meteorologische Bedingungen und eine Verschiebung der chemischen
Prozesse zur Ozonbildung an Wochenenden bei. Die genaue Dynamik variiert
je nach Stadt und regionalen Bedingungen.

Quelle: [Pierre Sicard, Elena Paoletti, Evgenios Agathokleous, Valda
Araminienė, Chiara Proietti, Fatimatou Coulibaly, Alessandra De Marco,
Ozone weekend effect in cities: Deep insights for urban air pollution
control, Environmental Research, Volume 191,
2020](https://www.sciencedirect.com/science/article/pii/S0013935120310902)

## 6 Feinstaub an Silvester und Neujahr

Vielleicht hast du schon einmal davon gehört, dass die
**Feinstaubbelastung in der Silvesternacht besonders hoch** sein soll.
Aber stimmt das wirklich?

In den letzten beiden Abschnitt wurden die Daten mit der `groupby()`
Methode nach dem Attributen `df.index.month` (Monat) und
`df.index.dayofweek` (Wochentag) gruppiert.

#### Aufgabe 6

- Gruppiere die Daten nach dem Tag im Jahr. Verwende dafür das
 Attribut `df.index.dayofyear`.
- Überprüfe, ob die Feinstaubbelastung an Silvester und Neujahr höher
 ist als im Rest des Jahres!

*(15 Minuten)*

**Antwort**

*Klicke hier, um deine Antwort einzugeben.*

## 7 Zusammenfassung

In diesem Notebook hast du gelernt, wie du:

- Daten mit der Funktion `read_csv()` einlesen kannst,
- ein Liniendiagramm mit `line()` und ein Säulendiagramm mit `bar()`
 erstellst,
- eine bestimmte Spalte aus den Daten selektierst, z. B. mit
 `df[<Spalte>]`,
- Daten anhand einer Bedingung filterst, z. B. mit `df[cond]`,
- Zeitreihen mit `resample()` in Zeitintervalle gruppierst und mit
 Funktionen wie `count()`, `mean()`, `min()` oder `max()`
 aggregierst.