Datenlebenszyklus

Der Datenlebenszyklus hilft Dir dabei, besser zu verstehen, wie man mit Daten arbeitet – von der ersten Idee bis zur fertigen Auswertung. In sieben Schritten lernst Du, wie Du eine Fragestellung entwickelst, passende Daten findest, sie untersuchst und daraus spannende Erkenntnisse gewinnst.

Ob für ein Projekt, eine Präsentation oder zur Lösung eines echten Problems: Mit dem richtigen Umgang mit Daten kannst Du fundierte Entscheidungen treffen, Zusammenhänge entdecken und Deine Ergebnisse überzeugend präsentieren.

PDF

CDEC Datenlebenszyklus

CDEC Datenlebenszyklus

1. Fragestellung formulieren

  • Welche Frage will ich mit Hilfe von Daten beantworten?
  • Welche Daten brauche ich?
  • Wie gehe ich vor?
  • Welche Fragen kann ich an Daten stellen?
  • Welche Fragen können mit Daten beantwortet werden?
  • Welches Problem will ich mit Daten lösen?
  • Warum brauche ich Daten, um dieses Problem zu lösen?
  • Welche Daten brauche ich?
  • Wo finde ich die Daten?
  • Wie viele Daten brauche ich?
  • Welche räumlichen und zeitlichen Auflösungen brauche ich für meine Fragestellung?
Hinweis

Oft steht am Anfang der Datennutzung eine Problem- oder Fragestellung, und Ihr plant die Datenerhebung. Der Datenlebenszyklus ist ein idealisierter Prozess. Ihr könnt mit einem anderen Schritt anfangen, der besser zu Eurer Ausgangssituation passt.

2. Daten beschaffen

  • Welche Datenquellen kann ich nutzen?
  • Wo finde ich diese?
  • Wie ist die Qualität der Daten?
  • Welche räumliche und zeitliche Auflösung bieten sie?
  • Kann ich auf vorhandene Datenquellen zurückgreifen?
  • Sind die Daten frei verfügbar oder lizenziert?
  • Gibt es Datenbanken oder Datenportale, die Daten für meine Fragestellung enthalten?
  • Welche Satellitensensoren (z. B. Sentinel-2, Landsat 8, MODIS) sind relevant für mein Vorhaben?
  • Welche Plattformen oder Portale bieten Zugang (z. B. Copernicus Open Access Hub, EarthExplorer, Google Earth Engine)?

3. Daten explorieren & bereinigen

  • Wie erkunde ich meine Daten sinnvoll?
  • Wie bereinige ich die Daten systematisch und transparent?
  • Welches Format haben die Daten?
  • Welche Variablen liegen in meinem Datensatz vor?
  • Welche Datentypen und Wertebereiche haben diese Variablen?
  • Gibt es fehlende oder unplausible Werte?
  • Welche Visualisierungen helfen mir, die Daten zu verstehen?
  • Gibt es Störungen (z. B. Wolken, Schatten, Schnee, Scanfehler), die ich maskieren muss?
  • Welche Beziehungen bestehen zwischen den Variablen?
  • Welche Metadaten oder Kontextinformationen brauche ich zum Verständnis?
  • Welche (ethischen oder methodischen) Kriterien sind für die Bereinigung wichtig?
  • Welche Vorgaben oder Standards gibt es zur Datenbereinigung?
  • Welche Tools oder Prozesse nutze ich für eine saubere Datenbasis?
Hinweis

Bei der Arbeit mit Satellitendaten greift Ihr in der Regel auf bereits vorhandene Datensätze zurück. Entscheidend ist die gezielte Auswahl passender Quellen sowie eine kritische Prüfung der Datenqualität, Auflösung und Vorverarbeitung. Bevor Ihr mit der Analyse beginnt, solltet Ihr Euch einen Überblick über Eure Daten verschaffen. Die Erkundung und Bereinigung der Daten sind zentrale Schritte, um ihre Qualität zu sichern und verlässliche Ergebnisse zu ermöglichen.

4. Daten auswerten

  • Wie analysiere ich die Daten?
  • Wie interpretiere ich die Ergebnisse?
  • Welche Analysemethoden passen zu meiner Fragestellung und zu meinen Daten?
  • Welche Tools nutze ich für die Analyse?
  • Welche Indizes oder Merkmalsextraktionen kann ich zur ersten Exploration nutzen (z. B. NDVI, NDBI)?
  • Kann mich eine KI-Anwendung bei der Analyse unterstützen?
  • Nutze ich maschinelles Lernen, z. B. zur Landnutzungsklassifikation?
  • Wie interpretiere ich die Daten und die durchgeführte Datenanalyse?
  • Gibt es Eigenschaften meiner Daten oder des bisherigen Verarbeitungsprozesses, die ich kritisch hinterfragen sollte?

5. Daten visualisieren

  • Wie visualisiere ich die Daten ansprechend für die Zielgruppe?
  • Welche Visualisierung passt zu meiner Fragestellung und zu meiner Datenanalyse?
  • Brauche ich eine einfache (statische) Darstellung oder eine dynamisch-interaktive Darstellung?
  • Welche Tools möchte ich für die Visualisierung nutzen?
  • Welche Vorgaben für die Visualisierung ergeben sich aus der Analyse?
  • Was will ich hervorheben?
  • Welche Visualisierung passt zu der Zielgruppe meiner Kommunikationsstrategie?
  • Auf welchen Kanälen wird die Visualisierung platziert?
  • Nutze ich Webkarten, interaktive Dashboards oder animierte Zeitreihen?
  • Welche Farben/Indizes wähle ich für RGB-Komposite?
Hinweis

Eine gute Datenvisualisierung ist entscheidend, Eure Aussage verständlich zu kommunizieren und inhaltlich zu unterstreichen. Behaltet Eure Zielgruppe im Blick und konzentriert Euch auf Eure Kernaussagen.

6. Ergebnisse kommunizieren

  • Wie kommuniziere ich die Daten zielgruppengerecht?
  • Was will ich betonen?
  • Was sind meine wichtigsten Erkenntnisse?
  • An wen kommuniziere ich?
  • Welche Erkenntnisse will ich betonen?
  • Wie baue ich eine gute Geschichte rund um die Daten auf (Storytelling)?
  • Wie mache ich meine Erkenntnisse auch für Laien verständlich?
  • Wie kann ich die Daten für meine Anliegen aufbereiten?
  • Wie stelle ich Daten der Öffentlichkeit zur Verfügung?
  • Welche (Open Data) Portale oder Medien kann ich nutzen?

7. Entscheiden & handeln

  • Beantworten die Daten meine Fragestellung?
  • Was sind die nächsten Schritte?
  • Haben die Daten meine Fragen beantwortet?
  • Was sind die Schlussfolgerungen?
  • Welche Entscheidungen treffe ich auf Basis der Daten?
  • Kann ich aus meinem Datensatz weitere Daten-Projekte entwickeln?
  • Wie geht es weiter?
  • Welche Handlungen leite ich ab?
  • Kann ich die Daten anderen als Offene Daten zur Verfügung stellen?
  • Oder archiviere bzw. lösche ich sie?
  • Kann oder muss ich eine neue Fragestellung entwickeln?
  • Welche Erfahrungen aus dem Prozess kann ich aufbereiten und veröffentlichen?
  • Welche Qualität hatte mein Analyse- und Verarbeitungsprozess?
  • Welchen Anschlussnutzen könnten meine Daten für andere oder fürs Gemeinwohl haben?
Hinweis

Am Ende der Datennutzung stehen meist eine Entscheidung und die Reflexion des Datenverarbeitungsprozesses. Manchmal ergeben sich daraus neue Fragestellungen und weitere Datenprojekte.

Wiederverwendung

close all nutshells