FAQ

Forschungsdaten sind Daten, die im Verlauf eines wissenschaftlichen Prozesses generiert oder weiterverarbeitet werden. Sie sind häufig die Basis für Forschungsergebnisse. Daten können sehr unterschiedlich gefasst werden, zum Beispiel:

  • Messergebnisse,
  • Sekundäranalysen,
  • Visualisierungen,
  • Modelle,
  • Umfrageergebnisse oder
  • Erhebungen.

Auch die Dateiformate können sehr heterogen sein. Hier sind zum Beispiel die unterschiedlichen Darstellungen und Speicherungen von Zahlen, Text oder Grafiken zu betrachten. Mitunter werden physische Proben wie Mineralien oder Gewebe als Daten" definiert.

Zur guten wissenschaftlichen Praxis (DFG-Richtlinie) gehört es, dass die Forschungsdaten, die Basis von Publikationen bilden, mindestens zehn Jahre aufbewahrt werden. Zudem ergibt sich eine Nachnutzungsmöglichkeit, wenn möglichst viele Daten öffentlich zugänglich sind. So lassen sich Forschungsergebnisse auch besser überprüfen. Fördermittelgeber (z.B. BMBF oder DFG) aber auch Zeitschriften verlangen in zunehmendem Maße, Forschungsdaten zu veröffentlichen.

Bereits vor der Durchführung eines Forschungsprojektes sollte der Umgang mit Daten definiert sein. Hierzu kann ein Datenmanagementplan genutzt. Er beinhaltet Aussagen zur Dateiverwaltung und einer entsprechenden Dateidokumentation, zu Speicherkapazitäten und Sicherheitsaspekten sowie zu Backup-Strategien. Bei einer Publikation der Forschungsdaten muss eine eindeutige Identifizierung der Datensätze und somit die Zitierbarkeit sichergestellt sein. Beispielsweise kann mithilfe des "Digital Object Identifiers" (DOI) dies erreicht werden.

Abhängig vom Fördermittelgeber, der entsprechenden Ausschreibung, der Fachkultur oder der Art der erhobenen Daten müssen Angaben zum Umgang mit Forschungsdaten gemacht werden. In jedem Fall sollte dargelegt werden, wie Daten aufbewahrt werden (Leitlinie der DFG, mindestens 10 Jahre). Üblicherweise erwartet der Förderer auch, dass Sie Ihre Forschungsdaten nach Projektabschluss öffentlich zur Verfügung stellen, sofern dem keine rechtlichen Gründe (Datenschutz, Patentrecht, vertragliche Vereinbarungen mit Industriepartnern, etc.) entgegenstehen. Das wiederum setzt eine angemessene Aufbereitung voraus.

Ausführlichere Informationen zum Thema haben wir unter Projektanträge zusammengestellt. Wenn Sie eine persönliche Beratung wünschen, steht Ihnen der Leiter Strategisches Forschungsmanagement, Dr. Carsten Thoms, gerne zur Verfügung. Für DFG-Anträge lohnt sich außerdem ein Blick in das Dokument Forschungsdatenmanagement in DFG-Anträgen: Was kann, was soll, was muss beschrieben werden?

Die Wahl eines geeigneten Dateiformats ist insbesondere mit Blick auf langfristige Speicherung und Nutzung der Daten bedeutsam. Einige Eigenschaften sind dabei in der Regel gewünscht: Dateien / Formate sollten nicht verschlüsselt, nicht komprimiert und nicht patentiert sein. Offene, dokumentierte Standards werden bevorzugt, z. B.

sind empfohlen:

  • Tagged Image File Format (TIFF, TIF) für Bilder
  • Plain text document (TXT, ASC) für Dokumente
  • Portable Document Format/A (PDF/A) für Dokumente
  • Waveform Audio File Format (WAV) für Audiodateien
  • Extensible Markup Language (XML) für Dokumente

 

Anhand von Metadaten werden Ressourcen beschrieben, um ihre Auffindbarkeit zu optimieren. Zu den Informationen gehören beispielsweise Titel, Autor/Primärforscher, Institution, Identifier, Ort und Zeitraum, Thema, Rechte, Dateinamen, Formate, etc. Da diese Informationen für das Auffinden, das Verständnis und die Nutzung von Daten essentiell sind, sollten standardisierte Metadatenschemata eine möglichst einheitliche und nachvollziehbare Beschreibung sicherstellen.

Metadatenschemata sind Zusammenstellungen von Elementen zur Beschreibung von Daten. Einige Disziplinen verfügen bereits über spezifische Metadatenschemata, wie etwa die Geisteswissenschaften (Text Encoding Initiative TEI), die Geowissenschaften (ISO 19115, Darwin Core), die Naturwissenschaften (ICAT Schema, Cristallographic Information Framework, conventions for Climate and Forecast metadata) und die Sozial- und Wirtschaftswissenschaften (Digital Documentation Initiative DDI).

Vor Beginn der Dokumentation ihrer Daten sollten Sie daher prüfen, ob für Ihre Disziplin bereits ein passendes Metadatenschema existiert. Sollte kein fachspezifisches Schema zur Verfügung stehen, kann auch ein disziplinunabhängiges genutzt werden (z.B. Dublin Core, MARC21 oder RADAR). Metadatenschemata legen fest, welche Informationen geliefert werden sollen.

Eine Dokumentation geht in der Regel über die Beschreibung der Daten via Metadaten hinaus. Sie stellt eine tiefere, fachwissenschaftliche Erschließung dar, in deren Rahmen z.B. Entstehungskontext, Variablen, Instrumente, Methoden etc. ausführlich beschrieben werden. In vielen Fällen ist eine solche Beschreibung unerlässlich, um die Daten verstehen, nachprüfen und ggf. nachnutzen zu können.

Daten unterliegen meist keinem eigenständigen Rechtsschutz, weswegen eine Lizensierung sehr sinnvoll sein kann. Für Forschungsdaten bieten sich offene Lizenzen wie beispielsweise eine der Creative Commons 4.0 Lizenzen an. Bei der Wahl der Lizenz sollte man außerdem beachten, dass diese für Forschungsdaten geeignet ist und eine möglichst weitreichende Nachnutzung erlaubt.

Vorsicht bei der Veröffentlichung von Forschungsdaten ist geboten, wenn es sich um sensible und/ oder personenbezogene Daten handelt, für die eine Anonymisierung/ Pseudonymisierung nicht oder nur teilweise gewährleistet werden kann. Eine Möglichkeit wäre hier der Zugang zu den Daten nur auf persönliche Anfrage beim Autor. Außerdem muss hier immer eine Einwilligung der Betroffenen vorliegen. Alternativ können auch nur die Metadaten zugänglich gemacht werden. Weitere Einschränkungen können auch von Industriepartnern auferlegt werden. Enthalten die Daten einen großen Teil eines anderen Werks oder einer Datenbank, sollte auf jeden Fall vorher mit den Urhebern gesprochen werden.

Letzte Änderung: 07.02.2020 - Ansprechpartner: Webmaster