Management von Forschungsdaten – komplexe Anforderungen an Forschende und Anbieter von Serviceleistungen

von Birte Lindstädt

Jedes Jahr im Oktober findet die International Open Access Week statt. Weltweit organisieren Bibliotheken und andere Wissenschaftseinrichtungen Aktionen, um auf das Thema Open Access aufmerksam zu machen. Auch ZB MED beteiligt sich an der Open Access Week. Wir informieren in der kommenden Woche über Open Access und Open Science, also die Öffnung des gesamten Forschungsprozesses. Zudem stellen wir unsere Dienstleistungen kurz vor.

Wissenschaftliche Erkenntnisse werden in Textform präsentiert – in der Regel basieren sie jedoch auf Daten, die im Forschungsprozess entstehen. Die ZB MED-Angebote zu Forschungsdaten orientieren sich an den sogenannten FAIR-Prinzipien, einem Set von Leitlinien, um Forschungsdaten auffindbar (findable), zugänglich (accessible), interoperabel (interoperable) und nachnutzbar (reusable) zu machen. Die Prinzipien bieten einen Rahmen für das Management wissenschaftlicher Forschungsdaten für alle, die am Forschungsprozess beteiligt sind.

Forschungsdatenmanagement betrifft den gesamten Lebenszyklus der Daten. Es erfordert daher ganzheitliche Lösungen, die im Konsens zwischen den Beteiligten gefunden werden müssen. Bibliotheken können in diesem Prozess eine treibende und vermittelnde Kraft sein. Aus dieser Einsicht heraus entwickelt ZB MED unterstützende Services für Forschende und Multiplikatoren entlang des Lebenszyklus von Forschungsdaten. Dies beginnt bei der Erstellung eines Datenmanagementplans zur dynamischen Fortschreibung im Projektverlauf. Dazu erprobt ZB MED aktuell die Anwendung des Research Data Management Organiser (RDMO) in einem agrarwissenschaftlichen Forschungsprojekt und stellt eine Instanz – den RDMO4Life – zur Nutzung durch andere lebenswissenschaftliche Forschungseinrichtungen zur Verfügung.

Die Services von PUBLISSO entlang des Lebenszyklus von Forschungsdaten.

Im Hinblick auf die Dokumentation von Daten spielt in den Lebenswissenschaften das Elektronische Laborbuch oder Electronic Lab Notebook (ELN), eine wichtige Rolle. Um den Beratungsbedarf zu diesem Thema zu begegnen, hat ZB MED einen Leitfaden  erstellt.

Zentral für die Dokumentation ist darüber hinaus die Einhaltung von Standards, insbesondere Metadatenstandards. Im Rahmen von Projektanträgen in einzelnen lebenswissenschaftlichen Fachcommunities werden deshalb Kurationskriterien und Qualitätsstandards von Forschungsdaten gemeinsam mit Forschungseinrichtungen erprobt.

Bei der Publikation bietet ZB MED zum einen eine Publikationsberatung an. Zum anderen wird das Fachrepositorium Lebenswissenschaften (FRL) aufgebaut, um gegebenenfalls Lücken in der Versorgung lebenswissenschaftlicher Forschungseinrichtungen mit Forschungsdatenrepositorien zu schließen. Zum Publikationsservice gehört auch die Vergabe von persistenten Identifikatoren, sogenannten Digital Object Identifiern (DOI). ZB MED ist DOI-Vergabestelle und Data Cite-Mitglied. Das ZB MED-Suchportal LIVIVO enthält Nachweise zu Forschungsdaten.

Die Digitale Langzeitarchivierung (dLZA) als eine der letzten Phasen im Datenlebenszyklus wird im Rahmen eines Pilotprojekts mit einem außeruniversitären Forschungsinstitut erprobt, so dass das dauerhafte Lesbarhalten von Forschungsdaten und darauf basierend die dLZA bei ZB MED ausgebaut werden kann.
Begleitet werden diese Services durch ein umfangreiches Beratungsangebot: Workshops zu unterschiedlichen Themen, Vorträge auf lebenswissenschaftlichen und bibliothekarischen Fachkonferenzen, Webinare und Tutorials.

Alle Angebote von ZB MED rund um das Forschungsdatenmanagement finden Sie auf dem Open-Access-Publikationsportal PUBLISSO.

Kontakt: publisso@zbmed.de


Weitere Informationen

PID-Services für Forschungsdaten im Bereich Lebenswissenschaften

Bericht vom Workshop über persistente Identifikatoren am 23. Januar 2019 bei ZB MED – Informationszentrum Lebenswissenschaften am Standort Köln

von Birte Lindstädt

Im gesamten Lebenszyklus von Forschungsdaten kommt den persistenten Identifikatoren (PIDs) eine zentrale Funktion zu: Sie ermöglichen die verlässliche Referenzierbarkeit und langfristige Verfügbarkeit von Forschungsdaten. PIDs schaffen allerdings noch andere, weniger bekannte Möglichkeiten der Datenreferenzierung und -nachnutzung. So werden PIDs auch eingesetzt, um Arbeitsdaten eindeutig zu kennzeichnen, zum Beispiel Datensatz-Versionen zu unterscheiden und somit einen Austausch in einer Arbeits- oder Projektgruppe zu ermöglichen (vgl. ePIC PID).

Vor dem Hintergrund, dass in manchen lebenswissenschaftlichen Disziplinen Forschungsdaten aufgrund der Datenschutzgesetzgebung oftmals nicht publiziert werden können, kommt dem Nachweis der Forschungsdaten eine große Bedeutung zu. Deshalb können neben publizierten Forschungsdaten auch nur eingeschränkt zugängliche Daten mit einem PID – konkret zum Beispiel einem DOI – und entsprechenden öffentlichen Metadaten versehen werden; die Forschungsdaten selbst bleiben in einer den jeweiligen Datenschutzregelungen entsprechenden Umgebung.

Um die verlässliche Referenzierbarkeit nicht nur der Forschungsdaten selbst, sondern auch die der jeweiligen Datenproduzenten zu gewährleisten, gibt es personen- bzw. institutionenbezogene PIDs, zum Beispiel ORCID (Open Researcher and Contributor ID).

Das Verknüpfen der einem Datensatz jeweils zugewiesenen PIDs in Suchportalen eröffnet neue Möglichkeiten der Wertschöpfung aus Daten bzw. des Erkenntnisgewinns.

Der Workshop stellte PIDs in einen breiteren Kontext, indem folgende Fragen beantwortet wurden:

  • Was ermöglichen PIDs jenseits des Aspekts der Persistenz und wie kann der Forschungsprozess dadurch verbessert werden?
  • Welche PIDs gibt es und was sind ihre Anwendungsfelder?
  • Welche aktuellen Entwicklungen rund um PIDs finden auf nationaler und europäischer Ebene statt?
  • Best-Practice-Berichte: Wie sieht die aktuelle Praxis bei den Datenzentren im Hinblick auf PIDs aus und was sind die Herausforderungen?
  • Welche Services rund um PIDs werden von ZB MED angeboten oder sind in Planung?

Unter den Teilnehmenden waren Vertreterinnen und Vertreter verschiedener Informationsinfrastrukturen: Bibliotheken, Museen, Forschungseinrichtungen und Rechenzentren.

Die regen Diskussionen zeigten, dass sich verschiedene PID-Systeme aktuell in einer Phase der Reifung und Konsolidierung befinden. Die Schnittstellen zwischen PID-Systemen – etwa hinterlegte Metadatenschemata – müssen dabei noch weiterentwickelt und implementiert werden, damit die Mehrwerte für die dauerhafte Referenzierbarkeit und Interoperabilität von Forschungsdaten, die mit den PIDs assoziiert und von ihnen erhofft werden, auch tatsächlich realisiert werden können.

Dies ist insbesondere im Hinblick auf das Forschungsdatenmanagement zwingend notwendig. Eine 2018 von ZB MED in Auftrag gegebene Umfrage unter Forschenden in den Lebenswissenschaften zeigt nämlich, dass aktuell zwar bereits 81% der Befragten PIDs nutzen, lediglich 22% von ihnen aber auch PIDs für Forschungsdaten vergeben.

Wie wichtig die Verbreitung der PID-Anwendung für Forschungsdaten ist, demonstrierte Benedikt Hummel vom Bundesinstitut für Risikobewertung (BfR) am Beispiel der Animal Study Registry. Die Veröffentlichung von Tierversuchsdaten einschließlich Metadaten, die deren bestmögliche Auffindbarkeit und Referenzierbarkeit sichern sollen, ist die Voraussetzung, um unnötige Tierversuche zu reduzieren. Neben diesem ethischen Aspekt wird auch die Effizienz und Qualität der Forschung erhöht, indem redundante Studien vermieden und datenbasierte Plausibilitätsprüfungen ermöglicht werden.

Jens Dierkes stellte anschließend vor, welche Herausforderungen an der Universitäts- und Stadtbibliothek Köln in puncto PIDs, insbesondere DOI (Digital Object Identifier), bestehen. Danach zeigte er auf, welche Lösungen aktuell entwickelt werden. Besonders interessant war die Entwicklung eines neuartigen Ansatzes, ein User-Interface auf der Basis von Unterdomains anzubieten. Dadurch sollen einzelne Institute in die Lage versetzt werden, selbstständig DOIs unter dem ihnen zugewiesenen DOI-Suffix einpflegen zu können.

Ulrike Wittig vom Heidelberger Institut für Theoretische Studien (HITS) präsentierte mehrere bereits operative Services. Auf großes Interesse stieß dabei die webbasierte Plattform fairdomhub, die auf der Open-Source-Software SEEK basiert. Diese Plattform ermöglicht zunächst den internen Austausch heterogener wissenschaftlicher Datensätze, Modelle, Simulationen, Prozesse und Forschungsergebnisse zwischen den Forschenden. Auf einer niedrigschwelligen Ebene können Forschende auf diese Weise in das Forschungsdatenmanagement einbezogen werden. Im Verlauf des Forschungsprojekts können Forschende selbstständig entscheiden, ob und wenn ja welche Forschungsdaten sie publizieren wollen. Darüber hinaus lässt sich frei wählen, auf welchen Plattformen die ausgewählten Datensätze publiziert werden und wie weitreichend die Datennutzungsrechte sein sollen (Lesezugriff, Downloadmöglichkeit, Editier- oder Administratorrechte). Die Möglichkeit einer automatischen DOI-Vergabe auf verschiedenen Granularitätsebenen eines Datensatzes ist in SEEK bereits implementiert.

Die Berichte aus der Praxis zeigten eindrücklich, wie die Forschung durch Infrastrukturangebote unterstützt werden kann. Zum Ende des Workshops wurde dargestellt, in welchen Bereichen des Datenlebenszyklus ZB MED eigene Services anbietet und entwickelt.


Workshop-Präsentation von ZB MED: PID-Workshop bei ZB MED_2019-01-23
Weitere Informationen zum Workshop

Was uns im August bewegt hat – Aktuelles zu Open Access, FAIR Data, Digitalisierung …

Auf unserem Twitter-Kanal informieren wir über aktuelle Artikel, Blogposts, Podcasts etc., die sich mit Entwicklungen rund um Open Access und FAIR Data oder allgemein mit der Digitalisierung befassen. Einmal im Monat geben wir Ihnen an dieser Stelle eine Zusammenfassung der Themen, die uns besonders bewegt haben. Im August war das natürlich der erste Library Carpentry Workshop bei ZB MED, erneut das Predatory Publishing und mal was sehr unterhaltsames: die #librarylife challenge one #bwphoto each day for a week.

In LIVIVO wächst die Anzahl der Forschungsdaten

Von Barbara Weidlich-Völckers

Die Offenlegung wissenschaftlicher Forschungsdaten zu Publikationen ist ein wichtiges Thema für ZB MED. In LIVIVO, dem ZB MED-Suchportal für die Lebenswissenschaften (1), wird daher seit drei Jahren kontinuierlich nachgewiesene Literatur mit zugehörigen frei zugänglichen Forschungsdaten aus Forschungsdatenrepositorien wie Dryad (2) verknüpft. Dadurch wird die Sichtbarkeit und Nachnutzbarkeit dieser sonst oft versteckten Daten deutlich erhöht.

Inzwischen sind ca. 20.000 Publikationen in LIVIVO zu finden, die mit Forschungsdaten verknüpft sind. In der Trefferliste sind diese mit einem zusätzlichen Symbol – dem Mikroskop – markiert (siehe Abbildung). Über den Suchfilter »Dokumenttyp« kann die Trefferliste gezielt auf Publikationen mit Forschungsdaten eingeschränkt werden. Eine Recherche ist auch direkt über die Expertensuche mit der Fragestellung DT=RD (Dokumenttyp = Forschungsdaten) möglich.

Screenshot aus dem ZB MED-Suchportal LIVIVO (www.livivo.de). zeigt Artikel mit zugehörigen Forschungsdaten

Anzeige für Artikel mit Forschungsdaten in LIVIVO

Folgt man am Ende eines Treffers unter „More Links“ / „Zusatzinformationen“ dem Eintrag „Research Data“ / „Forschungsdaten“, so wird man zu dem Forschungsdatenrepositorium weitergeleitet, welches diese Daten archiviert (z.B. Dryad). Die dort publizierten Forschungsdaten können helfen, die Inhalte der Textpublikationen besser nachzuvollziehen und einzuordnen. Die Daten können aber auch für eigene Forschungsarbeiten und Veröffentlichungen nachgenutzt werden(3).

Der Ausbau des Nachweises von Forschungsdaten aus weiteren Forschungsdatenrepositorien in LIVIVO ist derzeit in Arbeit. In den LIVIVO News halten wir Sie darüber und natürlich auch über anderen Entwicklungen auf dem Laufenden(4). Es verändert sich immer wieder etwas bei LIVIVO – und es bleibt spannend, schauen Sie doch mal rein!


Weiterführende Links:

(1) LIVIVO
(2) Dryad
(3) Wenn Sie sich zum Thema Forschungsdaten weiter informieren möchten oder Beratung wünschen, so stehen Ihnen die Kolleginnen und Kollegen von PUBLISSO, unserem Publikationsportal Lebenswissenschaften, gern zur Verfügung.
(4) LIVIVO-News


Kontakt zum LIVIVO-Team

Was uns im Juli bewegt hat – Aktuelles zu Open Access, FAIR Data, Digitalisierung …

Auf unserem Twitter-Kanal informieren wir über aktuelle Artikel, Blogposts, Podcasts etc., die sich mit Entwicklungen rund um Open Access und FAIR Data oder allgemein mit der Digitalisierung befassen. Einmal im Monat geben wir Ihnen an dieser Stelle eine Zusammenfassung der Themen, die uns besonders bewegt haben. Im Juni war das natürlich unter anderem das Predatory Publishing, das in den Medien große Wellen geschlagen hat. Unter anderem hat unsere Open-Access-Expertin Dr. Ursula Arning dazu ein Gespräch mit dem Deutschlandfunk geführt.

Was uns im März bewegt hat – Aktuelles zu Open Access, Open Science und Digitalisierung

Auf unserem Twitter-Kanal informieren wir über aktuelle Artikel, Blogposts, Podcasts etc., die sich mit Entwicklungen rund um Open Access und Open Science oder allgemein mit der Digitalisierung befassen. Einmal im Monat geben wir Ihnen an dieser Stelle eine Zusammenfassung all der Themen, die uns bewegt haben!

Im März ging es unter anderem um die European Open Science Cloud, Berichte von der Open Science Conference und dem damit verbundenen Barcamp in Berlin und den Geburtstag des World Wide Web!

https://twitter.com/Lambo/status/973303409565630464