Die Anforderungen an hochwertige Forschungsdaten im Blick
Helmholtz Metadata Collaboration (HMC) diskutierte am GEOMAR über zukünftige Herausforderungen und Entwicklungen der Helmholtz-übergreifenden Daten-Infrastruktur
Forschung generiert Daten – und das mehr denn je. Um diese Daten nicht nur für eine handvoll Forschende, sondern instituts- und disziplinübergreifend für die gesamte Wissenschaftsgemeinschaft zugänglich und nutzbar zu machen, müssen die Forschungsdaten mit Zusatzdaten verknüpft werden, sogenannten Metadaten. Diese Metadaten müssen einheitlichen Vorgaben entsprechen, idealerweise internationalen Standards, um effektiv nutzbar zu sein. Sie müssen außerdem „FAIR“ sein: Findable (auffindbar), Accessible (zugänglich), Interoperable (interoperabel) und Reusable (nachnutzbar). Das bedeutet, Daten sollten so aufbereitet sein, dass sie leicht gefunden und genutzt, mit anderen Datensätzen kombiniert, ausgetauscht und interpretiert werden können. Damit setzt die Plattform auch nationale Metadatenstandards, die auch europäische und globale Vorgaben mitprägen.
Mit der steigenden Produktion von Forschungsdaten stellt sich zunehmend die Frage nach der Beschreibung und Dokumentation von Forschungsdaten, die nachhaltig für Mensch und Maschine sichtbar und nutzbar sein sollen. Jede Disziplin – von Gesundheit bis Energie – steht hier vor unterschiedlichen Herausforderungen. Die Helmholtz Metadata Collaboration (HMC) agiert daher in allen sechs Forschungsbereichen der Helmholtz-Gemeinschaft, um sowohl disziplinspezifische als auch übergreifende Lösungsansätze zu erarbeiten. Diese können von der Nutzung kontrollierter Vokabularien über die Entwicklung von Metadaten-Tools für Forschende und Softwareentwickler:innen bis hin zur Durchführung von Metadaten-Trainingskursen reichen.
Die Vision eines gemeinsamen und übergreifenden Helmholtz-Datenraums konnte somit bereits in ersten Schritten umgesetzt werden. Weitere Lösungsansätze wurden im Rahmen des Sommertreffens diskutiert und können teilweise bereits genutzt werden. So zum Beispiel der Helmholtz Knowledge Graph, der als zentrale Ressource die Metadaten von Datenanbietern wie Repositorien und Bibliotheken aus der gesamten Helmholtz-Gemeinschaft zusammenführt. Die Datensätze können bereits durchsucht werden, der Dienst Programm wird in Zukunft weiter ausgebaut und verbessert. Auch HMC-Projekte stellten sich vor, darunter erste Ergebnisse aus dem Projekt „Stamplate“, das eine vernetzte Forschungsdateninfrastruktur für Zeitreihen im Bereich der Umweltwissenschaften aufbaut.
„Das HMC-Sommertreffen am GEOMAR war eine tolle Gelegenheit, die Vielfalt der Angebote, Projekte und natürlich die Menschen dahinter kennenzulernen – zum ersten Mal in dieser Größenordnung. Die Qualität der Beiträge auf dem Treffen hat gezeigt, dass wir zu Recht die Perspektive haben, HMC für weitere fünf Jahre zu entwickeln“, sagt Sören Lorenz, Sprecher der HMC und Chief Information Officer (CIO) und Leiter des Informations-, Daten- und Rechenzentrums am GEOMAR.
Hintergrund: HMC
Die Helmholtz Metadata Collaboration (HMC) ist eine Plattform, die die qualitative Anreicherung von Forschungsdaten mittels Metadaten fördert. Ihr Hauptziel ist es, die von den Helmholtz-Zentren produzierten Forschungsdaten für die gesamte wissenschaftliche Gemeinschaft (in Helmholtz und darüber hinaus) auffindbar, zugänglich, interoperabel und nachnutzbar zu machen (FAIR). Darüber hinaus arbeitet die HMC an einem Helmholtz-Datenraum, der es Wissenschaftler:innen ermöglichen soll, ihre Daten nahtlos zu teilen und weiterzuverwenden.