Physikalische und computergestützte Chemie
Einführung
Die physikalische Chemie umfasst viele Teildisziplinen und Methoden, die sehr heterogene Daten erzeugen. Diese reichen von Spektroskopie und Bildgebung bis hin zu Simulationsdateien und internem Analysecode, wobei die Datenmengen von sehr großen Datensätzen bis hin zu kleinen textbasierten Dateien reichen. Viele Physikalische Chemiker kennen sich mit Daten aus und können dazu beitragen, einheitliche, rationalisierte Datenverwaltungslösungen in ihren Forschungsgruppen einzuführen.
Datentypen
In der physikalischen Chemie werden in allen Unterdisziplinen unterschiedliche Daten erzeugt. Die Forschungsgruppen können sich auf die Bildgebung (z. B. Super-Resolution-Mikroskopie), die Entwicklung von Methoden, die spektroskopische Analyse, numerische Simulationen oder Kombinationen dieser Bereiche konzentrieren.
ELNs und andere Tools
Für eine effektive Datenverwaltung sollten die Werkzeuge auf Projekt- oder Gruppenebene auf der Grundlage der bestehenden Arbeitsabläufe ausgewählt werden. Da Arbeitsabläufe oft methodenspezifisch sind, sollten Nutzungsrichtlinien und Metadatenvorlagen in einem Datenmanagementplan (DMP) definiert und dokumentiert werden. NFDI4Chem bietet eine auf die Chemie zugeschnittene RDMO-Vorlage.
Ein elektronisches Laborjournal (ELN) unterstützt die tägliche Planung, die strukturierte Dokumentation von Experimenten und manchmal auch die Verwaltung von Arbeitsabläufen. In diesem vielfältigen Bereich sollten ELNs flexibel und anpassbar sein. Universitäten können zentrale Lösungen bereitstellen, aber Forschungsgruppen wählen oft Werkzeuge, die ihren Bedürfnissen und Ressourcen entsprechen. Der ELN-Finder listet die Optionen auf, und die Seite Auswahl eines ELN gibt weitere Hinweise:
Loading...Neben ELNs können auch lokale Repositories und Tools zur Verwaltung von Forschungsdaten dazu beitragen, Daten für die Veröffentlichung vorzubereiten.
Für diejenigen, die Skripte schreiben und Softwarelösungen für die Forschung entwickeln, ist Git ein sehr empfehlenswertes Versionsverwaltungswerkzeug. Einige Universitäten haben auch ihre eigenen Instanzen von GitLab, um die Verwaltung von Softwareprojekten zu unterstützen.
Für Forschungsdaten hilft DataLad (auf Git aufbauend) dabei, Metadaten während der Verarbeitung und Analyse zu verfolgen. Sie funktioniert auch mit GUI-basierten Schritten, ist aber besonders leistungsfähig in skriptbasierten Arbeitsabläufen.
Da viele physikalische Chemiker ihre eigenen Arbeitsabläufe und Werkzeuge entwickeln, sollten nach Möglichkeit Community-Standards für Dateiformate und Metadaten verwendet werden. Zumindest sollten die Forschungsgruppen gemeinsame Dokumentations- und Formatstandards festlegen, um den Wissenstransfer zu unterstützen. ELNs können Vorlagen bereitstellen, DMPs können Standards aufzeichnen, und automatisierte Arbeitsabläufe (z. B. von Instrumenten zu ELN und Speicherung) können die manuelle Arbeit reduzieren und die Datenqualität über integrierte Integrationen oder REST-APIs verbessern.
Daten veröffentlichen
Die Veröffentlichung von Forschungsdaten, insbesondere von Daten, die Veröffentlichungen zugrunde liegen, ermöglicht Reproduzierbarkeit und Wiederverwendung. Forschungsdaten-Repositorien unterstützen die FAIRe Veröffentlichung und bieten fachspezifische, allgemeine und institutionelle Optionen. In der physikalischen Chemie eignen sich z. B. RADAR4Chem, ioChem-BD für die computergestützte Chemie und die Image Data Resource (IDR) oder das selbst gehostete Omero für Bilddaten. Eine Anleitung zur Auswahl des Respositories finden Sie hier.
Bei hausinterner Forschungssoftware gilt: Software gehört zu Daten und sollte entsprechend veröffentlicht werden. GitHub bietet derzeit einen automatisierten Freigabe-Workflow für zenodo, und es gibt andere Möglichkeiten, Software einen DOI zuzuweisen und sie zitierfähig zu machen, wie hier beschrieben.
Herausforderungen
In der physikalischen Chemie sind die Herausforderungen von FAIR-Daten eng mit verschiedenen Methoden und Datentypen verbunden. Labors haben oft individuelle Arbeitsabläufe, daher sollten Gruppen gemeinsame Schritte rationalisieren und wiederverwendbare Metadatenvorlagen in ELNs oder Dateisystemen definieren, um sowohl Forscher als auch FAIR-Dateninfrastrukturen zu unterstützen.
Insbesondere bei der Bildgebung können große Datenmengen den lokalen Speicher belasten. Zentrale Speicherlösungen können hilfreich sein, wenn sie mit guten Verfahren zur Verwaltung von Forschungsdaten kombiniert werden, um die Wiederverwendbarkeit zu gewährleisten und eine ineffiziente Datenorganisation zu vermeiden.