Zum Hauptinhalt springen

Physikalische und computergestützte Chemie

Einführung

Die Physikalische Chemie umfasst eine Vielzahl von Teildisziplinen, die sich auf eine umfangreiche Methodik stützen, die ihrerseits heterogene Daten hervorbringt. Von spektroskopischen Messdaten über bildgebende Verfahren bis hin zu Simulationseingabedateien und internem Datenanalysecode haben viele Physikochemiker Erfahrung im Umgang mit digitalen Daten. Sie sind oft sehr versiert in der Entwicklung von Softwarelösungen zur Unterstützung ihrer Arbeit. Während die einen regelmäßig mit großen Datenmengen arbeiten, entstehen bei anderen Methoden kleine, textbasierte Dateien. In dieser Disziplin gibt es viele datenkundige Mitglieder, deren Fachwissen genutzt werden kann, um Werkzeuge und Lösungen für eine einheitliche und optimierte Verwaltung der Daten ihrer Forschungsgruppe zu implementieren.

Datentypen

Wie bereits erwähnt, sind die in der physikalischen Chemie und ihren verschiedenen Unterdisziplinen produzierten Daten vielfältig. Eine Forschungsgruppe kann sich intensiv mit bildgebenden Verfahren wie der superauflösenden Mikroskopie befassen, eine andere mit der Entwicklung von Methoden, wieder andere mit der Analyse von spektroskopischen Daten oder mit numerischen Simulationen - oder sogar mit einer beliebigen Kombination dieser Verfahren.

ELNs und andere Tools

Für ein effektives Datenmanagement sollten die Software-Tools innerhalb eines Projekts oder einer Forschungsgruppe einheitlich ausgewählt werden, um die Arbeitsabläufe zu organisieren und zu rationalisieren. Dies beinhaltet die Erstellung klarer Nutzungsrichtlinien, einschließlich Metadatenvorlagen, die sich an den Mindestinformationsstandards für eine bestimmte Methode orientieren, sofern vorhanden. Diese sollten in einem Datenmanagementplan (DMP) für jedes Projekt dargelegt werden. Viele Universitäten stellen Werkzeuge und Vorlagen für DMPs zur Verfügung (weitere Informationen finden Sie im entsprechenden Artikel).

Ein elektronisches Labornotizbuch (ELN) hilft bei der täglichen Planung und strukturierten Dokumentation von Experimenten, während einige auch bei der Verwaltung des Daten-Workflows helfen. Für Disziplinen mit unterschiedlicher Forschung müssen ELNs flexibel und anpassbar sein. Bestimmte Universitäten können eine zentrale Option anbieten, während jede Forschungsgruppe selbst entscheiden kann, was ihren Bedürfnissen und Ressourcen am besten entspricht, wenn sie in der Lage ist, ihre eigene Lösung zu hosten oder zu beschaffen. Der ELN-Finder listet viele Optionen auf, und der Artikel über Auswahl eines ELN bietet weitere Unterstützung:

Loading...

Zusätzlich zu ELNs können Tools wie lokale Repositorien und Tools zur Verwaltung von Forschungsdaten dabei helfen, die Daten publikationsreif zu machen.

Für diejenigen, die Skripte schreiben und Softwarelösungen für die Forschung entwickeln, ist Git ein sehr empfehlenswertes Versionsverwaltungswerkzeug. Einige Universitäten haben auch ihre eigenen Instanzen von GitLab, um die Verwaltung von Softwareprojekten zu unterstützen.

Speziell für Forschungsdaten kann DataLad, das auf Git aufbaut, bei der Verfolgung der Metadaten während der Verarbeitung und Analyse von Daten sehr hilfreich sein. Es funktioniert zwar für Schritte, die mit GUI-Anwendungen durchgeführt werden, aber seine wahre Stärke zeigt sich bei skriptbasierten Analyse- und Verarbeitungsschritten.

Da viele Physikalische Chemiker ihre eigenen Arbeitsabläufe einrichten oder eigene Tools für die Erfassung, Verarbeitung und Analyse ihrer Daten entwickeln, wird dringend empfohlen, sich an gemeinschaftsspezifische Standards für Dateiformate und Metadaten zu halten, sofern vorhanden. Ein absolutes Minimum ist die Festlegung von Dokumentations- und Formatstandards innerhalb einer Forschungsgruppe, um einen effizienten Wissenstransfer von einer Forschergeneration zur nächsten zu gewährleisten. Ein ELN kann bei der Bereitstellung von Vorlagen für die Dokumentation sehr hilfreich sein, während ein DMP zur Aufzeichnung der Formatstandards verwendet werden sollte. Durch den Einsatz automatisierter Arbeitsabläufe, z. B. vom Gerät zum ELN und zu den Datenspeichersystemen, können manuelle Schritte bei der täglichen Arbeit erheblich reduziert und automatisch sichergestellt werden, dass Daten und Dokumentation vollständig und korrekt formatiert sind. Einige Tools bieten sofort einsatzbereite Lösungen, wie z. B. die Geräteintegration, während andere Optionen wie REST-APIs zur Erstellung benutzerdefinierter Methoden bieten.

Veröffentlichungsdaten

Die Veröffentlichung von Forschungsdaten, insbesondere der Daten, die einem veröffentlichten Artikel zugrunde liegen, ist ein wichtiger Aspekt, der es anderen in der Forschungsgemeinschaft ermöglicht, die Arbeit eines Forschers zu wiederholen und darauf aufzubauen. Forschungsdaten-Repositorien dienen als Plattformen für die Datenveröffentlichung und können die FAIR Datenveröffentlichung erheblich unterstützen. Diese Repositorien reichen von fachspezifischen bis hin zu allgemeinen und institutionellen Repositorien. Für viele in der physikalischen Chemie und ihre vielfältigen Daten stellen allgemeine Repositorien wie RADAR4Chem eine Option für die Veröffentlichung von Daten dar, für die inzwischen (sub-)disziplinspezifische Repositorien eingerichtet worden sind. ioChem-BD dient als Repository für computergestützte Chemie und umfasst einen Konvertierungsdienst für viele gängige Datentypen, um die Interoperabilität zu gewährleisten. Die Image Data Resource (IDR) stellt der Gemeinschaft biologische Bilddaten zur Verfügung, während das selbst gehostete Omero-Repositorium diejenigen unterstützen kann, die mit anderen Arten von Bilddaten arbeiten. Weitere Informationen über die Auswahlmöglichkeiten finden Sie hier.

Für Arbeiten, die die Entwicklung interner Forschungssoftwarelösungen umfassen: Software ist ein integraler Bestandteil der Forschung und sollte als solcher veröffentlicht werden. Während derzeit nur GitHub einen automatischen Workflow für die Veröffentlichung von Software-Releases auf zenodo bietet, gibt es Methoden, um der Software einen DOI zuzuweisen und sie damit zitierfähig zu machen.

Herausforderungen

Gemeinsame Herausforderungen in der physikalischen Chemie und bei FAIRen Daten gehen oft Hand in Hand mit der großen Vielfalt an Teildisziplinen, Methoden und somit unterschiedlichen Datentypen. Viele, die in physikalisch-chemischen Labors arbeiten, haben vielleicht ihre eigenen Arbeitsabläufe entwickelt. Die Arbeit innerhalb einer Gruppe zur Rationalisierung und Vereinheitlichung gemeinsamer Schritte und zur Erstellung wiederverwendbarer Vorlagen für Metadaten, sei es in ELNs oder im lokalen Dateisystem, kann strukturierte Informationen nicht nur für Forscherkollegen, sondern auch für diejenigen bereitstellen, die an FAIRen Dateninfrastrukturen wie ELNs und Forschungsdaten-Repositorien arbeiten.

Insbesondere bei der Bildgebung können große Datenmengen die lokalen Speicher-Ressourcen belasten. Eine zentrale Speicherlösung kann hilfreich sein und sollte in Kombination mit bewährten Verfahren zur Verwaltung von Forschungsdaten eingesetzt werden, um die Wiederverwendbarkeit der Daten zu gewährleisten und eine unorganisierte und ineffiziente Nutzung großer Speichersysteme zu vermeiden.