Synthetische organische / anorganische Chemie
Einführung
Bei der Synthese einer gewünschten Verbindung liefern alle Schritte, wie die Planung, Durchführung und Dokumentation eines Experiments oder die Charakterisierung des erhaltenen Produkts, Forschungsdaten. Bei diesen Daten handelt es sich um synthetische Verfahren, Versuchsbedingungen sowie um manuell und digital erfasste Daten mit Analysegeräten. Die Verarbeitung und Interpretation der gewonnenen Forschungsdaten führt zu einem proof of concept für eine bestimmte Reaktion, zu optimierten Bedingungen für zukünftige Experimente oder zum Upscaling.
Datentypen
In der synthetischen Chemie können verschiedene Arten von Forschungsdaten gewonnen werden. Im Allgemeinen beschränken sich diese Daten nicht auf die Charakterisierung von Syntheseprodukten. Ein typisches Experiment beginnt mit dem Entwurf und der Planung, gefolgt von der Durchführung des Verfahrens in einer Laborumgebung. Bei der Durchführung eines Versuchs werden Beobachtungen, Versuchsbedingungen und Erträge dokumentiert. Im Idealfall werden diese manuell erfassten Forschungsdaten digital in einem Electronic Lab Notebooks (ELN) erfasst.
Auf die Synthese eines bestimmten Produkts folgt die Analyse seiner Eigenschaften. Was die Datenerfassung betrifft, so können sowohl manuell ermittelte als auch digitale Daten gewonnen werden. Beobachtungen und Ergebnisse von Analysemethoden ohne digitale Ausgabe (d. h. ohne Datendateien) können manuell zum ELN-Eintrag des Experiments hinzugefügt werden, z. B. Schmelz-/Siedepunkt, optische Drehung, TLC-Rf-Werte oder Brechungsindex. Digitale Daten werden von analytischen Instrumenten gewonnen, z. B. NMR, IR, MS. Diese Daten können nahtlos von den Analysegeräten in ein ELN hochgeladen und dort ausgewertet werden. Die nachstehende Tabelle gibt einen Überblick über Dateierweiterungen, Dateigrößen und Konverter für verschiedene Analysemethoden. Rohdatendateien in geschützten Dateiformaten sollten neben interoperablen offenen Dateiformaten mit Hilfe von Konvertern oder der Software des Analysegeräts gespeichert werden. Wenn derzeit kein spezifisches offenes Format verfügbar ist, wird der Export als .txt oder .csv empfohlen.
Insgesamt sollten Metadaten bei der Erfassung und Speicherung von Daten immer mit einbezogen werden, um ein langfristiges Verständnis der Forschungsdaten zu ermöglichen.
ELNs und andere Tools
Für die Planung des Forschungsdatenmanagements und die Erstellung von Datenmanagementplänen eignen sich Tools wie RDMO und DMP-Online. Viele Universitäten haben ihre eigenen Instanzen einer dieser Lösungen.
Wenn Sie möchten, dass Ihre Daten den FAIR-Grundsätzen entsprechen, kann es sehr mühsam und zeitaufwändig sein, die FAIR-Grundsätze nachträglich auf Ihre Daten anzuwenden, wenn Ihre bestehenden Arbeitsabläufe ein hohes Maß an analoger Dokumentation beinhalten (z. B. Laborbücher auf Papier). Die Realität sieht so aus, dass Sie Werkzeuge brauchen, die bestimmte Aspekte der FAIR-Grundsätze automatisch erledigen, damit Sie sie nicht jedes Mal manuell anwenden müssen. Elektronische Labornotizbücher (ELNs) sind sehr leistungsfähige Hilfsmittel, die Ihnen dabei helfen können. Je nachdem, welches ELN Sie verwenden, können die Metadaten sowohl in menschlichen als auch in maschinenlesbaren Formaten automatisch zugewiesen werden. Darüber hinaus können einige ELNs automatisch interoperable offene Dateiformate für Ihre analytischen Daten erzeugen. Die Auswahl des richtigen ELN kann eine Herausforderung sein, und dieser Prozess sollte sorgfältig durchdacht und durchgeführt werden. Weitere Informationen finden Sie auf how to choose the right ELN here:
Loading...Ein Werkzeug, das Ihnen hilft, das richtige ELN zu finden, ist der so genannte ELN-Finder, ein durchsuchbares Online-Repository für viele verschiedene ELNs. Es ist wichtig zu beachten, dass es kein ELN für alle gibt und dass ein ELN für eine Forschungsgruppe geeignet sein kann, während ein anderes ELN für eine andere Forschungsgruppe besser geeignet sein kann. Innerhalb von NFDI4Chem ist Chemotion ELN die Referenzinstanz (mehr dazu finden Sie in unserem Wissensbasisartikel Überblick über Chemotion). Das bedeutet, dass unsere Entwicklungen zur automatischen Anwendung der FAIR-Datenprinzipien auf Forschungsdaten zuerst in Chemotion implementiert werden.
Chemotion eignet sich besonders gut für die synthetische Chemie, da es ursprünglich als ELN für die synthetische Chemie konzipiert war, nun aber durch die LabIMotion-Erweiterung auf eine breitere Palette wissenschaftlicher Disziplinen ausgeweitet wurde.
Veröffentlichungsdaten
Die Veröffentlichung von Forschungsdaten ist wichtig, um die Wiederverwendung von Daten durch andere Forscher oder für das maschinelle Lernen zu ermöglichen. Insbesondere für das maschinelle Lernen ist es von entscheidender Bedeutung, dass die Daten in einer strukturierten und standardisierten Form veröffentlicht werden. Wo können Sie Ihre Daten veröffentlichen? Offen zugängliche Daten-Repositorien sind eine gute Lösung, um Ihre Daten zur Weiterverwendung durch andere bereitzustellen. Die Wahl des richtigen Repositoriums ist von entscheidender Bedeutung. Als allgemeine Faustregel gilt, dass Sie Ihre Daten besser in daten- oder disziplinspezifischen Repositorien hinterlegen sollten, da diese eine stärkere Standardisierung bei der Veröffentlichung der Daten erzwingen und somit eine bessere Maschinenlesbarkeit ermöglichen.
Um möglichst viele Forscher zu erreichen, kann die Wahl des richtigen Repository entscheidend sein (mehr dazu im Artikel zur Wahl des richtigen Repository).
Oben sehen Sie eine modifizierte Version des Entscheidungsbaums aus unserem Leitfaden zur Auswahl des richtigen Repositorys. Die folgende Tabelle gibt einen Überblick darüber, welche Daten in welches Repository passen:
Datentyp | Datenformat | Empfohlenes Repository | Kriterien für die Auswahl |
---|---|---|---|
Kernspinresonanz | Bruker XWIN-NMR-Format (zip), JCAMP-DX | Chemotion | Passing basic checks, curation |
Nuclear Magnetic Resonance | Bruker XWIN-NMR format, JOEL format NMReData, nmrML, ISA JSON | nmrXiv | Validierungen / Minimum information reporting standards |
Molecules and their properties, identification, reactions and experimental investigations | mass spectrometry: JCAMP-DX, mzMl, mzXML (offen, visualisierbar und bearbeitbar), RAW für ausgewählte Massendatenarten (bearbeitet und konvertiert in JCAMP-DX), IR und Raman: JCAMP-DX, XRD: JCAMP-DX, UV/VIS: JCAMP-DX, Zyklische Voltammetrie: JCAMP-DX. *Chemotion repo bietet die Möglichkeit, Daten aus verschiedenen Dateiformaten in JCAMP-DX zu konvertieren. | Chemotion | Besteht grundlegende Prüfungen, Kuration |
Anorganische Kristallstrukturen | Crystallographic Information File (CIF) | ICSD | Kristallstrukturdaten verfügbar |
Organische und metallorganische Kristallstrukturen | Crystallographic Information File (CIF), aber auch andere unterstützende Dateiformate akzeptiert | CSD | Zellparameter (Einkristall), vollständige Koordinaten (Pulver), im CIF-Format |
Organische, anorganische und metallorganische Kristallstrukturdaten | hauptsächlich Crystallographic Information File (CIF), aber andere unterstützende Dateiformate akzeptiert | joint CCDC/FIZ Access Structures ServiceD | Mindestens eine CIF-Datei muss in der Einreichung enthalten sein und Strukturfaktor-Daten für alle Strukturen sollten bereitgestellt werden (wenn möglich) |
Generische Daten aus allen Disziplinen der Chemie, alle Daten, die nicht in die disziplinären Repositories passen | formatunabhängig | RADAR4Chem | Validierung gegen Metadatenschema |
Ihre eigene Einrichtung verfügt möglicherweise über zusätzliche Leitlinien und Ressourcen für die Veröffentlichung von Daten. Es lohnt sich daher immer, die Experten für Forschungsdatenmanagement Ihrer lokalen Einrichtung zu konsultieren.
Herausforderungen
Während es bei einigen Datentypen und Arbeitsabläufen offensichtlich sein mag, wie die FAIR-Grundsätze einzuhalten sind, ist dies bei anderen nicht der Fall, da keine Gemeinschaftsstandards festgelegt wurden und/oder keine geeigneten offenen Datenformate verfügbar sind. Dies gilt insbesondere für analytische Nischenmethoden. Aber denken Sie daran: FAIR ist ein Spektrum, kein Absolutum. Selbst wenn also einer Ihrer Arbeitsabläufe nicht so FAIR ist wie der andere, lohnt es sich, ihn so FAIR zu gestalten, wie es derzeit möglich ist.
Viele alte Geräte geben keine offenen Datenformate aus, und einige Geräte haben überhaupt keinen digitalen Ausgang, was ein gutes RDM erschwert, wenn auch nicht unmöglich macht, wenn man die richtigen Werkzeuge hat (z. B. Chemotion's ChemConverter, das automatisch offene Dateiformate von Analysegeräten erzeugt, die diese nicht ausgeben können).
Eine der größten Herausforderungen für RDM in der Chemie ist derzeit die fehlende Interoperabilität zwischen den einzelnen ELN. Dies bedeutet, dass es sehr schwierig, wenn nicht gar unmöglich ist, Daten zwischen verschiedenen ELNs zu übertragen. Das macht es besonders schwierig für interdisziplinäre Kooperationen, bei denen die beteiligten Gruppen unterschiedliche ELNs verwenden. Es gibt jedoch Bestrebungen, die Interoperabilität zwischen den ELNs herzustellen, wie z. B. das ELN-Konsortium, dem Chemotion angehört.