Wie Forschung reproduzierbar gemacht wird

Ziel einer reproduzierbaren Datenanalyse ist es, dass die Analyse so dokumentiert und kommuniziert wird, dass andere Forschende die Vorgehensweise leicht nachvollziehen und die Ergebnisse replizieren können. Um dies zu erreichen, können bereits kleine Schritte hilfreich sein. Sie verringern auch den Aufwand für den:die Erstauswerter:in beziehungsweise bringen ihm oder ihr selbst Vorteile.

Ihre Forschung können Sie mit folgenden Schritten reproduzierbar machen:

  • Erstellen Sie vorab einen Studienplan oder ein -protokoll. Führen Sie eine Preregistration durch oder reichen Sie einen Registered Report ein.
  • Wählen Sie reproduzierbare Tools und Materialien. Der Einsatz von Open-Source-Tools kann die Reproduzierbarkeit fördern.
  • Setzen Sie ein reproduzierbares Projekt auf: Zentralisieren und organisieren Sie Ihr Projektmanagement durch Einsatz einer Online-Plattform, eines zentralen Repositories oder Ordners für alle Forschungsdateien. Sie könnten zum Beispiel GitHub nutzen, um dort ihre Projektdateien alle zusammen abzulegen. Befolgen Sie in Ihrem zentralen Projekt Best Practices, indem Sie Ihre Daten in verschiedenen Ordnern von Ihrem Code trennen. Machen Sie Ihre Rohdaten zu “read-only” und speichern Sie sie getrennt von bearbeiteten Daten.
  • Organisieren Sie Ihre Daten, Dateien und Ordner: Wenden Sie Dateinamenskonventionen an, konstruieren Sie Ordnerbäume mit einer konsistenten, skalierbaren Struktur, trennen Sie Rohdaten von analysierten Daten und so weiter.
  • Lernen Sie die Grundlagen der Versionskontrolle, auch wenn Ihre eigentliche Forschung keine Programmierkenntnisse erfordert: Die Möglichkeit, eine bestimmte Version eines Dokuments wiederherzustellen, das über einen Zeitraum von mehreren Jahren geschrieben wurde, kann sehr wertvoll sein.
  • Automatisieren Sie bestimmte wiederkehrende Aufgaben: Sie können die Zuverlässigkeit Ihrer Ergebnisse erhöhen und das Schreiben wissenschaftlicher Artikel erleichtern, weil Sie Parameter leichter variieren können.
  • Automatisieren Sie Ihre Verarbeitung und Arbeitsabläufe bei Datenanalysen: Entwerfen Sie Skripte, um Ihre Daten zu verarbeiten und Ihre Arbeitsschritte zu verwalten. Vermeiden Sie zum Beispiel die Verwendung von Tabellen für große Datensätze.
  • Dokumentieren Sie Ihren Code und Ihre Daten: Was während Ihrer Arbeit klar ist, kann zwei Monate später schon unklar sein, sogar wenn Sie selbst etwas geschrieben haben. Entscheiden Sie sich für Open-Source-Lösungen, um mehr Transparenz und garantierten Zugang zu erreichen.
  • Mit Programmieren auskennen: Erwägen Sie die Verwendung beispielsweise von Jupyter Notebooks oder anderen Ansätzen zur Programmierung, um Ihren Code mit Ihren Anmerkungen und Dokumentation zu integrieren.
  • Teilen und lizenzieren Sie Ihre Forschung: Stellen Sie Ihre Daten über ein Repository zur Verfügung. Für Software, Notebooks und Container gilt: Lizenzieren Sie Ihren Code, um darüber zu informieren, wie er (weiter)verwendet werden darf.
  • Machen Sie Ihre Forschung transparent: Berichten und veröffentlichen Sie Ihre Methoden und Vorgehensweisen explizit, transparent und vollständig, um eine Replikation zu ermöglichen.

Weitere und detailliertere Tipps, wie Sie Ihre Forschung reproduzierbar machen, finden Sie hier:

Tipp

Praxistipp 7 “Reproduzierbares Arbeiten: für sich selbst, für andere” aus der Praxistipp-Reihe des Open-Science-Magazins der ZBW.