5S Data - Set in order

Ziel und Motivation

Im zweiten Schritt “set in order” (auf Deutsch „Ordnung schaffen“ oder „Aufräumen“ nach dem 5A-Modell) sollen Ordner und Dateien so organisiert werden, dass Arbeitsbereiche in einem Projekt besser abgebildet werden und bestimmte Dateien leichter gefunden werden können. Dies führt zur Zeitersparnis beim Arbeiten mit den Daten und Mitarbeiter*innen oder später beteiligte Personen können sich schon auf den ersten Blick leichter in dem Projekt zurechtfinden.

 

Umsetzung

Zuerst sollte eine Ordnerstruktur angelegt werden, die den Arbeitsbereichen innerhalb eines Projekts entspricht. In den Wissenschaften sind dies meist Bereiche wie Finanzen, Präsentationen, Publikationen, Studien, Quellcode oder Literatur. Da eine Sortierung der Ordner nach Anfangsbuchstaben oft nicht sinnvoll ist, weil bestimmte Bereiche wichtiger sein können als andere, können die Namen der Ordner mit einer Zahl begonnen werden, um diese von dem Betriebssystem automatisch sortieren zu lassen. Das kann z.B. sein „01_studien“ und „03_publikationen“. Als Faustregel gilt weiterhin, dass möglichst auf einer Ebene alle Ordner überschaubar sind (also ca. 7 verschiedene Ordner) und nicht mehr als 3 Ordnerebenen in die Tiefe angelegt werden, damit man nicht unnötig tief in die Ordnerstruktur sich reinklicken muss, um an eine bestimmte Datei zu kommen.

Wie bereits im letzten Absatz angedeutet, spielt die Namenskonvention der Ordner und Dateien eine wichtige Rolle. Durch sie kann das System schon automatisch bestimmte Sortierungen vornehmen und als Mensch kann man bereits auf den ersten Blick erkennen, welche Inhalte der Ordner oder die Datei erwarten läßt. Damit man den Inhalt in einer Datei schnell erschließen kann, sollte der Name bereits Metaangaben beinhalten, wie z.B. das Veröffentlichungsdatum, die Autor*in oder Ersteller*in und den Titel. Indem eine Datumsangabe am Anfang des Dateinamens gestellt wird, in der Reihenfolge Jahr-Monat-Tag, kann das System auch diese bereits richtig zeitlich sortieren. Ein anderer Punkt ist die Verwendung der richtigen Zeichen. Je nach System oder Software, können verschiedene Zeichen im Namen zu Problemen bei der Verarbeitung von Dateien führen. Es wird deshalb empfohlen in Dateinamen nur Kleinbuchstaben, Unter- oder Bindestriche anstatt Leerzeichen und keine Sonderzeichen zu verwenden, wie Punkte oder Fragezeichen. Der Name für die Datei einer Publikation wäre zum Beispiel:
„20200316_tkfdm_fact_sheet_research_data_repositories“

Da Titel oder andere Metaangaben recht lang sein können, ist hier anzumerken, dass der Dateiname mit Pfad der Ordnerstruktur auf allen gängigen Systemen nicht länger als 255 Zeichen lang sein darf. Es sollte also darauf geachtet werden, möglichst kurze Beschreibungen zu verwenden.

Natürlich ist es nicht immer möglich bereits auf den ersten Blick zu erkennen, welche Dateien in welchen Ordnern zu finden sind. Es ist deshalb ratsam bereits in einem frühen Stadium des Projekts eine Readme-Datei, eine Wikiseite oder ähnliches anzulegen, die beschreibt, warum diese Ordnerstruktur gewählt wurde und wo man grob welche Dateien finden kann.

 

1) Sort    ►    2) Set in order    ►    3) Shine    ►    4) Standardize    ►    5) Sustain