31 - Unbeschriebenes Blatt
Die Daten existierten, konnten aber trotz größter Bemühungen nicht nachgenutzt werden.
Zu Beginn seiner Promotion wurde einem jungen Wissenschaftler mitgeteilt, er solle an unveröffentlichten Daten arbeiten, die drei Jahre zuvor erhoben wurden. Er erhielt mehrere Ordner voller Daten. Darin enthalten waren Dateien mit identischem Namen, aber unterschiedlichem Inhalt, Skripte von denen niemand mehr wusste, was sie tun oder warum sie existieren und Tabellen mit unklaren Spaltenbezeichnungen. Noch dazu war teilweise unbekannt, welche Geräte und/oder Einstellungen genau für die Datenerhebung verwendet wurden. Da die Daten mehrere Jahre alt waren, konnten weder intensive Gespräche mit den Herstellern der identifizierten Geräte noch mit den damaligen Forschern die Nachnutzbarkeit der Daten ermöglichen. Am Ende konnten die Daten einfach nicht mehr verwendet werden.
Dies zeigt, wie essenziell das Beschreiben und Dokumentieren von Datensammlungen und Analyseprozessen ist. Auch wenn Datendokumentation Zeit braucht, ist es noch zeitintensiver schlecht dokumentierte, jahrealte Daten aufzubereiten. Obwohl viele Forschende denken, dass sie ihre Daten kennen, ist es sehr wahrscheinlich, dass die meisten von ihnen einen Großteil der Details innerhalb weniger Jahre vergessen. Daher sollte die Datendokumentation immer so umfangreich, detailliert, präzise und für Dritte leicht verständlich sein wie möglich.