06 - Gen-Datierung
Die Metaanalysen legen nahe, dass der 2. September für die Funktion von Zellen eine entscheidende Rolle spielt.
Werden Dateien in Tabellenkalkulationssoftware (wie z.B. Microsoft Excel) unter Verwendung der Standardeinstellungen importiert oder eingetragen, werden Einträge in Zellen teilweise automatisch neu formatiert.
Bereits 2004 wurde in einer Studie festgestellt, dass dieser Fehler auch häufig in wissenschaftlichen Veröffentlichungen in Tabellen mit Genbezeichnungen zu finden ist. Die Namen werden dabei entweder in ein Datum oder in Gleitkommazahlen umgewandelt. Diese Änderung der Formatierung ist irreversibel: die ursprüngliche Information zu den betreffenden Genen geht vollständig verloren.
Eine neuere Studie aus dem Jahr 2016 zeigte, dass dieses Problem immer noch aktuell ist und bisher keine standardisierten Lösungen für das Problem bestehen. Etwa 20 % der untersuchten Artikel aus anerkannten Journalen zum Thema Genomik enthielten Fehler in den Namen der Gene in Tabellen. Ein Beispiel ist das SEPT2 (Septin 2) Gen, das eine wichtige Rolle für die Funktion des Zellskeletts spielt und in Tabellen schnell zum 2. September geändert wird.
Da die Daten solcher Studien für die wissenschaftliche Gemeinschaft eine wichtige Ressource darstellen und häufig wiederverwendet werden, ist der Informationsverlust sehr problematisch. Ein Sprecher von Microsoft kommentierte die Ergebnisse der Studie mit dem Hinweis: „Excel is able to display data and text in many different ways. Default settings are intended to work in most-day-to-day scenarios”. Dementsprechend ist die Aufzeichnung wissenschaftlicher Daten, wie z.B. Gennamen, keine alltägliche Aufgabe für viele Tabellenkalkulationsprogramme und muss entsprechend aufmerksam durchgeführt werden.
Das Beispiel zeigt, dass es bei der Verwendung von Tabellenkalkulationsprogrammen wichtig ist auf die entsprechende Formatierung der Zellen zu achten und die richtige Übertragung der Inhalte sorgfältig zu überprüfen.