41 - Das Ende ist nah
Wie Excel einmal fast Wiki-Leaks sabotierte
Als Wiki-Leaks-Gründer Julian Assange im Jahr 2010 eine Datei mit 92.000 geleakten Feldberichten aus Afghanistan an Journalist/-innen von The Guardian und The New York Times übergab, endeten die Aufzeichnungen abrupt im April 2009, obwohl auch für den Rest des Jahres Daten hätten vorhanden sein sollen. Was war passiert?
Die Journalist/-innen hatten die Datei in Excel geöffnet. Zum damaligen Zeitpunkt war Excel auf eine maximale Größe von 65.536 Zeilen beschränkt und die große Menge an Daten sprengte das Fassungsvermögen der Tabelle. Mit dem Öffnen in Excel wurden so alle Daten nach Zeile 65.536 abgeschnitten.
Obwohl die maximale Zeilenanzahl seitdem auf 1.048.576 erhöht wurde, zeigt diese Geschichte trotzdem eindrücklich, dass Excel kein adäquater Ersatz für ein professionelles Datenbanksystem ist. Dies gilt vor allem für Forschungsvorhaben, die mit einem hohen Aufkommen an Daten rechnen. Hier ist es wichtig, sich schon vor der Antragstellung Gedanken über Alternativen und deren mögliche Kosten zu machen.
- “When Good Data Turns Bad” aus dem Buch “Humble Pi: A Comedy of Maths Errors”, Seite 244-245