70 - Vor die Welle kommen
Die plötzliche Veränderung gab dem Virus einen unfairen Vorsprung.
Deutschland im April 2021: inmitten einer der stärksten Covid19-Wellen in Deutschland, entschied sich das Robert-Koch-Institut, das Datenformat für die Ausgabe der täglichen Impfzahlen ohne Ankündigung zu verändern. Dies schlug vor allem in den Kreisen von Wissenschafts- und Datenjournalist*innen hohe Wellen, da damit über Nacht auf das alte Ausgabeformat programmierten Webscraping-Programme nicht mehr funktionierte. Dadurch konnten die RKI-Daten nicht mehr automatisch abgecrawlt werden und produzierten nur noch Fehlermeldungen. In diesem Fall führte die plötzliche Format- und Inhaltsänderung zu erheblicher Mehrarbeit bei den betroffenen Journalist*innen und zu Ausfällen auf Webseiten und Dashboards, über die sich Millionen von Menschen über die Pandemie informieren wollten.
Datenanbietende sollten proaktiv und mit zeitlichem Vorlauf auf anstehende Formatänderungen hinweisen. So können bspw. für einen Übergangszeitraum Veröffentlichungen im alten und neuen Format bereitgestellt werden, so dass Datennutzende sich umstellen können. Auch eine gute Planung des Datenschemas und der zu nutzenden Datenformate im Voraus hilft dabei größere Änderungen im Verlauf des Forschungsprozesses zu vermeiden.
- Open Data Anti Patterns - Hase und Igel: https://github.com/transportkollektiv/opendata-antipatterns/blob/main/patterns/formataenderung.md
- https://x.com/datentaeterin/status/1380203124858699778