Auf dem Hacker-Kongress 36C3 gab es viele interessante Vorträge. Einer hat sich mit den Verspätungen der Bahn beschäftigt: Indem die Halteuzeiten aller Züge und an allen Bahnhöfen analysiert wurden – öffentlich zugängliche Daten! -, konnte ein äußerst präzises Bild über die Pünktlichkeit der Bahn entstehen.
Auf dem traditionellen Chaos Communication Congress, der 2019 zum 36. Mal stattfand (damals noch in Leipzig), präsentierte David Kriesel wegweisende Daten über die tatsächliche Pünktlichkeit der Bahn. Was als #bahnmining bekannt wurde, hat bis heute Schule gemacht und zeigt beispielhaft, wie datengetriebene Analysen gesellschaftliche Diskussionen versachlichen können.
Der Datenexperte analysierte damals unfassbar große Datenmengen mit beeindruckenden Ergebnissen: Der Bahnhof in Köln war 2019 mit 380.000 Stopps der meist frequentierte Bahnhof Deutschlands – mit einer Pünktlichkeitsrate von mageren 60 Prozent. Das bedeutete: 40 Prozent aller Züge nach oder von Köln waren unpünktlich. Weit entfernt von den geschönten Werten, die die Bahn gerne veröffentlicht – sie geht ohnehin erst nach sechs Minuten von einer Verspätung aus.
Was aus dem Bahnmining-Projekt geworden ist
Seit 2019 hat sich die Landschaft der Verkehrsdatenanalyse dramatisch weiterentwickelt. Das #bahnmining-Projekt war nur der Anfang einer Bewegung, die heute unter dem Begriff „Civic Data Science“ läuft. Mittlerweile existieren automatisierte Dashboards, die Verkehrsdaten in Echtzeit auswerten. Tools wie der „DB-Navigator“ zeigen zwar Verspätungen an, doch erst durch unabhängige Datenanalysen wird das wahre Ausmaß der Unpünktlichkeit sichtbar.
Aktuelle Projekte wie „rettedeinnahverkehr.de“ oder „zugfinder.org“ bauen auf Kriesels Pionierarbeit auf. Sie nutzen offene APIs der Deutschen Bahn, um kontinuierlich Pünktlichkeitsdaten zu sammeln und zu visualisieren. Die Ergebnisse sind ernüchternd: Auch 2025/2026 liegt die reale Pünktlichkeit bei Fernverkehrszügen deutlich unter den offiziellen Statistiken der Bahn.
Lob für die Bahn: Transparenz schaffen
Es geht hier nicht um Bahn-Bashing. Auch nicht um Zahlenakrobatik: Wer sich über die vielen interessanten Ergebnisse informieren möchte, die David Kriesel damals ermittelte, recherchiere im Netz unter #bahnmining – und wird schnell fündig. Mir ist ein anderer Punkt wichtig: wie wertvoll es ist, möglichst viele öffentlich relevante Daten transparent zur Verfügung zu stellen.
Die Bahn verdient hier Lob – für ihre damalige und heutige Transparenz. Kriesel durfte die Daten aller Züge und Stopps in Deutschland 2019 laden und auswerten. Sie wurden ohne Wenn und Aber zur Verfügung gestellt. Und es waren gewaltige Datenmengen: 40 GByte XML-Daten täglich, 15 Terabyte fürs komplette Jahr. Das ist organisatorisch eine Herausforderung. Aber es funktioniert. Die Ergebnisse sind faktenbasiert. Echte Fakten! Gestützt auf reale Daten.
KI und maschinelles Lernen revolutionieren die Datenanalyse
Was 2019 noch manuell und mit enormem Aufwand analysiert wurde, übernehmen heute KI-Systeme automatisch. Machine Learning-Algorithmen erkennen Muster in Verspätungsdaten, die menschliche Analysten übersehen würden. Sie identifizieren Problemstrecken, vorhersagbare Verzögerungen durch Wetter oder Baustellen und können sogar alternative Routen vorschlagen.
Startups wie „TrainPredict“ oder „RailAnalytics“ nutzen diese Technologien kommerziell. Sie verkaufen Vorhersagemodelle an Verkehrsverbände und helfen dabei, Verspätungen zu minimieren. Die Deutsche Bahn selbst setzt mittlerweile auf KI-basierte Disposition und Predictive Maintenance.
Open Data als gesellschaftlicher Auftrag
Das #bahnmining-Projekt hat gezeigt, was möglich wird, wenn Behörden und öffentliche Unternehmen ihre Daten öffnen. Mittlerweile gibt es das „Open Data Gesetz“ auf Bundesebene, das Behörden zur Veröffentlichung von Daten verpflichtet. Trotzdem hinkt Deutschland im internationalen Vergleich hinterher.
Länder wie Estland oder Dänemark machen vor, wie umfassende Datentransparenz aussieht. Dort sind Verkehrs-, Gesundheits- und Bildungsdaten standardmäßig öffentlich verfügbar. Das ermöglicht nicht nur bessere politische Entscheidungen, sondern auch innovative Geschäftsmodelle und Bürgerbeteiligung.
Weg von Gefühlslagen: Mehr Fakten, bitte!
Fakten statt Gefühlslage: „Die Bahn ist immer unpünktlich. Ich weiß es! Ich fahre Bahn!“. Solche „Argumente“ dominieren nach wie vor die Sozialen Netzwerke. Gequirlte Gefühlsgemengelagen, angereichert mit Adjektiven auf Emotionsbeet und Empörung-Häubchen oben drauf. Das ist Alltag auf Twitter, Facebook und Co. Fakten stören nur. Doch genau die bringen uns weiter.
Deswegen bleibt das #bahnmining-Projekt auch 2026 eindrucksvoll und aktuell. Es dient als Blaupause für sachliche, datengetriebene Diskussionen. An die Stelle von Empörung und Mutmaßung treten Sachlichkeit und Fakten. Die Politik sollte aus diesem Beispiel lernen. Alle Behörden und Ministerien sollten relevante Daten sammeln und öffentlich zugänglich machen. Die Rohdaten, wohlgemerkt! Je mehr, desto besser.
Fazit: Daten als Basis für bessere Entscheidungen
Das #bahnmining-Projekt war mehr als eine technische Spielerei. Es hat gezeigt, wie Transparenz und Datenanalyse gesellschaftliche Debatten versachlichen können. Heute, sieben Jahre später, ist diese Erkenntnis wichtiger denn je. In Zeiten von Fake News und Filterblasen brauchen wir mehr faktenbasierte Diskussionen.
Die Lehre: Öffentliche Daten gehören in die Öffentlichkeit. Nur so können Bürger, Wissenschaftler und Unternehmen fundierte Entscheidungen treffen. Das #bahnmining hat den Weg geebnet – jetzt müssen Politik und Verwaltung folgen.
Zuletzt aktualisiert am 02.03.2026