Heute war unser Hauptthema Geodaten. Die größte Herausvorderung und gleichzeitig der größte Spaß war dabei die absolute Freiheit in der Aufgabenstellung: Wir sollten uns selbst spezifische Geodaten (ESRI Shapefiles) heraussuchen und recherchieren. Wegen individualisierter Fragestellung war auch weniger Teamarbeit angesagt als am Montag.
Ausgerechnet mit Geodaten haben wir ETL-Prozesse nicht viel geübt, deshalb fiel uns das wesentlich schwerer als erwartet. Ich habe 60% der Zeit in Alteryx verbracht. Bereits zu Beginn war mir klar, dass ich Berlin als Zielstadt auswählen würde, jedoch hat sich die Fragestellung im Laufe des Tages gewechselt. Von detaillierter und vielfältiger Übersicht auf der PLZ-Ebene habe ich letztendlich abgesehen und die Granularität meiner Daten auf Berlins zwölf Bezirke definiert. Dafür habe ich mir eine zusätzliche Datensatzquelle herausgesucht. Ich habe auch beschlossen, eine klare Botschaft zu liefern. Dank meiner lustigen Stimmung stellte ich die Frage wie folgt: „Was ist leichter zu finden in Berlin: eine Bankautomaten (ATM) oder eine öffentliche Toilette?“
Meine grundlegenden KPIs waren: Anzahl der ausgewählten Objekte insgesamt pro Bezirk, Anzahl pro Quadratkilometer und Mittelwert für die geringste Entfernung zwischen zwei Toiletten oder Bankautomaten. Der Teufel steckt aber im Detail: Nur am Ende des Arbeitstages habe ich verstanden, dass ich die Daten anders vorbereiten sollte, um meine Analyse vollständig durchführen zu können. Mein größter Fehler war, das Dashboard nicht zuerst auf dem Papier zu zeichnen, so habe ich am Ende größere Schwerigkeiten damit gehabt, zwei Parameter mit Boolesche-Wert zu vergleichen und ich habe es nicht geschafft. Eine wichtige Lehre daraus war für mich: Erst muss man sich deutlich vorstellen können, was und in welcher Form man braucht.
Am Ende sind alle fünf Analysten zu absolut unterschiedlichen Ergebnissen gekommen und es war sehr interessant zu beobachten.
Die interaktive Version des Dashboards ist hier.