Die letzten Wochen der Analytics Academy brechen an. Unter anderem geht es um die Verfeinerung der Fähigkeiten mit Tableau und Alteryx. Dazu haben wir die spannende Aufgabe erhalten, jeden Tag einen neuen Datensatz zu bearbeiten, zu analysieren und zu visualisieren.
Der Montag startet mit Airbnb Daten. Die Seite nennt sich Inside Airbnb und bietet die Möglichkeit, die Daten von Airbnb zu verwenden – weltweit!
Nachdem ich die Daten zum Ersten mal gesehen hatte, hatte ich mir das Ziel gesetzt, die Berliner Stadtteile in den Mittelpunkt zu rücken. Dementsprechend habe ich Alteryx dazu verwendet, die Daten aufzubereiten und zu selektieren. Untenstehend seht ihr ein kurzes GiF vom Workflow bei Alteryx:
Hierbei möchte ich auf eine Sache eingehen, die mich bei der Vorbereitung für die Alteryx Prüfung sehr erfreut hat. Das „Auto Field“ Tool. Alteryx bestimmt hierbei den passendsten und kleinstmöglichen Datentyp. Doch nach Gesprächen mit erfahrenen Kollegen wurden auch negative Aspekte angesprochen. Offenbar ist es auch nach Benutzung des Tools unerlässlich, dass man nochmal die Datenstruktur und zugewiesenen Typen überprüft.
Nachdem ich die Daten als .hyper Format abgespeichert hatte, ging es an Tableau. Da unter anderem die Aufgabe war, dass wir Visualisierungen verwenden sollen, die wir so noch nie verwendet haben, entschied ich mich für eine die Dichtemarkierung bei der Karte. Ziel sollte es sein, auf einen Blick erkennen zu können, welche Stadtteile besonders viele Wohnungen von Airbnb aufweisen.
Ein weitere Frage beschäftigte mich: wie viel Platz nehmen denn nun Wohnungen von Airbnb ein? Um diese Frage beantworten zu können, musste ich weitere Daten anbinden. Über Wikipedia kopierte ich mir Details zu den verschiedenen Bezirken Berlins und deren Größe in km2.
Nachdem ich die Daten über den Bezirken geblendet hatte, konnte ich den Prozentualen Anteil berechnen, den die Wohnungen einnehmen. Dabei musste ich vorher eine Schätzung des Wohnraumes durchführen, denn leider gab es dazu nur unvollständige Daten (wie es oft so ist).
Anbei findet ihr meine fertige Visualisierung: