Für den 2. Tag haben wir mit Geografischen Daten gearbeitet. Dazu haben wir uns aus dem Internet auf der Website: Geofabrik die Daten zu dem von uns ausgewählten Bundesland bekommen. Diese Daten waren erstmal sehr umfangreich, da sie Objektdaten zu fast jedem Gebäude in dem jeweiligen Bundesland beinhalteten und diese in verschiedensten Kategorien aufgeteilt waren.
Für mich habe ich entschieden, dass ich es interessant finden würde zu wissen, wo in Hamburg für mich die meisten interessanten Wohnobjekte liegen, da ich demnächst eine neue Wohnung brauche. Hierfür wollte ich einen Index entwickeln, der die Stadteile nach der Anzahl der passenden Objekte einfärbt, sodass ich weiß, wo ich am besten suchen kann. Das Dashboard soll aber nicht nur für mich, sondern auch für andere nutzbar sein. Dafür habe ich mir 5 Faktoren überlegt, anhand denen der Index errechnet wird. Diese Faktoren waren die Anzahl an Schulen, Supermärkten, Ärzten, Kindergärten und Gewässern im Radius von bis zu 5 Km um eine Wohnung. Der Radius kann für jeden Faktor individuell eingestellt werden. So kann jemand, dem es wichtig ist einen Arzt und Supermarkt fußläufig zu erreichen hier eine andere Einstellung vornehmen als jemand, der kleine Kinder hat und dem ein naher Kindergarten wichtig ist. Damit sollten jedem Nutzer nur die für ihn interessanten Objekte angezeigt werden.
Um diese Darstellung zu ermöglichen habe ich die Spatial-Tools in Alteryx verwendet. Diese ermöglichen verschiedene Funktionen, um Geokoordinaten darzustellen. Bei Geokoordinaten gibt es die Unterscheidung zwischen Punkten, die aus einfachen x und y Koordinaten bestehen, Linien, die aus einer Reihe miteinander verknüpften Punkten bestehen und Polygonen, die eine Fläche zwischen verschiedenen Punkten darstellt.
In diesem Datensatz waren die Wohnobjekte als Polygone dargestellt, welche ich im ersten Schritt auf die verschiedenen Stadteile Hamburgs verteilt habe. Dafür konnte ich das „Spatial Match“-Tool verwenden, was einen Abgleich der Positionen der Wohnobjekte innerhalb der Polygone der Stadteile vornimmt und miteinander verknüpft.
Anschließend habe ich die Positionen aller Faktoren-Werte in Hamburg als Punkt-Koordinate aus der Datenquelle gefiltert und über das Tool „Find Nearest“ für jedes Wohnobjekt den jeweils nächsten Faktor ermittelt.
Damit konnte ich für jeden Stadtteil das Verhältnis von Faktorwert auf Wohnobjekte ermitteln, sodass ich herausfinden konnte, dass im Hamburger Stadtteil Ottensen durchschnittlich 159 Wohnobjekte auf einen Supermarkt kommen, wenn ich alle Supermärkte in einem Radius von 4 Km berücksichtige. Dabei habe ich die Annahme getroffen, dass ein kleinerer Wert positiv zu werten ist, da dann die Wahrscheinlichkeit, dass diese Orte überlaufen sind geringer ist. Dieses Verhältnis habe ich benutzt, um meinen Index zu errechnen. Dafür habe ich einen Durchschnitt aller Faktorenverhältnisse errechnet und diesen ins Verhältnis zur Gesamtanzahl der Wohnobjekte gesetzt. Ein geringer Wert indiziert hierbei ein gutes Verhältnis von Wohnobjekten und Faktorwerten.
Durch eine Kartenvisualisierung kann man nun erkennen, welche Stadteile bei gewünschter Filtereinstellung besonders viele und besonders wenige Wohnobjekte enthalten.