Am fünften und letzten Tag der Dashboard Week in der Data School gab es wieder eine API, die abgefragt werden musste.
Über die London Air Quality API können Daten zu den unterschiedlichen Messwerten diverser Schadstoffe abgerufen werden. Diese beinhalten Daten verschiedener Messstationen, die auf jährlicher, täglicher oder stündlicher Ebene aggregiert sind.
Für die Abfrage an die API muss eine URL mit einem Datum und einem Groupname (in diesem Fall „London“) übergeben werden.
Da ich mich für monatliche Daten interessiere, habe ich zunächst ein Datumsfeld angelegt und mit dem Zeilen-generieren-Tool in Alteryx alle Monate von Januar 2000 bis heute generiert. Anschließend habe ich mit dem Datum/Uhrzeit-Tool ein weiteres Datumsfeld erstellt und meine Abfrage gestartet. Da die API nur eine bestimmte Anzahl von Abfragen in der Minute verarbeiten kann, musste ich vor dem Download eine Drosselung einbauen. Diese habe ich auf 6 Datensätze pro Minute gestellt, damit die API mir keine Fehlermeldung zurückgibt. Die heruntergeladenen Daten habe ich in einer YXDB-Datei (dem Alteryx-eigenen Datenbank-Dateiformat) zwischengespeichert, damit ich nicht ständig neue Abfragen an die API schicken muss.
Da die Dateien im JSON-Format vorliegen, mussten diese zunächst mit dem JSON-Parse-Tool geparsed und in Spalten geschrieben werden. Anschließend musste ich mit einem regulären Ausdruck (Regex) die einzelnen Felder tokenisieren, da in den einzelnen Überschriften Daten verschiedener Ebenen gespeichert sind. Eine Spalte beinhaltet nämlich Daten zur LocalAuthority (dem Ortsteil), zur Site (dem genauen Ort) und der Species (der Messstation). Erst nachdem diese Informationen strukturiert waren, konnten die Daten in eine Kreuztabelle überführt werden.
Dieses Mal habe ich aus den Daten eine Karte mit Wolken über London visualisiert, die den durchschnittlichen Air Quality Index für den Monat zeigen. Der Monat ist hierbei auf Seiten, wodurch man den zeitlichen Verlauf als eine Art Wetterradar animieren kann.
Insgesamt war die Dashboard Week eine tolle Gelegenheit an meinen Skills in Sachen Datenbeschaffung zu feilen und diese zu festigen. Außerdem habe ich auch in Tableau den einen oder anderen Kniff dazugelernt, wodurch ich meine Dashboards noch besser machen können werde. Es macht wirklich Spaß, in der Data School zu lernen. Die Zeit vergeht sehr schnell, wenn man mit Daten spielt.
Auch Sie wollen die Data School kennenlernen? Bewerben Sie sich jetzt in London oder werden Sie Trainee bei The Information Lab in Hamburg, um auch in die Data School reinzuschnuppern: