Heute war der erste Tag unserer Dashboard-Woche. Unser Trainer hat uns einen Datensatz zur Verfügung gestellt, aus dem wir eine Visualisierung erstellen sollten. Am Ende des Tages sollten wir unsere erstellte Visualisierung unseren eingeladenen Kollegen präsentieren. Dafür hatten wir fünf Minute Zeit.
Der Trainer hat den Datensatz von der Webseite der Amadeu Antonio Stiftung gewebscrapt. Beim Web-Scraping (englisch) werden Daten von Webseiten extrahiert und gespeichert, um diese zu analysieren oder anderweitig zu verwerten. Das Thema handelt von Todesopfer rechter Gewalt in Deutschland seit 1990. Folgendes Bild gibt einen Überblick über den Datensatz.
Der erste Schritt war, die Qualität des Datensatzes zu prüfen. Da es nicht so viel zu reinigen gab, konnte ich es in wenigen Schritten in Tableau reinigen. In der Spalte „Ort“ war das Bundesland in Klammern gespeichert. Diese habe ich mit der Funktion split() getrennt. In ähnlicher Weise habe ich „Jahre“ von der Spalte „Alter“ getrennt, damit ich sie bei der Visualisierung besser anzeigen konnte. Eines der Altersangaben war in Monaten gespeichert, die ich in Jahre konvertieren sollte. Danach habe ich eine neue Spalte „Altersgruppen“ erstellt und die Information auf verschiedene Gruppe aufgeteilt. Klicke auf Gruppieren in Tableau, um zu verstehen, wie eine Gruppe in Tableau erstellt wird. Als nächstes habe ich die Spalte „Datum“ zu dem richtigen Datentyp also Date konvertiert. Zusätzlich habe ich einige Spalten mit der Hilfe von Calculated Field erstellt, die ich für die Erstellung meiner Visualisierung benötigte.
In meinem Dashboard ist eine Karte und zwei Balkendiagramme zusammen mit einer BAN (Big Ass Number) zu sehen. Die Karte gibt einen Überblick über die Anzahl der Todesopfer auf Landesebene. Das Balkendiagramm auf der rechten Seite zeigt die Anzahl der Todesopfer auf Stadtebene. Der Balken ist nach Altersgruppen gefärbt und die Anzahl der einzelnen Gruppen wird im Tooltip angezeigt. Aus dem zweiten Balkendiagramm ist die Anzahl der Todesopfer pro Kategorie nach der Stiftung zu sehen. Die Bundesregierung zählt 106 offizielle Todesopfer rechter Gewalt in Deutschland seit 1990. Eine große Diskrepanz bleibt also weiter bestehen: Die Amadeu Antonio Stiftung zählt 213 Todesopfer rechter Gewalt. Zudem eine Liste mit 14 weiteren Verdachtsfällen. Laut der Stiftung handelt es sich dann um ein Verdachtsfall, wenn es nach bisherigem Informationsstand starke Indizien für ein rechtes Motiv gab. Das Dashboard ist interaktiv. Wenn eine oder mehrere Bundesländer auf der Karte ausgewählt sind, werden die Balkendiagramme entsprechen angepasst. Ebenso ist es mit anderen Diagrammen. In der oberen linken Ecke befindet sich ein Jahresfilter, mit dem nach Jahren gefiltert werden kann. In allen Diagrammen gibt es Tooltips, die zusätzliche Informationen liefern. Das Dashboard wird auf meinem Tableau-Public-Profile veröffentlicht.