Die erste Herausforderung heute in der Analytics Academy war es ein Dashboard zu bauen mit mehreren Datensätzen aus der Ultimate Fighting Championship (UFC). Das Thema war der Gruppe zum größten Teil fremd und dadurch anfangs schwer zu durchdringen. Die Granularität der Daten war auf Kampfebene, was mir persönlich nicht gefiel. Meine Vision eines Dashboardes war auf der Kämpferebene. Mein Ziel war klar, aber der Weg dorthin noch nicht.
Die rot markierten Überschriften sollen einige der schwierigen Stellen zeigen.
- Es wurden für jeden Kampf die aktuelle Bilanz des Kämpfers angezeigt
- Die Spalte „Winner“ wies nur die Farbe aus nicht den Namen
Für das erste Problem war der Max-Wert die Lösung. Als ich verstand, dass die Bilanzwerte der Kämpfe wie eine laufende Summe zu verstehen sind erinnerte ich mich an einen guten Rat für solche Probleme zur Identifikation von unbestimmten Zeiten und Ihren Werten: „nimm das Max. Datum.“ Also Gruppierte ich mit dem Summarizetool in meinem ETL-Workflow, in Alteryx die Kämpfer (R) und gab das Max. Datum ihrer Kämpfe wieder.
Das Gleiche machte ich mit der anderen Gruppe (B), um parallel auch die zweite Schwierigkeit zu lösen.
Diese „Summarize-Tools“ habe ich über ein Union-Tool zusammengeführt und hatte damit eine Liste aller Kämpfer, die jemals in der blauen oder roten Ecke gestanden haben. Dadurch waren die Schwierigkeiten gelöst und meine gewünschte Granularität vorhanden.