• pexels-markus-spiske-2004161.
        • Software Solutions

          Wir helfen Ihnen bei der Auswahl 
          der richtigen Lösungen, um die 
          Kraft Ihrer Daten freizusetzen.
        • Tableau
        • Das weltweit leistungsstärkste Tool zur Datenvisualisierung und -analyse.

        • Alteryx
        • Die führende Plattform in der
          dynamischen Welt der Analytic
          Process Automation.

        • Snowflake
        • Für Cloud-basierte Data-Warehouse-Lösungen der nächsten Stufe.

        • Process Mining aus Deutschland. Verschaffen Sie sich ein objektives und datengetriebenes Bild Ihrer internen Prozesse. Ganz im Sinne der optimierten  Wertschöpfung.

        • Amazon Web Services (AWS)
        • Führend bei Cloud-First-Datenlösungen.

  • Use Cases
  • The Data School
        • WIBI 2024_Vortragsraum
        • UP TO DATA

          Bleiben Sie auf dem Laufenden mit den neuesten Entwicklungen und Ereignissen aus der Welt der Daten – von aktuellen News bis hin zu spannenden Data Events.

        • Data News
        • Informieren Sie sich über neue Nachrichten, Trends und Einblicke aus der Welt der Daten – alles Wichtige kompakt in unseren Daten News. Melden Sie sich direkt bei unserem Newsletter an und bekommen alles Wissenswerte einmal im Monat zugeschickt.

        • Newsletter
        • Jeden Monat senden wir Ihnen eine Email mit den neuesten Informationen zu einer zeitgemäßen Analysekultur, Visual Analytics, Seminaren, Events und Tipps & Tricks.

        • Data Events
        • Entdecken Sie bei uns komprimiert spannende Data Events und erfahren Sie alles über kommende Branchen-Events, Konferenzen und Webinare rund um das Thema Daten mit Tableau und Alteryx.

        • Sommerfest 2024 - The Information Lab
        • Über Uns

          Lernen Sie The Information Lab kennen, unser Team, unsere Kunden und erfahren Sie, wie auch Sie ein Teil davon werden können.

          Mehr erfahren

        • Centre of Excellence
        • Geteiltes Wissen ist Macht – vernetzen Sie sich mit unserer wachsenden Zahl von Beratern und Kunden in ganz Europa. Zusammenarbeit ist der beste Weg zu lernen.

        • Kunden
        • Wir unterstützen seit 2014 namhafte Unternehmen in der DACH-Region und im deutschen Mittelstand.

        • Internationales Setup
        • The Information Lab ist an 8 europäischen Standorten mit über 600 Consultants aktiv. Unsere Data School gibt es bereits in London, Sydney und Hamburg.

        • FAQ
        • Häufig gestellte Fragen über uns, unsere Produkte u.v.m.

        • Team
        • Lernen Sie die Menschen hinter The Information Lab kennen.

        • Karriere
        • Join our team! Wir wachsen stetig und suchen insbesondere im Consulting und unserer Data School stets tolle Kollegen und Kolleginnen.

Banner background image - news

Data Prep mit Alteryx

Wie ich letzte Woche erwähnt habe, habe ich den Datensatz, den ich analysiert habe, erst in Alteryx vorbereitet. 

Es ist natürlich wunderschön, dass mehr und mehr Organisationen (z.B. staatliche und nichtstaatliche Organisationen) ihre Daten veröffentlichen, aber das Datenformat nicht immer sofort analysierbar ist. Das heißt, erst muss der Datensatz vorbereitet (oder “prep’d”) werden, um ihn danach analysieren zu können. Dies gilt nicht nur für öffentlich verfügbare Daten, sondern auch für Geschäftsdaten, die notorisch unordentlich sind. 

Data Prep, wie es auch genannt wird, ist normalerweise nicht der aufregendste Schritt im Datenanalyseprozess, aber zum Glück gibt es Tools wie Alteryx, welche die Arbeit erleichtern. Letzte Woche habe ich erwähnt, dass ich erst einen Datensatz in Alteryx vorbereitet hatte. Heute möchte ich weiter darstellen, was ich genau gemacht habe (keine Angst, dies ist ein einfaches pädagogisches Beispiel). 

Ich begann mit einem Liniendiagramm von Fox News, das ich in Tableau reproduzieren und verbessern wollte (s. mein Blogbeitrag von letzter Woche). Als nächstes suchte ich mir die Rohdaten aus der offiziellen Quelle (United States Bureau of Labor Statistics). Die Daten sahen in einer Excel-Datei so aus:

Tableau_RGB.

Wie wir sehen können, sind die Daten bis zum Monat dieses Schreibens vollständig. Nichtsdestotrotz werden die Monate als einzelne Spalten dargestellt, und wir ziehen es vor, eine einzelne Spalte für Monate und eine andere für die Arbeitslosenquote zu erstellen. Mit anderen Worten, wir würden es vorziehen, eine Spalte pro Feld (z.B. Monat oder  Arbeitslosenquote) zu kreieren, anstatt die gleichen Feld über mehrere Spalten zu verteilen (z.B. Monat über Jan, Feb, usw.). Diese Format ist auch als “Tidy Data” bekannt.

Zunächst sehen wir, wie wir dies in Alteryx tun würden. Dafür ziehen wir die Datei einfach in einen neuen Workflow. Im linken Fenster sehen wir eine Vorschau der Daten. Da diese gut aussehen, können wir einfach auf “Run” klicken und unsere Datei einlesen. In unserem Workflow sehen wir jetzt ein grünes Buchsymbol. 

PayrollImage1.

Wir werden jetzt das “Transpose Tool” verwenden, um Spalten in Zeilen umzuwandeln. In diesem Schritt müssen wir unsere “Key”- und “Data”-Spalten identifizieren. Die “Key”-Spalte (oben links im Screenshot unten) möchten wir als Spalte behalten (Jahr), und die Data Spalte (unten links im Screenshot unten) enthält die Daten, die wir zum Zeilen umwandeln möchten (Monate).

Untitled-drawing-1-705x529.

Wie wir oben sehen können, hat Alteryx unsere Spalten in Zeilen umgewandelt. Jetzt haben wir jedoch “Name” und “Value” als Spalten, die wir noch mit dem “Select”-Tool umbenennen. Das Select Tool kann außerdem dazu benutzt werden, Felder umzubenennen, auszuwählen, oder den Datentyp zu ändern. 

Dashboard3.

Oben habe ich “Name” und “Value” in “Month” bzw. “Rate” umbenannt. Als letzten Schritt können wir das “Output Data”-Tool benutzen, um die Datei in ein für Tableau geeignetes Format zu speichern. Man kann die Datei als unterschiedliches Format in Alteryx speichern, aber am besten sollte man es als Excel-Format für Tableau (.xlsx) speichern. Der gesamte Workflow und die entsprechende Datei sehen jetzt so aus:

StealLikeAnArtistPIC.
BookOfCirclesOPIC-705x705.

Nun können wir die Excel-Datei in Tableau einlesen und sehen unten genau das Datenformat, welches wir haben möchten: unsere Zeit-Variablen (Year und Month) werden als Dimensionen erkannt und die Arbeitslosenquote als Kennzahlen identifiziert.

DearDataPIC-705x470.

Nächste Woche werde ich die gleichen Schritte in Tableau Prep erklären sowie die Vor- und Nachteile von Alteryx und Tableau Prep beleuchten.