• pexels-markus-spiske-2004161.
        • Software Solutions

          Wir helfen Ihnen bei der Auswahl 
          der richtigen Lösungen, um die 
          Kraft Ihrer Daten freizusetzen.
        • Tableau
        • Das weltweit leistungsstärkste Tool zur Datenvisualisierung und -analyse.

        • Alteryx
        • Die führende Plattform in der
          dynamischen Welt der Analytic
          Process Automation.

        • Snowflake
        • Für Cloud-basierte Data-Warehouse-Lösungen der nächsten Stufe.

        • Process Mining aus Deutschland. Verschaffen Sie sich ein objektives und datengetriebenes Bild Ihrer internen Prozesse. Ganz im Sinne der optimierten  Wertschöpfung.

        • Amazon Web Services (AWS)
        • Führend bei Cloud-First-Datenlösungen.

  • Use Cases
  • The Data School
        • WIBI 2024_Vortragsraum
        • UP TO DATA

          Bleiben Sie auf dem Laufenden mit den neuesten Entwicklungen und Ereignissen aus der Welt der Daten – von aktuellen News bis hin zu spannenden Data Events.

        • Data News
        • Informieren Sie sich über neue Nachrichten, Trends und Einblicke aus der Welt der Daten – alles Wichtige kompakt in unseren Daten News. Melden Sie sich direkt bei unserem Newsletter an und bekommen alles Wissenswerte einmal im Monat zugeschickt.

        • Newsletter
        • Jeden Monat senden wir Ihnen eine Email mit den neuesten Informationen zu einer zeitgemäßen Analysekultur, Visual Analytics, Seminaren, Events und Tipps & Tricks.

        • Data Events
        • Entdecken Sie bei uns komprimiert spannende Data Events und erfahren Sie alles über kommende Branchen-Events, Konferenzen und Webinare rund um das Thema Daten mit Tableau und Alteryx.

        • Sommerfest 2024 - The Information Lab
        • Über Uns

          Lernen Sie The Information Lab kennen, unser Team, unsere Kunden und erfahren Sie, wie auch Sie ein Teil davon werden können.

          Mehr erfahren

        • Centre of Excellence
        • Geteiltes Wissen ist Macht – vernetzen Sie sich mit unserer wachsenden Zahl von Beratern und Kunden in ganz Europa. Zusammenarbeit ist der beste Weg zu lernen.

        • Kunden
        • Wir unterstützen seit 2014 namhafte Unternehmen in der DACH-Region und im deutschen Mittelstand.

        • Internationales Setup
        • The Information Lab ist an 8 europäischen Standorten mit über 600 Consultants aktiv. Unsere Data School gibt es bereits in London, Sydney und Hamburg.

        • FAQ
        • Häufig gestellte Fragen über uns, unsere Produkte u.v.m.

        • Team
        • Lernen Sie die Menschen hinter The Information Lab kennen.

        • Karriere
        • Join our team! Wir wachsen stetig und suchen insbesondere im Consulting und unserer Data School stets tolle Kollegen und Kolleginnen.

Banner background image - news

Mit Alteryx Entscheidungsbäume erstellen

Alteryx bietet eine Vielzahl von Möglichkeiten, Vorhersagen zu erstellen, ohne dass dafür große Programmierkenntnisse benötigt werden. Heute wollen wir Ihnen das Decision Tree Tool vorstellen.

Wozu brauche ich das Decision Tree Tool?

Decision Trees, im Deutschen Entscheidungsbäume genannt, ermöglichen es Ihnen, eine Vorhersage auf Grundlage von Entscheidungsregeln zu erstellen. Das abgebildete Baumdiagramm verdeutlicht die Vorgehensweise in einem Entscheidungsbaum-Modell. So könnte beispielsweise eine Bank bei der Kreditvergabe daran interessiert sein, zukünftigen Kunden ein Kreditausfallrisiko zuzuordnen. Diese Risikoeinordnung kann auf Basis der bestehenden Kunden erfolgen, wie nachfolgend gezeigt.

Decision Tree Tool in Alteryx
Entscheidungsbaum für die Bestimmung von Kreditausfallrisiken

Hierzu greifen wir im ersten Schritt auf unsere bereits vorhandenen Kundendaten zurück. Anhand der darin auftretenden Muster können wir Entscheidungsregeln aufstellen, welche im nächsten Schritt auf Neukunden zur Vorhersage angewandt werden können.

Formal lässt sich die obige Abbildung als Abfolge von IF-THEN-Bedingungen beschreiben.

IF "Bonitätscheck" = "Nein" and "Sicherheiten" = "Ja" THEN "geringes Risiko" 

Um solch ein Entscheidungsbaum-Modell in Alteryx zu verwenden, benötigen Sie das Decision Tree Tool, welches in der Auswahl unter Predictive zu finden ist.

Sie haben noch keinen Predictive Part in Ihrer Tool Übersicht? Hier geht’s zum Download.

Wie konfiguriere ich mein Decision Tree Tool?

Innerhalb des Tools trifft man dann die Wahl des Zielfeldes, für die ein Schätzmodell erstellt werden soll. Handelt es sich bei dem vorliegenden Zielfeld um kategoriale Daten, dann wird ein Entscheidungsbaum auf Basis unterschiedlicher Klassifizierungen gebildet. Sind die Daten fortlaufend, so bildet Alteryx den Entscheidungsbaum auf Basis einer Regression.

Anschließend werden die Felder ausgewählt, welche das Zielfeld beschreiben sollen. Neben den Standardeinstellungen bietet das Tool die Möglichkeit, die Analyse weiter zu spezifizieren. So kann man beispielsweise aus unterschiedlichen Algorithmen zur Berechnung wählen.

Die drei Ausgänge des Tools lassen sich wie folgt beschreiben:

  • Der Output (O) enthält das eigentliche Modell und kann im nächsten Schritt zur Vorhersage an ein weiteres Predictive-Tool, wie zum Beispiel das Score-Tool, angeschlossen werden.
  • Im Report (R) wird eine Zusammenfassung des Modells angezeigt. Unter anderem finden Sie hier die Felder zur Erklärung des Zielfeldes.
  • Die Interactive-Schnittstelle (I) stellt ein Dashboard mit Informationen über das gewählte Modell zusammen.

Der Workflow um das Decision Tree Tool

Vorhersage-Workflow des Decision Tree Tool in Alteryx
Vorhersage-Workflow mit Decision Tree Tool

Die obige Abbildung zeigt noch einmal die Anwendung des Decision Tree Tools innerhalb eines Workflows. Der I-Output des Decision Tree Tools bildet wie oben den Entscheidungsbaum mit den entsprechenden Entscheidungsregeln ab und gibt noch zusätzliche Informationen zur Validität der Schätzung.

Denn natürlich lassen sich komplexe Prozesse nicht immer einhundertprozentig vorhersagen, wie jene in unserem einfachen Beispiel. Dies liegt zum Einen an unseren Daten, welche Ausreißer enthalten können. Es mag den ein oder anderen Kunden geben, der trotz eines negativen Bonitätschecks ein geringes Risiko ausgewiesen hat. Zum Anderen kann unserer Vorhersage-Algorithmus fehlerhaft sein. Um diese Ungenauigkeit abzubilden, erhalten wir für unsere getroffene Einteilung immer eine Wahrscheinlichkeitsverteilung.

Wahrscheinlichkeitsverteilung der Ausfallrisiken im Decision Tree Tool in Alteryx
Wahrscheinlichkeitsverteilung der Ausfallrisiken

Für unser Beispiel wurden also, nach der definierten Entscheidungsregel, 91.9% der niedrigen und 98.6% der hohen Risiken korrekt zugewiesen. Neben der aggregierte Übersicht aus dem I-Output können wir im Ergebnis-Fenster die genaue Wahrscheinlichkeit für jeden einzelnen Datenpunkt ablesen.

Ergebnisse der Entscheidungsbaum-Vorhersage mit dem Decision Tree Tool in Alteryx
Ergebnisse der Entscheidungsbaum-Vorhersage

Wie bei allen Vorhersagen, so ist es auch hier entscheidend, das richtige Modell zu wählen. Warum also ein Entscheidungsbaum-Modell? Der größte Vorteil liegt hierbei in der relativ einfach verständlichen Methode der Vorhersage. Jedoch empfiehlt es sich immer, verschiedene Modelle miteinander zu vergleichen. Wie Sie in Alteryx solch einen Vergleich verschiedener Vorhersage-Modelle machen und diese in einen Workflow einbetten, erfahren Sie in einem unserer nächsten Beiträge.

Sie wollen eigene Vorhersagen entwickeln, ohne sich erst Programmierkenntnisse aneignen zu müssen? Erstellen Sie jetzt Ihren eigenen Entscheidungsbaum in Alteryx:

Alteryx testen