Alteryx bietet eine Vielzahl von Möglichkeiten, Vorhersagen zu erstellen, ohne dass dafür große Programmierkenntnisse benötigt werden. Heute wollen wir Ihnen das Decision Tree Tool vorstellen.
Wozu brauche ich das Decision Tree Tool?
Decision Trees, im Deutschen Entscheidungsbäume genannt, ermöglichen es Ihnen, eine Vorhersage auf Grundlage von Entscheidungsregeln zu erstellen. Das abgebildete Baumdiagramm verdeutlicht die Vorgehensweise in einem Entscheidungsbaum-Modell. So könnte beispielsweise eine Bank bei der Kreditvergabe daran interessiert sein, zukünftigen Kunden ein Kreditausfallrisiko zuzuordnen. Diese Risikoeinordnung kann auf Basis der bestehenden Kunden erfolgen, wie nachfolgend gezeigt.
Hierzu greifen wir im ersten Schritt auf unsere bereits vorhandenen Kundendaten zurück. Anhand der darin auftretenden Muster können wir Entscheidungsregeln aufstellen, welche im nächsten Schritt auf Neukunden zur Vorhersage angewandt werden können.
Formal lässt sich die obige Abbildung als Abfolge von IF-THEN-Bedingungen beschreiben.
IF "Bonitätscheck" = "Nein" and "Sicherheiten" = "Ja" THEN "geringes Risiko"
Um solch ein Entscheidungsbaum-Modell in Alteryx zu verwenden, benötigen Sie das Decision Tree Tool, welches in der Auswahl unter Predictive zu finden ist.
Sie haben noch keinen Predictive Part in Ihrer Tool Übersicht? Hier geht’s zum Download.
Wie konfiguriere ich mein Decision Tree Tool?
Innerhalb des Tools trifft man dann die Wahl des Zielfeldes, für die ein Schätzmodell erstellt werden soll. Handelt es sich bei dem vorliegenden Zielfeld um kategoriale Daten, dann wird ein Entscheidungsbaum auf Basis unterschiedlicher Klassifizierungen gebildet. Sind die Daten fortlaufend, so bildet Alteryx den Entscheidungsbaum auf Basis einer Regression.
Anschließend werden die Felder ausgewählt, welche das Zielfeld beschreiben sollen. Neben den Standardeinstellungen bietet das Tool die Möglichkeit, die Analyse weiter zu spezifizieren. So kann man beispielsweise aus unterschiedlichen Algorithmen zur Berechnung wählen.
Die drei Ausgänge des Tools lassen sich wie folgt beschreiben:
- Der Output (O) enthält das eigentliche Modell und kann im nächsten Schritt zur Vorhersage an ein weiteres Predictive-Tool, wie zum Beispiel das Score-Tool, angeschlossen werden.
- Im Report (R) wird eine Zusammenfassung des Modells angezeigt. Unter anderem finden Sie hier die Felder zur Erklärung des Zielfeldes.
- Die Interactive-Schnittstelle (I) stellt ein Dashboard mit Informationen über das gewählte Modell zusammen.
Der Workflow um das Decision Tree Tool
Die obige Abbildung zeigt noch einmal die Anwendung des Decision Tree Tools innerhalb eines Workflows. Der I-Output des Decision Tree Tools bildet wie oben den Entscheidungsbaum mit den entsprechenden Entscheidungsregeln ab und gibt noch zusätzliche Informationen zur Validität der Schätzung.
Denn natürlich lassen sich komplexe Prozesse nicht immer einhundertprozentig vorhersagen, wie jene in unserem einfachen Beispiel. Dies liegt zum Einen an unseren Daten, welche Ausreißer enthalten können. Es mag den ein oder anderen Kunden geben, der trotz eines negativen Bonitätschecks ein geringes Risiko ausgewiesen hat. Zum Anderen kann unserer Vorhersage-Algorithmus fehlerhaft sein. Um diese Ungenauigkeit abzubilden, erhalten wir für unsere getroffene Einteilung immer eine Wahrscheinlichkeitsverteilung.
Für unser Beispiel wurden also, nach der definierten Entscheidungsregel, 91.9% der niedrigen und 98.6% der hohen Risiken korrekt zugewiesen. Neben der aggregierte Übersicht aus dem I-Output können wir im Ergebnis-Fenster die genaue Wahrscheinlichkeit für jeden einzelnen Datenpunkt ablesen.
Wie bei allen Vorhersagen, so ist es auch hier entscheidend, das richtige Modell zu wählen. Warum also ein Entscheidungsbaum-Modell? Der größte Vorteil liegt hierbei in der relativ einfach verständlichen Methode der Vorhersage. Jedoch empfiehlt es sich immer, verschiedene Modelle miteinander zu vergleichen. Wie Sie in Alteryx solch einen Vergleich verschiedener Vorhersage-Modelle machen und diese in einen Workflow einbetten, erfahren Sie in einem unserer nächsten Beiträge.
Sie wollen eigene Vorhersagen entwickeln, ohne sich erst Programmierkenntnisse aneignen zu müssen? Erstellen Sie jetzt Ihren eigenen Entscheidungsbaum in Alteryx: