Die Kryptowährung Bitcoin ist nach wie vor ein wichtiger Bestandteil der medialen Berichterstattung. Viele Menschen waren erstaunt über den rasanten Anstieg und viele Investoren waren besorgt über den plötzlichen Einbruch. Daher ist DIE Frage: Wie entwickelt sich die Währung anhand der bisher verzeichneten Kursstände? (Stand der Daten: 25.03.2018)
Alteryx bietet Ihnen diverse Time-Series-Tools, welche auf der Programmiersprache R basieren. Also nutzen wir doch diese Tools, um die Entwicklung des Bitcoin näher zu betrachten. Eine wichtige Voraussetzung für eine bestmögliche Prognose ist eine lückenlose Zeitreihe. Je länger die Zeitreihe, desto robuster kann das Prognose-Modell werden. Für unser folgendes Beispiel verwenden wir Krypto-Daten, woraus anschließend alle Werte für den Bitcoin extrahiert wurden.
BITTE BEACHTEN SIE: DIE FOLGENDE ANALYSE DIENT LEDIGLICH ALS BEISPIEL UND SPIEGELT KEINE VALIDE PROGNOSE DES BITCOIN WIEDER!
Welches Modell sollten Sie verwenden?
Zur Beantwortung dieser Frage ist ein Blick in die Time-Series-Tools hilfreich.
Hier sehen Sie das ARIMA- und das ETS-Modell. Dieser Beitrag wird die statistischen Unterschiede zwischen diesen beiden Modellen nicht vertiefen. Doch welches Modell ist nun besser? Um diese Entscheidung korrekt treffen zu können, werden wir unser Analyse-Sample modifizieren, indem wir die letzten zwei Wochen unserer Daten als Referenz verwenden. Fügen Sie ein Filter-Tool in den Workflow ein und wählen Sie es mit der linken Maustaste an. Dadurch öffnet sich im linken Bildschirmbereich das Konfigurationsfenster für das Tool. Dort verwenden Sie folgende Einstellungen:
Wir werden nun beide Modelle durch das ARIMA- und das ETS-Modell von Alteryx für die nächsten 14 Tage berechnen lassen. Mithilfe des TS-Compare-Tools können wir dann betrachten, welches Modell eine geringere Abweichung zur tatsächlichen Kursentwicklung vorweisen kann. Verwenden Sie nun beide Tools und nehmen Sie folgende Konfigurationen vor:
Im ersten Screenshot sehen Sie die Einstellungen für das ARIMA-Modell. Unter „Model name“ spezifizieren Sie den Namen Ihres Modells (in unserem Fall „Bitcoin_ARIMA“). Im folgenden Schritt wählen Sie unter „Select the target field“ den Wert aus, den Sie prognostizieren möchten. In unserem Fall wählen wir die Variable „close“, die den Kurs am Ende des jeweiligen Tages enthält. Diese Variable sollte ein numerisches Format vorweisen. Des Weiteren sind wir an der täglichen Entwicklung interessiert, weswegen wir „Daily (all days)“ auswählen.
Klicken Sie außerdem auf das Feld „Other options“, um das Prognose-Intervall einzustellen. Unter „The number of periods to include in the forecast plot“ tragen Sie den Wert 14 ein, da wir für die nächsten 14 Tage eine Prognose berechnen wollen. Nehmen Sie auch diese Konfiguration für beide Modelle folgendermaßen vor:
Sie sehen noch weitere Konfigurationsmöglichkeiten, mit denen Sie das Modell weiterentwickeln könnten. Unsere Daten geben jedoch keine weiteren relevanten Variablen her. Daher verzichten wir in diesem Beispiel vorerst auf weitere Konfigurationen.
Sie sehen am Ende des Tools drei Ausgänge: O, R, I.
- O Output: Beinhaltet den Datenstream des ARIMA-Modells, welcher für weitere Analysen mithilfe der Alteryx-Tools notwendig ist
- R Output: Hier finden Sie tabellarische Ergebnisse des Modells, wie z.B. die Koeffizienten, Standardfehler, AIC, Plots zur Autokorrelation etc.
- I Output: Eine interaktive Grafik des bisherigen Verlaufs, sowie der Prognose-Ergebnisse.
Generell ist pro Ausgang ein Browse-Tool empfehlenswert, sodass die Resultate auch ausführlich betrachtet werden können.
Wir haben nun beide Modelle erfolgreich geschätzt. Dies erlaubt uns, mithilfe des TS-Compare-Tools eine Aussage darüber zu treffen, welches Modell eine bessere Schätzung unserer Daten erreicht hat.
Anhand des Workflows sehen Sie, dass beide O-Outputs der geschätzten Modelle mit einem Union-Tool kombiniert wurden. Als Referenzgruppe verwenden wir die 14 Tage aus unseren Daten, welche wir tatsächlich beobachten konnten. Somit können wir eine Aussage über die Schätz-Genauigkeit treffen.
Dieses Ergebnis erhalten Sie durch das Verknüpfen des O-Outputs mit einem Browse-Tool. Hier zeigt sich die Wichtigkeit der eindeutigen Benennung bei der Konfiguration der Modelle, da Sie nun die Modelle anhand ihrer unterschiedlichen Namen eindeutig identifizieren und vergleichen können. Alteryx kalkuliert diverse statistische Maßzahlen, wobei wir uns bspw. den RMSE (Root Mean Squared Error) anschauen. Das ETS-Modell weist hierbei einen geringeren Wert auf, wodurch wir von einer höheren Schätzgenauigkeit des Modells ausgehen können.
Wie sieht die Prognose für die nächsten 14 Tage aus?
Nachdem wir uns für ein Modell entschieden haben, können wir schließlich unsere finalen Ergebnisse erstellen. Hierfür benutzen wir wieder unser komplettes Daten-Set, einschließlich der letzten 14 Tage, welche zuvor noch als Referenz gedient haben. Zur Kalkulation und Visualisierung unserer Prognose werden das TS-Forecast- und das TS-Plot-Tool verwendet, wobei ersteres die Berechnung vornimmt. Erstellen Sie somit den folgenden Workflow:
Für das erneut verwendete ETS-Tool kopieren Sie einfach das bisher verwendete Tool, sodass auch die Konfigurationen übernommen werden und Sie keine doppelte Arbeit vornehmen müssen. Sie sehen bereits diverse Browse-Tools im Workflow, die auch zur genaueren Betrachtung der Ergebnisse zwingend notwendig sind. Bitte halten Sie die obig dargestellte Reihenfolge unbedingt ein, da das TS-Forecast-Tool das ETS-Modell als Voraussetzung benötigt. Ein weiterer Faktor ist die Verwendung des O-Outputs. Alteryx verwendet diesen Output unter anderem zur Kommunikation zwischen den Tools. Platzieren Sie die Verbindungen also ausschließlich an diesem Ausgangskanal. Verwenden Sie im TS-Forecast-Tool als Prognose-Zeitraum erneut 14 Tage.
Nun haben wir alle benötigten Konfigurationen für unsere Prognose eingestellt, sodass endlich eine Betrachtung unserer Resultate möglich ist.
Der I-Output des TS-Forcast-Tools beinhaltet eine interaktive Grafik zur Betrachtung des historischen Verlaufs des Bitcoin sowie unserer erstellten Prognose. Es ist ein negativer Trend erkennbar, jedoch wird bereits durch die gestrichelten Linien (Konfidenzintervalle) die Unsicherheit der Prognose sichtbar. Wie sich bereits in der Geschichte des Bitcoin gezeigt hat, ist auch ein plötzliches Ansteigen möglich, wodurch diese Prognose nach wie vor nur als Beispiel zu interpretieren ist und keinerlei Aussage über die tatsächliche Kursentwicklung treffen kann.
Insofern wir von einer negativen Kursentwicklung ausgehen, so wird durch das TS-Plot-Tool ein negativer Trend für beide folgenden Wochen vorhergesagt. Bei der Entwicklung von Prognose-Modellen ist es ein stetiges Probieren, welches Modell die besten Schätzwerte liefern kann und auf welche Art sie spezifiziert werden können. Verwenden Sie mehr Variablen und erstellen Sie gerne Ihre eigenen Modelle anhand der bereits konfigurierten Tools von Alteryx.
Sie finden diesen Ansatz interessant und wollen Ihre eigenen Modelle schnell und unkompliziert in Alteryx entwickeln? Dann legen Sie gleich los und starten Sie jetzt mit Ihrer Testlizenz von Alteryx Designer: