Die Alteryx Intelligence Suite (AIS) wurde am 16. Juni 2020 per Pressemitteilung veröffentlicht, parallel zum Alteryx Analytics Hub und der Version 2020.2. Eine Übersicht zu den wichtigen Neuerungen in der letzten Zeit finden Sie hier.
Was ist die Alteryx Intelligence Suite?
Die Intelligence Suite ist ein kostenpflichtiges Add-on für den Alteryx Designer und kann ab der Version 2020.2 genutzt werden. Mit den Funktionalitäten der AIS werden Themen wie Text-Mining, Dokumentenanalyse, statistische Modellierung und Machine Learning für einen großen Nutzerkreis zugänglich gemacht. Durch einfach konfigurierbare Tools sowie eine geführte Anleitung für die Modellerstellung können auch Mitarbeiter ohne tiefe Programmierkenntnisse in diese Bereiche der Data Science vordringen und Insights generieren.
Was macht Text Mining?
Einer der beiden Schwerpunkte der Intelligence Suite ist das Text Mining – die Extraktion von Informationen aus Texten und deren Analyse. Dabei lässt sich die Funktionalität in 3 Bereiche einteilen:
- Automatisierte Texterkennung und -Exktraktion aus Bildern und PDFs
- Topic-Modeling: Erkennen Sie, über welche Themen Personen in Dokumenten oder Chats sprechen
- Sentiment-Analyse: Sind Statements positiv oder negativ meinem Unternehmen gegenüber? Welche Meinung hat die Aussage einer oder vieler Personen?
Die Anwendungsfälle sind vielfältig. Gerade mit der automatisierten Texterkennung ergeben sich viele Möglichkeiten: Sie könnten Rechnungen automatisiert einpflegen, Textinformationen aus Fotos und anderen Bildern extrahieren, Verträge oder andere Dokumente digitalisieren und auswerten und vieles mehr. Benutzt werden im Designer dafür die Text Mining Tools.
Im unteren Beispiel wurden die interessanten Stellen in einer standardisierten PDF-Vorlage markiert (die roten Stellen im linken Fenster). Das geht sehr einfach per Klick. Diese Vorlage soll auf weitere PDFs angewendet werden, die mithilfe eines zweiten Tools eingelesen werden. Um die Vorlage auch zu verwenden, wird ein drittes Tool hinzugefügt, das diese beiden Schritte zusammenführt. Als Output kann man in diesem Fall die korrekt eingelesenen Informationen für die jeweiligen Felder sehen, die dann wie ganz normale Daten weiterverwendet werden können.
Tipp: Nutzen Sie die Caching-Funktion von Alteryx! Der Input und das Auslesen der PDFs dauern etwas länger als bei anderen Datenquellen.
Was ist Assisted Modeling?
Der zweite Schwerpunkt der Intelligence Suite ist es, Predictive Analytics und Machine Learning einem größeren Nutzerkreis zu öffnen. Bisher bestanden die Möglichkeiten in Alteryx darin, verschiedene Tools per Drag & Drop zu nutzen oder mithilfe der R- und Python-Integration eigene Modelle einzubinden. Das setzt trotz der vergleichsweise einfachen Nutzung einiges an Vorwissen voraus, damit am Ende valide Modelle verwendet werden. Diese Lücke schließt Alteryx mithilfe des „Assisted Modeling“. Hier wird es auch für Endanwender ohne Programmierkenntnisse und Erfahrung im statistischen Modellieren möglich, mithilfe einer geführten und kommentierten Schritt-für-Schritt-Anleitung selbst Modelle zu erstellen. Auch die Güte der Modelle kann anhand verschiedener Kennzahlen beurteilt werden. Im Designer gibt es dafür die neuen Machine Learning Tools:
Die Benutzung ist denkbar einfach: Man hängt das Assisted Modeling Tool an den vorhandenen Datenstrom an. Dann muss der Workflow einmal ausgeführt werden, um das Tool mit den Daten zu „befüllen“. Anschließend kann man eine interaktive GUI aufrufen, in der man durch die einzelnen Schritte der Modellierung geführt wird.
Nacheinander wird man durch folgende Schritte geführt und kann dort Konfigurationen vornehmen:
- Festlegen der Zielvariable
- Festlegen von Datentypen
- Umgang mit fehlenden Werten
- Auswahl geeigneter Einflussvariablen
- Auswahl eines oder mehrerer Algorithmen
Alteryx liefert dabei auf jede Frage bereits einen Antwortvorschlag, erlaubt dem Nutzer aber jederzeit einzugreifen und unterstützt mit vielen hilfreichen Erklärungen z. B. zur Funktionsweise einzelner Algorithmen oder zur Interpretation bestimmter Fehlermaße. Als Resultat wird automatisch eine Kette aus verschiedenen Machine Learning Tools in den Workflow eingefügt, die die zuvor definierten Schritte tatsächlich implementieren und am Ende das trainierte Modell ausgeben. Dieser Teil-Workflow kann wiederverwendet oder im Nachgang einfach angepasst und neu trainiert werden. Das Modell wird anschließend auf einen Strom mit neuen Daten angewendet werden, um so Vorhersagen treffen zu können.
Natürlich ersetzt auch das Assisted Modeling nicht den kompletten Analysten. Das Generieren von Businessfragen und Hypothesen sowie das Sicherstellen von logischen und inhaltlichen Bedingungen sind immer noch Teil der Analysten-Arbeit. Diese Arbeit wird durch die einfach zu bedienende Konfiguration aber erheblich beschleunigt und senkt die Einstiegsschwelle in den Bereich Predictive Analytics / Machine Learning. Der Workflow-Ersteller kann sich damit stärker auf inhaltliche Themen sowie die Analyse der Outputs fokussieren, anstatt in einem mühsamen manuellen Prozess selbst Modelle zu entwickeln.
Gegenwärtig unterstützt die Intelligence Suite nur einen Teil der Algorithmen, die bisher schon aus den R-basierten Predictive Tools bekannt sind. Neuronale Netze oder Time-Series-Modelle sind zum Beispiel noch nicht enthalten. Damit kann aber grundsätzlich eine ähnliche Bandbreite an Fragestellungen beantwortet werden, und ich erwarte, dass die Funktionalitäten hier nach und nach erweitert werden. Falls Sie die Intelligence Suite testen möchten oder wissen wollen, ob sie für Ihre Use Cases und Nutzer geeignet ist, sprechen Sie uns gerne an.