Das Bereinigen der Daten und das Herausziehen der Schlüsseldaten aus den Datenfeldern ist der wichtigste Schritt für eine erfolgreiche Datenanalyse und Visualisierung. Zeichenfolgen in Daten, die mehrere Informationseinheiten enthalten, z.B. die URL, sind einfacher zu analysieren, wenn jede einzelne Information im separaten Feld steht. Dafür bietet Tableau eine Option, die es ermöglicht, Zeichenfolgen aufzuteilen. Im Beispiel unten steht die Rechnungsnummer innerhalb der URL.
Die einfachste Methode ist die automatische Aufteilung, sodass Tableau das Teilungsmuster mithilfe interner Algorithmen erkennt. Rechter Mausklick auf die jeweilige Spalte führt sofort zu dieser Option. Dies funktioniert jedoch oft nicht wie gewünscht. Im Beispiel unten erkennt Tableau die Webdomäne erfolgreich, dies sind jedoch nicht die erforderlichen Schlüsselinformationen.
Die andere Möglichkeit ist Benutzerdefiniertes Teilen, wenn der Vorgang gestartet wird, öffnet sich die Dialogbox, in der Trennzeichen und Anzahl der Spalten definiert werden soll. Das erweitert die für den Benutzer verfügbaren Funktionen, aber liefert auch manchmal extra Spalten, die im nächsten Schritt ausgeblendet oder entfernt werden sollten.
Die Optionen, die das Teilen der Spalten ermöglichen und in Tableau standardmäßig verfügbar sind, sind eigentlich SPLIT-Funktionen. SPLIT-Funktionen können als Berechnung nach Wünschen des Benutzers erstellt werden. Im berechneten Feld besteht die Möglichkeit es zu definieren, welche Felder nach dem Teilen beibehalten werden. Der Nachteil ist, dass Benutzer bereits fortgeschrittene Tableau-Kenntnisse haben sollten, um diese Funktionen selbst eingeben zu können. Im Beispiel unten wurde nur ein bestimmter Schrägstrich als Trennzeichen definiert, und die TRIM-Funktion bedeutet, dass die Zeichenfolgen vor und nach den definierten Eingaben entfernt werden.
SPLIT-Funktionen können auch in benutzerdefinierten Verknüpfungen verwendet werden. Im unteren Beispiel wird die Rechnungsnummer aus der URL als Verknüpfungsmuster verwendet. Die UPPER-Funktion ist hier erforderlich, weil die Groß- und Kleinschreibung bei Tableau eine Rolle spielt.
Dieser Blogbeitrag ist Teil meiner Vorbereitung auf die Tableau Associate-Zertifizierung. Das Analytics Academy-Programm ist fast abgeschlossen und ich freue mich und bin gespannt auf zukünftige Placements.