„Daten sind das neue Öl“ heißt es in der heutigen Zeit. Doch was bedeutet das genau? Daten bieten einen Reichtum an Informationen – wenn man nur weiß, wie man daran gelangen kann. Sie stehen also vor einer reinen Flut von Daten und wissen, dass Sie darin alle Antworten finden – sowohl auf Fragen, die Sie bereits kennen, als auch auf Fragen, die Sie sich so vielleicht noch nie gestellt haben. Aber wie gelangen Sie an diese Antworten? Gibt es einen Weg, in diesen riesigen Datenströmen unerwartete Phänomene zu erkennen? Wie können Sie eventuell auftretende Krisensituationen erkennen und auf Basis Ihrer Daten zur nötigen Entscheidungsfindung befähigt werden? Die Antwort: Visual Analytics.
Visual Analytics – was ist das?
Visual Analytics nutzt die Fähigkeit des Menschen, Muster und Trends in Sekundenschnelle visuell zu erfassen, und verbindet sie mit den Stärken der automatischen Datenanalyse. So entsteht unter der Anwendung von Visual Analytics ein Prozess, der von der Vorverarbeitung der Daten hin zu ihrer Visualisierung für den Benutzer führt, um sie interaktiv zu erkunden. Erkenntnisse führen hierbei zu neuen Fragen, welche eine weitere Analyse erfordern, in deren Visualisierung wieder neue Antworten und Fragen auftreten. Somit wird ein Dialog angestoßen zwischen der Analyse und der Visualisierung der Daten.
Visual Analytics – die Antwort auf Ihre Fragen
Wie genau funktioniert dieser Kreislauf in Visual Analytics?
Am Anfang einer jeden Datenexploration steht eine Frage. Diese kann sehr offen formuliert sein – welche Erkenntnisse können mir meine Daten bieten? – oder bereits sehr gezielt auf bestimmte Antworten abzielen: wieso verzeichnet eine meiner umsatzstärksten Produktlinien in einem bestimmten Vertriebsgebiet so hohe Verluste?
Um diese Frage zu beantworten, zieht man die dazugehörigen Daten zurate. Welche Daten hierbei als „dazugehörig“ zu bewerten sind, mag nicht immer offensichtlich sein. So mag beispielsweise die Verspätungsquote eines Flugunternehmens nicht nur auf die Zeitdaten der Flüge zurückzuführen sein, sondern man sollte auch die Wetterdaten des betrachteten Zeitraums auswerten, um mögliche Zusammenhänge aufzudecken.
Sind die Daten zusammengetragen, visualisiert man sie. Dabei greifen sowohl die wissenschaftliche Visualisierung von Daten mit einer natürlichen geometrischen Struktur (wie Windkanäle, Magnetströme) als auch die Informationsvisualisierung von abstrakten Datenstrukturen. Weiterhin zielen Visual Analytics auf eine interaktive Komponente ab, die dem Konsumenten der Visualisierung erlaubt, tiefere Erkenntnisse zu gewinnen, indem er beispielsweise Aspekte der Darstellung selektieren, filtern sowie hoch- und herunterdrillen kann.
Diese Interaktion sollte so angelegt sein, dass die ursprüngliche Frage der Konsumenten damit beantwortet werden kann. Im besten Fall führt diese Antwort jedoch zu weiteren Fragen, da die interaktive Visualisierung nicht nur starr eine Antwort ausgibt, sondern tiefere Einblicke ermöglicht und somit mehrschichtige Informationen bietet, welche Denkansätze, Fragen und Hypothesen aufwerfen, welche zuvor nicht präsent waren.
Diese Denkansätze stoßen den Prozess erneut an: nachdem die relevanten Datenquellen identifiziert sind, werden sie analysiert und visuell aufbereitet, um dem Konsumenten eine Beantwortung seiner Frage bzw. eine Überprüfung seiner Hypothese zu ermöglichen. Im Laufe dieser Interaktion werden nicht nur existierende Fragestellungen beantwortet, sondern wiederum neue untersuchungswürdige Thematiken aufgedeckt. In diesem Dialog von Fragen, Antworten und Folgefragen werden Sie mit Visual Analytics zu Informationen gelangen, nach denen Sie zuvor womöglich nie zu fragen gedacht haben.
Augenmaß vs. exakte Zahlen?
Visualisierungen mögen nicht so präzise sein wie statistische Methoden, aber sie erlauben uns einen einzigartigen Einblick in unsere Daten. So können wir bemerkenswerte Strukturen aufdecken, die mit einem oberflächlichen Blick auf die Zusammenfassung durch statistische Werte nicht aufgefallen wären.
Muster hinterfragen statt sich mit Zusammenfassungen zufriedengeben
Schon im Jahr 1973 zeigte Francis J. Anscombe, dass numerische Kalkulationen nicht zwangsläufig exakter sein müssen als Graphen, wenn es darum geht, ein passendes Modell zu finden. Er präsentierte vier Datensätze, welche über identische statistische Eigenschaften verfügen und daher auf den ersten Blick als ebenfalls identisch angenommen werden könnten. Sowohl die Mittelwerte der Variablen als auch die Varianz, Korrelation und die lineare Regression weisen nahezu identische Werte auf.
Wenn man diese Werte jedoch plottet, zeigt sich plötzlich ein völlig anderes Bild. Datensätzen I und III scheint mit dem linearen Modell gut gedient zu sein, allerdings wird dies im dritten Datensatz durch einen Ausreißer völlig verzerrt. Eine lineare Regression ist für Datensatz II völlig abwegig, und Datensatz IV beugt sich auf den ersten Blick keinem traditionellen Modell, sondern weist – abgesehen von dem einen Ausreißer – eine Konstante für x auf.
So beweist Anscombe mit seinem Quartett, dass ein Blick auf die einzelnen Datenpunkte ein sehr viel informativeres Bild zeichnen kann als nur eine Betrachtung der Aggregation auf höherer Ebene. Dabei weist er exakte Berechnungen jedoch nicht völlig von der Hand, sondern betont, dass ein tiefes Verständnis der Daten stets nur durch eine Untersuchung sowohl der Berechnung als auch der Visualisierung erlangt werden kann.
Warum Visual Analytics?
Computer erleichtern das Leben durch eine Vielzahl komplexer Berechnungen in Sekundenschnelle. Mittlerweile verlassen wir uns so sehr auf die Rechenkraft digitaler Maschinen um uns herum, dass die Fähigkeiten des bloßen menschlichen Auges darüber vergessen werden.
Visuelle Wahrnehmung kann nicht nur den „Arbeitsspeicher“ des menschlichen Gehirns erweitern, sondern kann Muster in einer riesigen Anzahl von Datenpunkten auf engem Raum erkennen. Somit kann das menschliche Auge Beziehungen zwischen Werten einfach wahrnehmen, die rechnerisch nur schwierig herzuleiten sind, kann eine Vielzahl von potenziellen Ereignissen überblicken und kann Modelle und Mittelwerte abschätzen, während Ausreißer dynamisch abgewogen und in dieser rein optischen Analyse einbezogen oder verworfen werden.
Werden Sie aus Ihren Daten klug
Wir bei The Information Lab haben es uns zur Mission gemacht, Ihnen bei der visuellen Analyse Ihrer Daten zu helfen, damit Sie tiefergreifende Erkenntnisse aus Ihrem Reichtum an Daten ziehen und so an entscheidungstreibende Informationen gelangen können. Dieses Ziel haben wir zu unserem Leitspruch gemacht: Helping people make sense of data.
Lernen Sie von uns, mehr aus Ihren Daten zu machen – zum Beispiel bei unseren Seminaren zu Datenanalyse oder zur konzeptionellen Datenvisualisierung: