• pexels-markus-spiske-2004161.
        • Software Solutions

          Wir helfen Ihnen bei der Auswahl 
          der richtigen Lösungen, um die 
          Kraft Ihrer Daten freizusetzen.
        • Tableau
        • Das weltweit leistungsstärkste Tool zur Datenvisualisierung und -analyse.

        • Alteryx
        • Die führende Plattform in der
          dynamischen Welt der Analytic
          Process Automation.

        • Snowflake
        • Für Cloud-basierte Data-Warehouse-Lösungen der nächsten Stufe.

        • Process Mining aus Deutschland. Verschaffen Sie sich ein objektives und datengetriebenes Bild Ihrer internen Prozesse. Ganz im Sinne der optimierten  Wertschöpfung.

        • Amazon Web Services (AWS)
        • Führend bei Cloud-First-Datenlösungen.

  • Use Cases
  • The Data School
        • WIBI 2024_Vortragsraum
        • UP TO DATA

          Bleiben Sie auf dem Laufenden mit den neuesten Entwicklungen und Ereignissen aus der Welt der Daten – von aktuellen News bis hin zu spannenden Data Events.

        • Data News
        • Informieren Sie sich über neue Nachrichten, Trends und Einblicke aus der Welt der Daten – alles Wichtige kompakt in unseren Daten News. Melden Sie sich direkt bei unserem Newsletter an und bekommen alles Wissenswerte einmal im Monat zugeschickt.

        • Newsletter
        • Jeden Monat senden wir Ihnen eine Email mit den neuesten Informationen zu einer zeitgemäßen Analysekultur, Visual Analytics, Seminaren, Events und Tipps & Tricks.

        • Data Events
        • Entdecken Sie bei uns komprimiert spannende Data Events und erfahren Sie alles über kommende Branchen-Events, Konferenzen und Webinare rund um das Thema Daten mit Tableau und Alteryx.

        • Sommerfest 2024 - The Information Lab
        • Über Uns

          Lernen Sie The Information Lab kennen, unser Team, unsere Kunden und erfahren Sie, wie auch Sie ein Teil davon werden können.

          Mehr erfahren

        • Centre of Excellence
        • Geteiltes Wissen ist Macht – vernetzen Sie sich mit unserer wachsenden Zahl von Beratern und Kunden in ganz Europa. Zusammenarbeit ist der beste Weg zu lernen.

        • Kunden
        • Wir unterstützen seit 2014 namhafte Unternehmen in der DACH-Region und im deutschen Mittelstand.

        • Internationales Setup
        • The Information Lab ist an 8 europäischen Standorten mit über 600 Consultants aktiv. Unsere Data School gibt es bereits in London, Sydney und Hamburg.

        • FAQ
        • Häufig gestellte Fragen über uns, unsere Produkte u.v.m.

        • Team
        • Lernen Sie die Menschen hinter The Information Lab kennen.

        • Karriere
        • Join our team! Wir wachsen stetig und suchen insbesondere im Consulting und unserer Data School stets tolle Kollegen und Kolleginnen.

Banner background image - news

Viz Woche Tag 4 – Sentiment-Analyse der Zeitungsberichte

Das Analysieren von Zeitungsberichten kann gleichzeitig sehr komplex und spannend sein.  Es gibt etliche Methoden, um diese Texte zu analysieren. Eine davon ist die Sentiment-Analyse. Diese wird sehr häufig für die Analyse kleinerer Texte wie z.B. Produktbewertungen eingesetzt. Heute, am letzten Tag unserer Dashboard-Woche, hatten wir uns mit einem solchen Datensatz beschäftigt. Wir sollten die Berichte von der Zeitungswebseite taz für einen bestimmten Autor analysieren. Ich habe dafür die Sentiment-Analyse gewählt.

Viele Wörter werden als zwei Emotionen klassifiziert: Positiv und Negativ. Ich habe diese Wortliste aus Kaggle heruntergeladen und sie für meine Analyse verwendet. Insgesamt hat der Autor 23 Berichte veröffentlicht. Die Wörter der einzelnen Berichte wurden dann mit dieser Wortliste verglichen und die Berichte wurden als positiv oder negativ klassifiziert. Meiner Analyse zufolge kann man 14 der Berichte einer positiven Emotion zuordnen. Welche Faktoren könnten die Emotion des Autors beeinflusst haben? Die Faktoren, die die Emotionen des Autors beeinflusst haben könnten, sind:

  • Ob der Umfang der Berichte in Bezug auf die Anzahl der Wörter eine Rolle spielt.
  • Der Ressort der Berichte.
  • Die Jahreszeit, in der der Artikel geschrieben wurde.

In meinem Dashboard habe ich versucht diese Frage mit drei Diagramme zu beantworten. Das erste ist das Balkendiagram, in dem ich alle Berichte nach der Anzahl der Wörter sortiert habe. Aus diesem Diagramm konnte ich keine sinnvolle Information erfassen. Der Autor hat Berichte veröffentlicht, die sehr ähnliche Anzahl von Wörtern und zu beiden Emotionen gehören. Beide Emotionsklassen weisen sowohl längere Texte als auch kürzere Texte auf. Anschließend habe ich versucht die zweite Frage mit einem weiteren Balkendiagramm zu beantworten. Der Autor hat seine Berichte nur für zwei Ressorts veröffentlicht, nämlich Kultur und Sport. In dem Ressort-Sport hat er nur einen Bericht, der der positiven Kategorie angehört. In dem Kultur-Ressort gibt es 13 Berichte, die der positiven Klasse zuteilbar sind. Das reicht nicht aus, um eine Entscheidung zu treffen. Durch die Erstellung des Liniendiagramms habe ich versucht die dritte Frage zu beantworten. Hier sieht man, dass die Tendenzen zwischen den zwei Emotionen sehr ähnlich sind.

Sentiment-Analyse ist ein sehr interessantes Thema. Durch diese Analyse habe ich das Wissen in diesem Bereich erworben, die ich in der Zukunft gebrauchen könnte.

 

image-6.