WahlRausch.de - Die täglich Interpretation der Stimmung der Nation während der Bundestagswahl 2013
Experimentelle Social Media Analyse in Echtzeit
Messung von spontanen Resonanzen auf politische Themen und mehr

 


Die Social Media Sentiment Analyse

Unsere Philosophie



Wahlrausch hat sich zur Aufgabe gemacht, die Entscheidung der Bundestagswahl 2013 vorwegzunehmen. Hierzu setzten wir eine eigenentwickelte Software ein, die bis in die niedersten Eben des Web2.0 eintaucht und die Meinungen von Wahlberechtigten analysiert. Die eingesetzte Software ist universell einsetzbar: Bei Wahlrausch handelt es sich um eine erste großflächige und experimentelle Test-Anwendung, die auf die aktuelle politischen Situation in Deutschland ausgerichtet wurde.
Im Web 2.0 vorliegende Informationen lassen sich in zwei grundlegende Kategorien einordnen: Fakten und Meinungen. Während Fakten objektive Aussagen über eine andere Person, ein Objekt oder einen Prozess sind, stellen Meinungen subjektive, spontane und häufig emotionsbasierte Aussagen dar. Zu diesen gehören auch Sentiments, die auch als »Semantic Orientations« bezeichnet werden. Es handelt sich hierbei um eine Stimmung, eine Empfindung oder eine auf einer Emotion basierende individuelle Meinung, die subjektiv geprägt ist. Diese Meinung kann ein individuelles Stimmungsbild über ein Unternehmen, ein Produkt oder eine bestimmte Dienstleistung ausdrücken. Dabei drückt dieses Sentiment eine Grundstimmung aus, die sich auch innerhalb den drei Kategorien »positiv«, »negativ« und »neutral« skalieren lässt.
Sentiment-Analyse bezeichnet nicht eine gesonderte Technologie, sondern impliziert vielmehr unterschiedliche Modelle und Verfahren aus verschiedenen Bereichen, wie dem Information Retrieval, der Informationslinguistik (Natural Language Processing), des Machine Learning und des Data Mining.
Die bei Wahlrausch eingesetzte Technik des maschinellen Lernens verlässt sich auf die Fähigkeit eines Computers, die Sprache, die für das Ausdrücken von Stimmungen verwendet wird, automatisch zu lernen, unabhängig davon, wie „gut“ oder „normal“ diese Sprache ist.
Um dies zu erreichen müssen intensiver Vorbereitungen getroffen werden. Die Maschine braucht Daten, von denen sie lernen kann (auch Trainingskorpus genannt), und bei der Sentimentanalyse bestehen diese Daten aus einer Reihe von Beispielen, die durch die Entwickler von Wahlrausch vorgegeben wurden. Je mehr Beispiele der Maschine zum Lernen vorliegen, desto besser – tausende Beispiele sind besser als Hunderte.
Sobald die Maschine die Beispiele gelernt hat, kann sie das erworbene Wissen auf neue, bisher nicht gelesene Dokumente anwenden und diese in Stimmungskategorien einteilen. Doch auch diese Technologie ist nicht perfekt. Das Problem liegt hier in der Themenabhängigkeit beziehungsweise themenspezifischer Wortbedeutungen und Wertigkeiten: Wenn eine Maschine mit einem Korpus aus Filmkritiken trainiert wurde, wird sie in Bezug auf Automobilbewertungen eher ungenaue Ergebnisse abliefern. Das heißt, man muss die Maschine für alle Themenbereiche trainieren, in denen sie zum Einsatz kommen soll.
Wahlrausch setzt einen hochentwickelten Korpus für die Analyse der politischen Arena ein und liefert daher bisher unerreichte Ergebnisse.
Natürlich lässt sich dieses Verfahren auf jede andere Anwendung adaptieren, wie z.B. Produktwelten, Unternehmen oder Dienstleistungen. Zahlreiche themenspezifische Korpora sind bereits vorhanden. Lösungen für Spezialanwendungen können durch unsere Entwicklungsabteilung in kurzer Zeit realisiert werden.


Unsere Social Media Datenbasis

Unsere Social Media Analysen bewerten themenbezogene Äußerungen von Internet-Usern auf allen öffentlich zugängigen Plattformen:

1 - Online Publikationen
Unsere Systeme scannen zahlreiche Online-Publikationen wie beispielsweise bild.de oder spiegel.de nach themenbezogenen Artikeln und beobachten die jeweiligen Benutzer-Kommentare.

2 - Twitter
Unsere Systeme erfassen themenbezogene Twitter Tweats.

3 - Foren
Unsere Systeme können themenbezogene Beiträge in sogenannten Internet-Foren und Micro-Blogs semantisch auswerten und monitoren. Allerdings zeigen unsere Erfahrungen, daß diese Meinungen nicht repräsentativ sind. In sehr vielen Foren besteht ein "Rollenspiel" diverser Alter-Egos, die einem virtuellen Profilierungsdrang folgen. Als extremes Beispiel konnten wir sogenannte "Multiplikatoren" und "Opion-Maker" identifizieren, die unter verschiedenen Profilen mit sich selbst intensiv diskutierten. Dieser offensichtliche Geltungsdrang ist vorrangig auf Plattformen zu finden, auf welchen die User zu Cliquenbildung neigen und die häufig von einem festen Stammkreis von Usern besucht werden.

4 - Online Shops
Unsere Systeme können Kundenrezensionen maschinell sammeln und auswerten, wie beispielsweise auf Amazon oder Ebay. Dadurch entsteht die Möglichkeit Produktschwächen (im Design, der Produktion oder sonst wo im Downstream) frühzeitig zu erkennen.

5 - YouTube
Unsere Systeme sind in der Lage Kommentare zu YouTube Veröffentlichungen zu erkennen und zu analysieren. Hierdurch ergibt sich die beispielsweise die Möglichkeit, Kundenreflexionen auf neu geschaltete Werbekampagnen zu erfassen und auszuwerten.

6 - FaceBook und Co
Selbstverständlich können wir auch Facebook "Likes" und "Followers" erfassen. Da man mittlerweise sowohl Likes als auch Followers im 50.000er Paketen in EBay ersteigern kann, halten wir FaceBook Analysenergebnisse für fragwürdig.

6 - Pinterest, Tumblr etc
Auf diesen Media-Blogs können wir quantitative Messungen durchführen. Eine semantische Spracherkennung ist aufgrund sehr rarer Kommentare nicht sinnvoll.



Unsere tagesaktuellen Social Media Analysen zur Wahl 2013: