Project Description
Datenauswertung für digitale Kommunikationskanäle wie Twitter, ist ein kompliziertes Themenfeld. Kaum vollständige Sätze, Abkürzungen und auch menschliche Züge wie Ironie oder Witz machen dem Computer zu schaffen. Ein bekannter Datenanalyst sagte aber mal sinngemäß:
Ein einfacher Algorithmus auf viele Daten angewendet ist in jedem Fall einem ausgefeilten Algorithmus auf wenig Daten angewendet, vorzuziehen.
oder in Kurzform:
Mo’ Data, Mo’ Better! – Peter Norvig
Daten fallen vor allem in sozialen Netzwerken wie Twitter an, wenn sich Menschen über ein Thema austauschen. Mit Hilfe von Maschine Learning Algorithmen, kann aus den Aussagen sogar ein Stimmungsbild abgeleitet werden, wie am Beispiel des Tatort gezeigt ist:

Stimmung auf Basis einer Sentiment Analyse der Tweets
Dabei wird ein positiver und negativer Wortschatz zum Anlernen genutzt und anschließend können die Tweets automatisch klassifiziert werden.
Handelnde Personen (bzw. Namen) können aus dem Stream extrahiert werden. Dabei steht ebenfalls eine Datenbasis mit typischen Namen als Grundlage bereit.