Trend Monitoring on Twitter Streams with Semantic Change Analysis

Aus SDQ-Institutsseminar
Version vom 12. Juni 2018, 10:16 Uhr von Adrian Englhardt (Diskussion | Beiträge) (Die Seite wurde neu angelegt: „{{Vortrag |vortragender=Florian Hennerich |email=florian.hennerich@student.kit.edu |vortragstyp=Proposal |betreuer=Adrian Englhardt |termin=Institutsseminar/20…“)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Vortragende(r) Florian Hennerich
Vortragstyp Proposal
Betreuer(in) Adrian Englhardt
Termin Fr 15. Juni 2018
Vortragssprache
Vortragsmodus
Kurzfassung Die natürliche Sprache befindet sich in ständigem Wandel. Mittels Semantic Change Analysis kann eine Änderung der Bedeutung von Wörtern zwischen Zeitpunkten festgestellt werden. Herkömmliche Semantic Change Detection Systeme arbeiten nur auf statischen Korpora. Durch Social Media wird es jedoch ermöglicht Sprache in Echtzeit zu analysieren. Bisherige Ansätze sind jedoch nicht dafür geeignet auf einem Textstrom zu arbeiten. In dieser Masterarbeit soll deshalb ein Echtzeitsystem zur Verarbeitung von Textströmen entworfen werden, welches frühzeitig die Änderung einer Wortbedeutung aufzeigt. Grundlage hierfür ist die Nutzung und Anpassung geeigneter Einbettung von Wörtern, die zum einen gute Vektoren liefern und zum anderen trotz Begrenzung der Laufzeit und des Speichers den Textstrom gut repräsentieren. Des Weiteren muss das System einen geeigneten Change Detection Algorithmus umfassen. Zur Evaluation soll ein synthetischer Korpus generiert werden, um die verschiedenen Methoden vergleichen zu können. Anschließend soll eine explorative Untersuchung auf Echtweltdaten durchgeführt werden.