Statistischer Vergleich mehrsprachiger und zeitabhängiger Sprachkorpora am Beispiel des Google Books Ngram Datensatzes

Aus SDQ-Institutsseminar
Version vom 11. Dezember 2017, 10:53 Uhr von Jens Willkomm (Diskussion | Beiträge) (Die Seite wurde neu angelegt: „{{Vortrag |vortragender=David Englert |email=EnglertD@gmx.de |vortragstyp=Bachelorarbeit |betreuer=Jens Willkomm |termin=Institutsseminar/2017-12-15 |kurzfassu…“)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Vortragende(r) David Englert
Vortragstyp Bachelorarbeit
Betreuer(in) Jens Willkomm
Termin Fr 15. Dezember 2017
Vortragsmodus
Kurzfassung Der Vergleich von zwei Sprachkorpora wird durch einen Homogenitätstest realisiert. Aufgrund der Verfügbarkeit vieler Sprachkorpora unterschiedlicher Sprachen als auch deren zeitlichen Entwicklung, ist diese Methode nicht mehr ausreichend.

Diese Arbeit beschäftigt sich damit unterschiedlich sprachige Korpora vergleichbar zu machen. Darüber hinaus werden erste Ansätze zum Vergleich zeitlicher Entwicklungen zwischen verschiedenen Sprachkorpora gegeben.