Themenextraktion zur Domänenauswahl für Programmierung in natürlicher Sprache: Unterschied zwischen den Versionen

Aus SDQ-Institutsseminar
(Die Seite wurde neu angelegt: „{{Vortrag |vortragender=Jan Keim |email=jan.keim@student.kit.edu |vortragstyp=Masterarbeit |betreuer=Sebastian Weigelt |termin=Institutsseminar/2018-03-16 |kur…“)
 
Keine Bearbeitungszusammenfassung
 
Zeile 5: Zeile 5:
|betreuer=Sebastian Weigelt
|betreuer=Sebastian Weigelt
|termin=Institutsseminar/2018-03-16
|termin=Institutsseminar/2018-03-16
|kurzfassung=TODO
|kurzfassung=Für den Menschen sind Kontexte von Anweisungen für die Programmierung in natürlicher Sprache einfach ersichtlich, für den Rechner ist dies nicht der Fall.
Eine Art des Kontextwissens ist das Verständnis der Themen.
Hierfür wird im Rahmen des PARSE-Projekts zur Programmierung in natürlicher Sprache ein Ansatz zur Themenextraktion vorgestellt.
Dafür wird eine Auflösung von mehrdeutigen Nomen benötigt, weshalb in dieser Arbeit ebenfalls ein Werkzeug dafür entwickelt wurde.
Als einen Anwendungsfall für die extrahierten Themen wird die Auswahl von passenden Ontologien angegangen.
Durch diese Auswahl wird ermöglicht, statt einer großen Ontologie mehrere kleine domänenspezifische Ontologien einzusetzen.
Für die Evaluation der Themenextraktion wurde eine Umfrage durchgeführt, die ergab, dass das erste extrahierte Thema in bis zu 63,6% der Fälle treffend war.
In 91% der Fälle ist mindestens eines der ersten vier extrahierten Themen passend.
Die Evaluation der Ontologieauswahl ergab ein F1-Maß von 90,67% und ein F2-Maß von 89,94%.
}}
}}

Aktuelle Version vom 7. März 2018, 14:25 Uhr

Vortragende(r) Jan Keim
Vortragstyp Masterarbeit
Betreuer(in) Sebastian Weigelt
Termin Fr 16. März 2018
Vortragsmodus
Kurzfassung Für den Menschen sind Kontexte von Anweisungen für die Programmierung in natürlicher Sprache einfach ersichtlich, für den Rechner ist dies nicht der Fall.

Eine Art des Kontextwissens ist das Verständnis der Themen. Hierfür wird im Rahmen des PARSE-Projekts zur Programmierung in natürlicher Sprache ein Ansatz zur Themenextraktion vorgestellt. Dafür wird eine Auflösung von mehrdeutigen Nomen benötigt, weshalb in dieser Arbeit ebenfalls ein Werkzeug dafür entwickelt wurde. Als einen Anwendungsfall für die extrahierten Themen wird die Auswahl von passenden Ontologien angegangen. Durch diese Auswahl wird ermöglicht, statt einer großen Ontologie mehrere kleine domänenspezifische Ontologien einzusetzen. Für die Evaluation der Themenextraktion wurde eine Umfrage durchgeführt, die ergab, dass das erste extrahierte Thema in bis zu 63,6% der Fälle treffend war. In 91% der Fälle ist mindestens eines der ersten vier extrahierten Themen passend. Die Evaluation der Ontologieauswahl ergab ein F1-Maß von 90,67% und ein F2-Maß von 89,94%.