LLM-supported processing of analysis results to support the legal domain

Aus SDQ-Wiki
Ausschreibung (Liste aller Ausschreibungen)
Typ Bachelorarbeit
Aushang Aushang Abschlussarbeit NatürlichsprachigeAnalyseergebnisse (1).pdf
Betreuer Wenden Sie sich bei Interesse oder Fragen bitte an:

Nicolas Boltz (E-Mail: nicolas.boltz@kit.edu, Telefon: +49-721-608-45997), Tobias Hey (E-Mail: hey@kit.edu, Telefon: +49-721-608-44765)

German

Die zunehmende Digitalisierung führt dazu, dass moderne Softwaresysteme heute in zahlreichen Bereichen des täglichen Lebens eingesetzt werden. Für ihre Entwicklung müssen daher auch unterschiedliche Fachgebiete und Domänen zusammenarbeiten, darunter nicht nur verschiedene Teilbereiche der Informatik, sondern auch angrenzende und fachfremde Bereiche. Dazu zählen unter anderem Rechtsexperten, die sicherstellen sollen, dass Anforderungen wie Datenschutz und andere regulatorische Vorgaben eingehalten werden. Zur Unterstützung der Systementwicklung existieren Methoden für die automatische Analyse von Entwurfsmodellen, die potenzielle Schwachstellen im Hinblick auf Sicherheit und Privatsphäre aufzeigen können. Die Ergebnisse solcher Analysen sind jedoch in der Regel stark technisch geprägt und daher für Fachpersonen außerhalb der Informatik nur schwer zugänglich. Für die Rechtsdomäne ergibt sich daraus die Herausforderung, dass Analyseergebnisse so dargestellt werden müssen, dass sie mit den dort vorhandenen Begriffen und Vorstellungen vom System in Einklang stehen.

Aufgabenstellung

Die Arbeit enthält einen technischen und empirischen Teil.

  • Entwerfen und Implementieren eines LLM-basierten Ansatzes, der Ergebnisse einer bestehenden DFD-basierten Designzeit-Datenschutzanalyse für die Rechtsdomäne aufbereitet.
  • Konzipieren und Durchführen einer Nutzerstudie, die drei Darstellungen der Ergebnisse untersucht und vergleicht: (a) Originalausgabe der Analyse, (b) existierender Template-basierter Ansatz, (c) selbst implementierter LLM-basierter Ansatz.

English

Increasing digitalization means that modern software systems are now used in numerous areas of everyday life. Different specialist areas and domains must therefore work together to develop them, including not only different areas of IT, but also related and non-specialist areas. These include legal experts who are tasked with ensuring that requirements such as data protection and other regulatory requirements are met. To support system development, there are methods for automatically analyzing design models that can identify potential vulnerabilities in terms of security and privacy. However, the results of such analyses are usually highly technical in nature and therefore difficult to access for specialists outside the field of IT. For the legal domain, this poses the challenge that analysis results must be presented in such a way that they are consistent with the existing concepts and ideas of the system.

Task Description

The work contains a technical and an empirical part.

  • Designing and implementing an LLM-based approach that prepares results of an existing DFD-based design-time privacy analysis for the legal domain.
  • Design and conduct a user study that examines and compares three representations of the results: (a) original output of the analysis, (b) existing template-based approach, (c) self-implemented LLM-based approach.