Semantische Suche

Donnerstag, 20. Februar 2025, 11:30 Uhr

iCal (Download)
Ort: Raum 333 (Gebäude 50.34)

Vortragende(r) Adrian Freund
Titel Metamodeling with JSON
Vortragstyp Masterarbeit
Betreuer(in) Thomas Weber
Vortragssprache Deutsch
Vortragsmodus in Präsenz
Kurzfassung Model Driven Software Development (MDSD) is a set of software development techniques that aims to increase productivity, quality and reusability by promoting models to primary development artifacts. In practice, MDSD is often realized using the Eclipse Modeling Framework (EMF). The Eclipse Modeling Framework depends on the Eclipse platform and persists models as XML, which doesn't scale well with very large models. We developed extensions for the JSON-Schema document format that allow JSON and JSON-Schema to be used for MDSD. We also developed a transformation from EMF models to JSON-Schema documents, as well as Kotlin code generation from JSON-Schema documents based on this extended JSON-Schema to lessen the dependency on the Eclipse platform when using an MDSD approach.
Vortragende(r) Matthias Lüthy
Titel Modellierung von Angriffen für quantitative Sicherheitsanalysen
Vortragstyp Masterarbeit
Betreuer(in) Frederik Reiche
Vortragssprache Deutsch
Vortragsmodus in Präsenz
Kurzfassung Die vorliegende Masterarbeit beschäftigt sich mit der Modellierung von Angreifern und Angriffen auf ein komponentenbasiertes Softwaresystem, das zuvor bereits mittels eines bestehenden Ansatzes zur Quantifizierung von Architektur und Code modelliert und formal verifiziert wurde. Während die vorausgehende formale Verifikation einen wohlwollenden, ehrlichen Nutzer voraussetzt, erweitert diese Masterarbeit das Modell um einen Angreifer, der gezielt Randfälle und Implementierungsfehler ausnutzt. Der Unterschied zu bisherigen Arbeiten, die sich mit Angriffen auf Softwaresysteme beschäftigen, besteht darin, dass Modellierung und Analyse nicht auf der Architekturebene, sondern auf der Quellcode-Ebene erfolgen. Konkret wird ein Metamodell für Schwachstellen, Angriffsbäume und Angreifer vorgestellt und ein Analysetool implementiert, um eine quantitative Aussage über die Angriffssicherheit des Softwaresystems treffen zu können. Zur Evaluation wird eine Fallstudie mit zehn verschiedenen Angriffsbäumen durchgeführt, die alle verschiedenen, denkbaren Baumkonstruktionen repräsentieren. Zur Skalierbarkeitsuntersuchung wird für einen Angriffsbaum die Anzahl an parallelen Knoten sowie die Anzahl von Angreifern variiert. In der Auswertung ergeben sich eine Präzision und Sensitivität von 100 % sowie eine rein auf den neuen Beitrag dieser Arbeit bezogene sehr gute Skalierbarkeit der Analyse.

Donnerstag, 20. Februar 2025, 11:30 Uhr

iCal (Download)
Ort: Raum 237 (Gebäude 50.34)

Vortragende(r) Iliyan Ivanov
Titel Gamifying Collaborative Learning
Vortragstyp Bachelorarbeit
Betreuer(in) Lucia Happe
Vortragssprache Englisch
Vortragsmodus in Präsenz
Kurzfassung The bachelor’s thesis “Gamifying Collaborative Learning” explores how gamification can enhance teamwork in collaborative learning environments.

Challenges like unequal participation, low motivation, and lack of feedback often hinder group effectiveness. To address these, a gamification framework was integrated into the digital platform CollabSpace, featuring real-time notifications, a points system, and personalized feedback. Evaluation with three groups shows that gamification can increase motivation and team awareness, especially in text-based tasks. However, there is still a lot of runway for improvement. The findings provide valuable insights for future developments in gamified collaborative learning platforms.

Vortragende(r) Fatma Chebbi
Titel Verification of Quantitative Information Flow Security Using Statistical Model Checking
Vortragstyp Masterarbeit
Betreuer(in) Christopher Gerking
Vortragssprache Deutsch
Vortragsmodus in Präsenz
Kurzfassung Mit der Verbreitung von Softwaresystemen und steigendem Sicherheitsbewusstsein sind Schutzziele wie Vertraulichkeit essenziell. Informationsflussanalysen helfen um Sicherheitsrichtlinien zu überprüfen, insbesondere durch Noninterference. Bisherige Arbeiten bieten allerdings oft keine praxisnahen Ergebnisse oder sind schwer im Entwicklungsprozess anwendbar. Jedoch existieren informationstheoretische Metriken um Informationsecks in Systemen quantifizieren zu können. Im Rahmen der Masterarbeit wurde daher ein Werkzeug zur Unterstützung sicherheitsrelevanter Entscheidungen in frühen Entwicklungsphasen entwickelt. Dieser Ansatz basiert auf Stochastic Timed Automata (STA) und berücksichtigt probabilistische und zeitliche Aspekte. Zur Analyse wurde ein erweiterter Noninterference-Modellprüfungsansatz für zeitbehaftete Systeme, sowie ein Werkzeug basierend auf Statistical Model Checking (SMC) zur Extraktion von Erreichbarkeitsmetriken genutzt. Die entwickelte Methode wurde durch Fallstudien evaluiert und die Beziehung zu informationstheoretischen Metriken untersucht. Die Ergebnisse zeigten eine positive Korrelation, jedoch auch ein Verbesserungspotenzial bei der Genauigkeit.

Montag, 24. März 2025, 13:00 Uhr

iCal (Download)
Ort: Raum 010 (Gebäude 50.34)

Vortragende(r) Zihao Xu
Titel Extraktion eines Testkorpus von zeitbehafteten Vertraulichkeitsschwachstellen aus Java-Programmen
Vortragstyp Bachelorarbeit
Betreuer(in) Christopher Gerking
Vortragssprache Deutsch
Vortragsmodus in Präsenz
Kurzfassung Der Fokus dieser Arbeit liegt auf der Extraktion eines Testkorpus zur Evaluierung von zeitbezogenen Vertraulichkeitsschwachstellen in Java-Programmen. Die Ursache solcher Schwachstellen sind messbare Laufzeitunterschiede, die vertrauliche Informationen preisgeben. Um solche Timing-Angriffe systematisch zu analysieren, werden Java-Programme mit Hilfe von Mutationstests modifiziert und automatisch in Zeitautomaten umgewandelt. Die Kategorisierung dieser Modelle hat zu einer Methodik geführt, mit deren Hilfe ein umfassender Testkorpus bekannter Schwachstellen erzeugt werden kann.
Vortragende(r) Colin Begero
Titel Repository Mining for Architectural Information
Vortragstyp Bachelorarbeit
Betreuer(in) Martin Armbruster
Vortragssprache Deutsch
Vortragsmodus in Präsenz
Kurzfassung Um den Zusammenhang von Code und dessen Architektur zu untersuchen kann man existierende Projekte mit Architekturbeschreibung analysieren. Es existiert allerdings keine umfangreiche Datenbank oder Sammlung, die solche Projekte enthält.

Daher entwerfen wir einen GitHub Repository Miner, der Softwareprojekte identifiziert, welche eine Architekturbeschreibung beinhalten. Verschiedene Regeln geben Hinweise auf solche Vorkommen. Diese Regeln werden automatisiert auf Repositories angewendet, um die analysierten Projekte nach der Wahrscheinlichkeit des Vorkommens von Architekturdokumentation zu sortieren.

Die Ergebnisse zeigen, dass das entworfene Programm passende Testrepositories in einer begrenzten Menge an Repositories identifizieren kann. Durch die Optimierung der Programmparameter kann eine weitere Verbesserung der randomisierten Suche erreicht werden.

Freitag, 28. März 2025, 14:00 Uhr

iCal (Download)
Ort: Raum 348 (Gebäude 50.34)
Webkonferenz: https://sdq.kastel.kit.edu/wiki/SDQ-Institutsseminar/Microsoft_Teams

Vortragende(r) Anne-Kathrin Hermann
Titel Low-Code in der Sichtenbasierten Entwicklung
Vortragstyp Vortrag
Betreuer(in) Lars König
Vortragssprache Englisch
Vortragsmodus in Präsenz
Kurzfassung In recent years, low-code development has been established as an innovative method for software development. It enables the development of a wide range of applications using graphical tools, with little or no knowledge of text-based programming languages. Closely related is model-driven development, where models play a primary role in specifying software systems and generating code partially automatically. While model-driven development supports development processes where developers from different domains work on different models that are kept consistent, in practice, classical model-driven tools are often difficult to use for domain experts with a less technical background. To bridge this gap, we propose a concept for integrating low-code platforms through projective views into model-driven development environments. We provide an initial evaluation of the feasibility of our concept using a development platform for smart home systems as a case study.
Vortragende(r) Alexander Milster
Titel Multi-Language and Cross-Language Software Plagiarism Detection
Vortragstyp Bachelorarbeit
Betreuer(in) Robin Maisch
Vortragssprache Deutsch
Vortragsmodus in Präsenz
Kurzfassung Currently, commonly used plagiarism detection tools can only handle code from one language for a single run.

This thesis deals with two different sub-problems. Firstly, parsing and comparing the code of each occurring language in a single submission set separately (multi-language plagiarism detection) and, secondly, comparing submissions as a whole, despite containing code from multiple languages (cross-language plagiarism detection). In this thesis, we propose supporting multi-language plagiarism detection by concatenating the token lists. For cross-language plagiarism detection, we propose a set of language-agnostic tokens and rules for the order they should be extracted in, which have to be implemented for each supported language. In addition, a dynamic approach that allows more flexible matching of tokens is considered.

Freitag, 23. Mai 2025, 14:00 Uhr

iCal (Download)
Ort: Raum 010 (Gebäude 50.34)

Vortragende(r) Steffen Schmitt
Titel Dynamisches Speichermanagement in großen modellbasierten Java-Anwendungen
Vortragstyp Masterarbeit
Betreuer(in) Erik Burger
Vortragssprache Deutsch
Vortragsmodus in Präsenz
Kurzfassung Mit wachsender Komplexität modellgetriebener Softwareprojekte steigen die Anforderungen an das Speichermanagement für großer Modelle. Herkömmliche Lösungen stoßen an ihre Grenzen, wenn Modelle vollständig im Arbeitsspeicher gehalten werden müssen und der Zugriff per Dereferenzierung erfolgt. Diese Arbeit präsentiert ein dynamisches Speichermanagement auf Basis von Lazy Loading für modellgetriebene Java-Anwendungen. Ziel ist es, effizient mit großen Modellen zu arbeiten, ohne diese vollständig im Hauptspeicher vorhalten zu müssen. Dadurch werden sowohl der Speicherbedarf als auch die Ladezeiten reduziert. Ein Prototyp in der Industrieanwendung PREEvision zeigt, dass bei einem genutzten Modellanteil von unter 68 % signifikante Vorteile gegenüber dem vollständigen Laden erzielt werden können. Das vorgestellte Konzept bildet zudem eine Grundlage für zukünftige Erweiterungen, etwa zur Unterstützung des Entladens von Modellelementen.
Vortragende(r) Marco Schneider
Titel HubLink: Leveraging Language Models for Enhanced Scholarly Information Retrieval on Research Knowledge Graphs
Vortragstyp Masterarbeit
Betreuer(in) Angelika Kaplan
Vortragssprache Deutsch
Vortragsmodus in Präsenz
Kurzfassung In der aktuellen Praxis ist der manuelle Aufwand, den Forschende zur Durchführung einer Literatursuche betreiben müssen, hoch. Research Knowledge Graphs (RKGs), die wissenschaftliche Beiträge speichern und miteinander verknüpfen, sowie Large Language Models (LLMs), die herausragende Leistungen im Sprachverständnis zeigen, bieten hier das Potenzial, den Suchprozess effizienter zu gestalten. Forschende können ihre Fragen in natürlicher Sprache formulieren, und ein LLM-basiertes Question-Answering (QA)-System sucht die relevanten Kontexte aus dem Graphen heraus und generiert eine passende Antwort.

Aktuelle Ansätze sind jedoch in der Praxis schwer anzuwenden, da sie nicht mit den großen und dynamischen Schemata eines RKGs zurechtkommen und zudem Trainingsdaten benötigen. Diese Arbeit präsentiert "HubLink", einen neuartigen Ansatz, der die Leistungsfähigkeit eines vortrainierten LLMs nutzt, um ohne zusätzliches Training und ohne Abhängigkeit vom Graphschema effizient Antworten im Rahmen einer Literatursuche zu liefern. Darüber hinaus haben wir eine Taxonomie und ein QA-Datenset erstellt, die eine systematische Evaluierung der Kapazitäten eines solchen Systems ermöglichen. Unsere Evaluierung des HubLink-Ansatzes zeigt, das dieser deutlich besser im Auffinden von Daten im Graphen ist, mit einer Verbesserung von über 114 % im Vergleich zu ähnlichen Methoden.

Mit dieser Arbeit schaffen wir die Grundlage für weiterführende Forschung zur Literatursuche mithilfe schema-agnostischer und trainingsfreier Methoden sowie zur effizienten Vereinigung von RKGs und LLMs.