Automatische Klassifikation von GitHub-Projekten nach Anwendungsbereichen

Aus SDQ-Wiki
Ausschreibung (Liste aller Ausschreibungen)
Bild Ausschreibung Automatische Klassifikation von GitHub-Projekten nach Anwendungsbereichen.jpeg Typ Masterarbeit
Aushang Masterarbeit Ausschreibung Automatische Klassifikation von GitHub-Projekten nach Anwendungsbereichen.pdf
Betreuer Wenden Sie sich bei Interesse oder Fragen bitte an:

Yves Kirschner

Motivation

GitHub ist gegenwärtig der beliebteste webbasierte Versionskontrolldienst für Softwareentwicklungsprojekte. Immer mehr Softwareentwickler verwenden GitHub, um ihre öffentlichen (oder privaten) Softwareprojekte dort zu verwalten. Die große Anzahl verschiedener Softwareprojekte auf GitHub stellt die Welt der Softwareentwicklung vor neue Herausforderungen. So beherbergt GitHub eine große Anzahl von Projekten für verschiedene Anwendungsbereiche, wie z.B. Bibliotheken und Frameworks, Systemsoftware und Projekte mit Dokumentation und Tutorials. Im Gegensatz zu anderen webbasierten Versionskontrolldiensten wie SourceForge enthält GitHub jedoch keine standardisierte Klassifizierung nach der Anwendungsbereiche eines Projekts.

Aufgabenstellung

In dieser Masterarbeit wird ein automatisiertes Klassifikationsverfahren für GitHub-Projekte nach Anwendungsbereichen entworfen und umgesetzt. Ziel ist es, anhand einer breiten Auswahl von öffentlichen GitHub-Projekten interessante und verwertbare Informationen aus Anwendungsbereichen aufzudecken. Um eine solche Klassifizierung zu ermöglichen, muss zunächst eine Klassifizierung der Anwendungsbereiche definiert und eine Klassifikationsverfahren gewählt werden.

Wir bieten

  • Erlernen von Techniken zum Abfragen und Analysieren von GitHub- und Git-Daten
  • Einblick in aktuelle Forschung im Bereich Klassifikationsverfahren
  • Eine angenehme Arbeitsatmosphäre und flexible Arbeitszeiten