Seminar Big Data, Architektur und Performance WS13/14
Semester: | Wintersemester 2013/14 |
LP (ECTS): | 3 |
SWS: | 2 |
Studiengang: | Master Informatics, Diplom Informatics, Master Information Engineering |
Ansprechpartner: | Philipp Merkle |
- Ort und Zeit der Lehrveranstaltung
unregelmäßig, siehe Beschreibungstext | |
Seminarraum 348 (Gebäude 50.34) |
- ILIAS-Bereich
- Seite im Vorlesungsverzeichnis
Inhalt
Big Data befasst sich mit der Verwaltung und Verwertung großer Datenmengen, deren Volumen eine Implementierung mit klassischen Mitteln, wie relationalen Datenbanken, häufig ausschließt.
Das technologische Fundament von Big Data bildet eine verteilte Datenhaltung sowie die verteilte Verarbeitung dieser Daten. Als Datenspeicher kommen verteilte Dateisysteme wie GFS und HDFS ebenso zum Einsatz wie verteilte, nicht-relationale Datenbanken wie Apache Cassandra oder mongoDB. Eine verteilte (d.h. parallele) Verarbeitung dieser Daten ermöglichen Googles MapReduce oder dessen Apache-Umsetzung Hadoop.
In diesem Seminar beschäftigen wir uns mit Konzepten, Technologien, Architekturen und Performance-Fragestellungen rund um Big Data, sind aber nicht ausschließlich auf Big Data fokusiert.
Themen
Die nachfolgenden Themen werden im Rahmen der Vorbesprechung vorgestellt.
- Datenkonsistenz bei NoSQL-Datenbanken
- Polyglot Persistence und Lambda Architektur
- Anfragesprachen für Graph-Datenbanken
- Daten-Anonymisierung
- In-Memory Datenbanken im Vergleich
- Dokumentenorientierte Datenbanken
- Potentiale und Nachteile der Spaltenorientierung
- Key-Value (KV) Speicher-Systeme
- MapReduce Implementierungen und Optimierungen im Vergleich
- Big Data Economics
- Rekonstruktion von Softwarearchitekturen
Termine
- Vorbesprechung und Vorstellung der Themen: am Dienstag, 22.10., 14:00 - 15:30 Uhr in Seminarraum 348 (Geb. 50.34, 3. OG, Informatik-Hauptgebäude)
- Einführung ins wissenschaftliche Arbeiten samt anschliessender Themenvergabe: am Dienstag, 29.10., 14:00 - 15:30 Uhr in Seminarraum 348
- Weitere Termine finden individuell nach Vereinbarung mit Betreuern statt.
Die wichtigsten Informationen
- Das Seminar wird als Blockseminar am Ende des Semesters durchgeführt.
- Es stehen 12 Seminarplätze zur Verfügung.
- Bitte melden Sie sich im Sekretariat IPD Reussner (Zimmer 328, Geb. 50.34) an. Eine Anmeldung ist Voraussetzung für die Teilnahme.
- Benotung und Scheinvergabe
- Masterstudenten erhalten eine individuelle Note. Die benotete Leistung setzt sich zusammen aus der schriftlichen Ausarbeitung und der Präsentation derselbigen.
- Diplomstudenten erhalten bei erfolgreicher Teilnahme einen unbenoteten Schein, das Seminar ist aber nicht prüfbar.
- Information zu Seminaren bei SDQ
Unterlagen
Die Materialien werden auf http://sdqweb.ipd.kit.edu/lehre/WS1314-SeminarBigData/ für Sie bereit gestellt. Der Zugang ist passwortgeschützt (Benutzer: stud, das Passwort wird in der Vorbesprechung mitgeteilt).
- Vorbesprechungsfolien inkl. Themenübersicht
- Themenvergabe mit organisatorischen Hinweisen
- Folien „Einführung ins wissenschaftliche Arbeiten“
Wichtige Links
- Form der Ausarbeitung bei Seminaren
- Ausarbeitungshinweise
- Bewertungskriterien für Seminare (Erläuterung des Punktesystems)
- Versionsverwaltung mit Subversion (SVN)
Seminarablauf
Das Abgabedatum ist der angegebene Tag. Ist also bspw. die Deadline am 01.01., gilt eine Abgabe noch als pünktlich, wenn sie um 23:59 Uhr MEZ des 01.01. abgegeben wird.
Bitte checken Sie nicht nur PDF-Dateien ins SVN ein, sondern auch Ihre Quellen (.tex, .bib, ggf. .tcp sowie alle Grafikdateien) und auch verwendete Styles. Sonstige von LaTeX generierte Dateien bitte nicht mit einchecken (.aux, .log, .bst, .bbl, .blg, .lof, .toc, ...).
Termin / Deadline | Datum | Weitere Infos |
---|---|---|
Abgabe Gliederung inkl. Literaturliste | Mo, 11.11. | Wir erwarten eine sinnvolle (nicht endgültige) Gliederung mit Stichpunkten und initialen Literaturreferenzen zu jedem Abschnitt |
Abgabe Ausarbeitung für Peer-Review | Fr, 20.12. | |
Zuteilung der Peer-Reviews | Mo, 23.12. | Diese Deadline gilt für die Seminarorganisation, als Seminarteilnehmer brauchen Sie nichts zu unternehmen |
Abgabe Peer-Reviews | Di, 07.01. | |
Erhalt Peer-Reviews | Fr, 10.01. | Diese Deadline gilt für die Seminarorganisation, als Seminarteilnehmer brauchen Sie nichts zu unternehmen |
Abgabe Ausarbeitung mit eingearbeiteten Peer-Reviews | Mo, 20.01. | |
Abgabe Folien für Betreuer-Review | Mo, 27.01. | |
Betreuer-Feedback zur Ausarbeitung | Mo, 27.01. | Diese Deadline gilt für Seminarbetreuer, als Seminarteilnehmer brauchen Sie nichts zu unternehmen |
Betreuer-Feedback zu den Folien | Mo, 03.02. | Diese Deadline gilt für Seminarbetreuer, als Seminarteilnehmer brauchen Sie nichts zu unternehmen |
Abgabe Ausarbeitung und Folien (endgültige Versionen) | Mo, 10.02. | |
Blockseminar | 18. und 19.02.2014, jeweils ab 13:00 Uhr |
Administratives
- Lesegruppe
- Praktikum Modellgetriebene Software-Entwicklung WS13/14
- Praktikum Software Quality Engineering mit Eclipse WS13/14
- Praxis der Forschung: Large-Scale System Analysis and Simulation - Teil 1 WS13/14
- Praxis der Forschung: Modellgetriebene Software-Entwicklung - Teil 2 WS13/14
- Praxis der Software-Entwicklung 12 WS13/14
- Seminar Betriebliche Unternehmenssoftware und IBM zSeries WS13/14
- Seminar Big Data, Architektur und Performance WS13/14
- Vorlesung Programmierparadigmen WS13/14
- Vorlesung Software-Evolution WS13/14
- Vorlesung Softwaretechnik II WS13/14