Seminar Big Data, Architektur und Performance WS13/14

Aus SDQ-Wiki
Seminar Big Data, Architektur und Performance (2400059)

Semester: Wintersemester 2013/14
LP (ECTS): 3
SWS: 2
Studiengang: Master Informatics, Diplom Informatics, Master Information Engineering
Ansprechpartner: Philipp Merkle
Ort und Zeit der Lehrveranstaltung
unregelmäßig, siehe Beschreibungstext
Seminarraum 348 (Gebäude 50.34)
ILIAS-Bereich
Seite im Vorlesungsverzeichnis


Themenvergabe
Appointment-new.png
Dienstag, 29.10., 14:00 - 15:30 Uhr
Seminarraum 348 (Gebäude 50.34)

Inhalt

Big Data befasst sich mit der Verwaltung und Verwertung großer Datenmengen, deren Volumen eine Implementierung mit klassischen Mitteln, wie relationalen Datenbanken, häufig ausschließt.

Das technologische Fundament von Big Data bildet eine verteilte Datenhaltung sowie die verteilte Verarbeitung dieser Daten. Als Datenspeicher kommen verteilte Dateisysteme wie GFS und HDFS ebenso zum Einsatz wie verteilte, nicht-relationale Datenbanken wie Apache Cassandra oder mongoDB. Eine verteilte (d.h. parallele) Verarbeitung dieser Daten ermöglichen Googles MapReduce oder dessen Apache-Umsetzung Hadoop.

In diesem Seminar beschäftigen wir uns mit Konzepten, Technologien, Architekturen und Performance-Fragestellungen rund um Big Data, sind aber nicht ausschließlich auf Big Data fokusiert.

Themen

Die nachfolgenden Themen werden im Rahmen der Vorbesprechung vorgestellt.

  1. Datenkonsistenz bei NoSQL-Datenbanken
  2. Polyglot Persistence und Lambda Architektur
  3. Anfragesprachen für Graph-Datenbanken
  4. Daten-Anonymisierung
  5. In-Memory Datenbanken im Vergleich
  6. Dokumentenorientierte Datenbanken
  7. Potentiale und Nachteile der Spaltenorientierung
  8. Key-Value (KV) Speicher-Systeme
  9. MapReduce Implementierungen und Optimierungen im Vergleich
  10. Big Data Economics
  11. Rekonstruktion von Softwarearchitekturen

Termine

  • Vorbesprechung und Vorstellung der Themen: am Dienstag, 22.10., 14:00 - 15:30 Uhr in Seminarraum 348 (Geb. 50.34, 3. OG, Informatik-Hauptgebäude)
  • Einführung ins wissenschaftliche Arbeiten samt anschliessender Themenvergabe: am Dienstag, 29.10., 14:00 - 15:30 Uhr in Seminarraum 348
  • Weitere Termine finden individuell nach Vereinbarung mit Betreuern statt.

Die wichtigsten Informationen

  • Das Seminar wird als Blockseminar am Ende des Semesters durchgeführt.
  • Es stehen 12 Seminarplätze zur Verfügung.
  • Bitte melden Sie sich im Sekretariat IPD Reussner (Zimmer 328, Geb. 50.34) an. Eine Anmeldung ist Voraussetzung für die Teilnahme.
  • Benotung und Scheinvergabe
    • Masterstudenten erhalten eine individuelle Note. Die benotete Leistung setzt sich zusammen aus der schriftlichen Ausarbeitung und der Präsentation derselbigen.
    • Diplomstudenten erhalten bei erfolgreicher Teilnahme einen unbenoteten Schein, das Seminar ist aber nicht prüfbar.
  • Information zu Seminaren bei SDQ

Unterlagen

Die Materialien werden auf Emblem-readonly small.png http://sdqweb.ipd.kit.edu/lehre/WS1314-SeminarBigData/ für Sie bereit gestellt. Der Zugang ist passwortgeschützt (Benutzer: stud, das Passwort wird in der Vorbesprechung mitgeteilt).

Wichtige Links

Seminarablauf

Das Abgabedatum ist der angegebene Tag. Ist also bspw. die Deadline am 01.01., gilt eine Abgabe noch als pünktlich, wenn sie um 23:59 Uhr MEZ des 01.01. abgegeben wird.

Bitte checken Sie nicht nur PDF-Dateien ins SVN ein, sondern auch Ihre Quellen (.tex, .bib, ggf. .tcp sowie alle Grafikdateien) und auch verwendete Styles. Sonstige von LaTeX generierte Dateien bitte nicht mit einchecken (.aux, .log, .bst, .bbl, .blg, .lof, .toc, ...).

Termin / Deadline Datum Weitere Infos
Abgabe Gliederung inkl. Literaturliste Mo, 11.11. Wir erwarten eine sinnvolle (nicht endgültige) Gliederung mit Stichpunkten und initialen Literaturreferenzen zu jedem Abschnitt
Abgabe Ausarbeitung für Peer-Review Fr, 20.12.
Zuteilung der Peer-Reviews Mo, 23.12. Diese Deadline gilt für die Seminarorganisation, als Seminarteilnehmer brauchen Sie nichts zu unternehmen
Abgabe Peer-Reviews Di, 07.01.
Erhalt Peer-Reviews Fr, 10.01. Diese Deadline gilt für die Seminarorganisation, als Seminarteilnehmer brauchen Sie nichts zu unternehmen
Abgabe Ausarbeitung mit eingearbeiteten Peer-Reviews Mo, 20.01.
Abgabe Folien für Betreuer-Review Mo, 27.01.
Betreuer-Feedback zur Ausarbeitung Mo, 27.01. Diese Deadline gilt für Seminarbetreuer, als Seminarteilnehmer brauchen Sie nichts zu unternehmen
Betreuer-Feedback zu den Folien Mo, 03.02. Diese Deadline gilt für Seminarbetreuer, als Seminarteilnehmer brauchen Sie nichts zu unternehmen
Abgabe Ausarbeitung und Folien (endgültige Versionen) Mo, 10.02.
Blockseminar 18. und 19.02.2014, jeweils ab 13:00 Uhr

Administratives


Lehrangebot nach Studiengang

Informatik

Bachelor · Master · Diplom

Informationswirtschaft

Bachelor · Master · Diplom