Zum Inhalt

Modulübersicht

Zwischen den Präsenztagen er­hal­ten die Teil­neh­men­den Übungsaufgaben, in denen die Reflexions- und Transferfähigkeit der Teil­neh­men­den im Vordergrund steht, zur eigenständigen Bearbeitung

Weitere In­for­ma­ti­onen finden Sie in diesem Modulhandbuch.

Modulinhalte

Tag 1: Informationssysteme

  • Begriff Datenbanksysteme
  • Relationales Datenmodell
  • SQL - Structured Query Language
  • Data Warehousing: Ar­chi­tek­tur, Entwicklungsprozess, Bus Matrix
  • Modellierung mittels Star Schema, Fakten, Dimensionen
  • Anfragen an Star Schemata mit SQL und mit SQL OLAP-Erweiterungen
  • No-SQL Systeme: MapReduce, Anfragesprachen für MapReduce-Systeme

Dozenten: Prof. Dr. Claus Weihs, Prof. Dr. Jens Teubner

Tag 2: Bearbeitung großer Datenmengen in R

  • Kurzeinführung in die Software R und Rstudio
  • Daten- und Kontrollstrukturen
  • Ein- und Ausgabe größerer Datenmengen
  • Datenbankanbindungen
  • Analyse großer Daten mit dem Paket data.tabl
  • Funktionale Programmierung: MapReduce
  • Explizte Parallelisierung mit Paketen parallel und snow
  • Parallelisierung auf HPC Clustern

Dozenten: Dr. Michel Lang, Dr. Dirk Surmann

Tag 3: Übung zu Modulinhalten

Dozenten: Vormittag: Prof. Dr. Jens Teubner, Nachmittag: Dr. Michel Lang, Dr. Dirk Surmann

Tag 4: Daten­ana­lyse Clusteranalyse

  • Statistische Grund­la­gen der deskriptiven Daten­ana­lyse
  • Abgrenzung Clusteranalyse - Klassifikation
  • Distanzmaße und Ähnlichkeitsmaße
  • Hierarchisches Clustern
  • Partitionierende Clusteralgorithmen
  • Bestimmung der Clusteranzahl
  • Variablenselektion
  • Big Data Analysen: Clustern großer Datenmengen, CAST und DBSCAN

Dozentin: Prof. Dr. Katja Ickstadt

Daten­ana­lyse Regression

  • Lineare Modelle, Verallgemeinerte Lineare Modelle
  • Schätzverfahren
  • Residualanalyse
  • Diagnostische Plots
  • Variablenselektion
  • Interpretation
  • Big Data Analysen: penalisierte Regressionsverfahren, Bayes-Ver­fah­ren, Unterraumeinbettung und Sampling
  • Evaluation: Vorhersage, Qualitätsmaße, Test

Dozent: Nachmittag: Rahnenführer

Tag 5: Daten­ana­lyse Klassifikation

  • Datenunabhängige Ver­fah­ren
  • Bayes-Ver­fah­ren
  • Diskriminanzanalyse
  • Logistische Regression
  • Entscheidungsbäume
  • SVM
  • Ensemble Ver­fah­ren
  • Evaluation: Resampling, Interpretation, Vorhersage, Konfusionsmaße, Tuning, Variablenselektion, Dimensionsreduktion, Modellselektion
  • Big Data: viele Variablen, viele Be­obach­tung­en

Dozenten: Prof. Dr. Claus Weihs (Unter­stüt­zung Dr. Daniel Horn)

Tag 6: Übung zu Modulinhalten

Dozierende:  Vormittag Prof. Dr. Katja Ickstadt, Nachmittag: Dr. Daniel Horn

Tag 7: Visualisierung

  • Grund­la­gen
  • Visualisierung metrisch skalierter Merkmale
  • Visualisierung kategorieller Merkmale
  • Visualisierung räumlicher Strukturen
  • Visualisierung von Zusammenhängen
  • Visualisierung bei großen Datensätzen

Statistische Versuchsplanung

  • wichtigste Prinzipien der experimentellen Versuchsplanung und deren Analyse
  • Vermittlung grundlegender Ver­fah­ren und Modelle für die Planung von Experimenten
  • Fallzahlplanung für eine ausreichende Power und an­schlie­ßen­de statistische Analysemethoden
  • allgemeine Guidelines (faktorielles Prinzip, Randomisierung, Blockbildung) zur Planung von Experimenten

Dozenten:  Vormittags: Prof. Dr. Markus Pauly oder M.Sc Burim Ra­mo­saj, Nachmittags Dr. Leo Geppert
 

Tag 8: Fallstudie mit großem Datensatz

  • Analyse eines Datensatzes mit CRISP-DM Prozessmodell
  • Strategien und Technologien zur Analyse riesiger Datenmengen

Dozierende: Prof. Dr. Katja Ickstadt & Prof. Dr. Claus Weihs

Tag 9: Übung: Besprechung der Fallstudie

Dozierende: Vormittag: M.Sc Burim Ra­mo­saj, Dr. Leo Geppert, Nachmittag: Prof. Dr. Katja Ickstadt

Zertifikatsarbeit (bring your own data), schriftliche Aus­ar­bei­tung eines Big-Data Falls und mündliche Disputation mit anschließender Diskussion

Dozenten: Betreuer (Pro­fes­soren der TU)

Zwischen den Präsenztagen: Übungsaufgaben zur eigenständigen Bearbeitung
Reflexions- und Transferfähigkeit der Teil­neh­men­den steht im Vordergrund

Anfahrt & Lageplan

Der Cam­pus der Technischen Uni­ver­si­tät Dort­mund liegt in der Nähe des Autobahnkreuzes Dort­mund West, wo die Sauerlandlinie A45 den Ruhrschnellweg B1/A40 kreuzt. Die Abfahrt Dort­mund-Eichlinghofen auf der A45 führt zum Cam­pus Süd, die Abfahrt Dort­mund-Dorstfeld auf der A40 zum Cam­pus-Nord. An beiden Ausfahrten ist die Uni­ver­si­tät ausgeschildert.

Direkt auf dem Cam­pus Nord befindet sich die S-Bahn-Station „Dort­mund Uni­ver­si­tät“. Von dort fährt die S-Bahn-Linie S1 im 20- oder 30-Minuten-Takt zum Hauptbahnhof Dort­mund und in der Gegenrichtung zum Hauptbahnhof Düsseldorf über Bochum, Essen und Duisburg. Außerdem ist die Uni­ver­si­tät mit den Buslinien 445, 447 und 462 zu erreichen. Eine Fahrplanauskunft findet sich auf der Homepage des Verkehrsverbundes Rhein-Ruhr, außerdem bieten die DSW21 einen interaktiven Liniennetzplan an.
 

Zu den Wahrzeichen der TU Dort­mund gehört die H-Bahn. Linie 1 verkehrt im 10-Minuten-Takt zwischen Dort­mund Eichlinghofen und dem Technologiezentrum über Cam­pus Süd und Dort­mund Uni­ver­si­tät S, Linie 2 pendelt im 5-Minuten-Takt zwischen Cam­pus Nord und Cam­pus Süd. Diese Strecke legt sie in zwei Minuten zu­rück.

Vom Flughafen Dort­mund aus gelangt man mit dem AirportExpress innerhalb von gut 20 Minuten zum Dort­mun­der Hauptbahnhof und von dort mit der S-Bahn zur Uni­ver­si­tät. Ein größeres Angebot an inter­natio­nalen Flugverbindungen bietet der etwa 60 Ki­lo­me­ter entfernte Flughafen Düsseldorf, der direkt mit der S-Bahn vom Bahnhof der Uni­ver­si­tät zu erreichen ist.

Die Ein­rich­tun­gen der TU Dort­mund verteilen sich auf den größeren Cam­pus Nord und den kleineren Cam­pus Süd. Zudem befinden sich einige Bereiche der Hoch­schu­le im angrenzenden Technologiepark. Genauere In­for­ma­ti­onen kön­nen Sie den Lageplänen entnehmen.