Data Mining: ISOS Vorlesung; WS 2008/09
Vorlesung 2SWS (im Rahmen der ISOS), DaMi, 080019, ECTS- Credits 6, Praktische Informatik
Zeit und Ort: noch zu bestimmen
Erste Vorlesung: noch zu bestimmen
Die Vorlesungen werden als Kompaktkurs gegeben.

Assoziierte Vorlesung im Wintersemester 2008/2009 von TIS@CAU
Die Vorlesung "Intelligente Informationssysteme" findet donnerstags 8.15-9.45 und freitags 12.15-13.45 im WS2008/09 statt.
Übungen zu Intelligenten Informationssystemen werden betreut durch Dipl.Inf. Kai Jannaschk,  Zeit: offen; Raum: offen; erste Übung:

Data Mining beschäftigt sich mit dem maschinellen Auffinden von Klassifikationsfunktionen,  Regeln und anderen formalisierbaren Zusammenhängen innerhalb von großen Datenmengen. Typische Daten sind z.B. die Kaufaktivitäten von Kunden, Worthäufigkeiten in Spam-Emails oder die Logs von Webserverzugriffen. Beispielhafte Anwendungen umfassen Aussortieren von Spam-Emails, Aufspüren von Insiderhandel auf den Börsen, Klassifizieren von Zielpersonen einer Marketingkampagne, oder das Erkennen von Anomalien im Betrieb von Computersystemen. Spannendere Anwendungen sind die des Exzellenzcluster "Future Ocean", wobie hier noch eine Aufbereitung aussteht.
Wir möchten uns in dieser Vorlesung vorwiegend mit den algorithmischen Grundlagen des Data Mining beschäftigen, jedoch diese im Kontext der Anwendungen kennen lernen. Zu den Algorithmen gehören u.a. diverse Klassifikationstechniken, Assoziationsregeln, das Clustering, und Methoden der Zeitreihenanalyse. Weitere wichtige Themen umfassen Datenaufbereitung, Selektion signifikanter Attribute, und die Bewertung der Klassifikationsgüte.
Vorraussetzungen: Grundkenntnisse der Wahrscheinlichkeitsrechnung, Statistik und Logik, Datenbanken I, Informatik I - IV
Literatur:
wird noch ergänzt
D. Hand, H. Mannila, P. Smyth. Principles of data mining. MIT Press, 2001
P.-N. Tan, M. Steinbach, V. Kumar. Introduction to data mining, Pearson 2006
D.T. Larose: Discovering Knowledge in Data, Wiley-Interscience, 2005.
T.Mitchell, Machine Learning, McGraw Hill, 1997.
Jiawei Han, M. Kamber: Data Mining: Concepts and Techniques. Morgan Kaufmann, 2001.
I.H. Witten, E.Frank: Data Mining. Morgan Kaufmann Publishers, 1999 (auch als deutsche Ausgabe verfügbar), oder 2005 (2nd edition).
Nong Ye (editor), The Handbook of data mining, Lawrence Erlbaum Associates Publishers, 2003.
O. Maimon, L. Rokach (eds.), The data mining and knowledge discovery handbook, Springer 2005
O.H. Pilkey, L. Pilkey-Jarvis. Useless arithmetic - Why environmental scientists can't predict the future. Columbia Press 2007.
S. Bandyopadhyay, U. Maulik, L.B. Holder, D.J.Cook, Advanced methods for knowledge discovery from complex data. Springer 2005.
D. De Vaus, Analysing social science data. Sage, 2002.
T.A. Runkler, Information mining. Vieweg 2000.
V.N. Vapnik, Algorithms for dependence discovery, Nauka, 1984.
M. Ester, J. Sander, Knowledge discovery in databases, Springer 2000.
M. Antony, N. Biggs, Computational learning theory, Cambridge Press 1992.
P. Fischer, Algorithmisches Lernen, Teubner 2000.
N. Lavrac, S. Dzeroski, Inductive Logic Programming: Techniques and Applications. Ellis Horwood, 1994, (freier Download).
Tools:
KXen (in den TIS-Labs und students editions)
Weka 3.4 Software, http://www.cs.waikato.ac.nz/ml/weka/ 
Skript:
Es wird kein Skript extra erstellt. Es wird erwartet, daß entweder ISOS-Studierende die Vorlesungen besuchen oder sich die Themenkomplexe selbst erarbeiten anhand der bekantgebenenen Literutur der einzelnen Themenschwerpunkte.
Alternativ kann auch die assoziierte Vorlesung "Intelligente Informationssysteme" besucht werden, die sich mit der Anwendung von data mining Methoden u.a. beschäftigen wird.
Sprache:
on demand either German or English

Übersicht und Gliederung:
1. Mathematische GL
2. Klassifikation
3. Assoziationen
4. Modellierung
5. Cluster-Analyse
6. Anomalien