Vorlesung 2SWS (im Rahmen der ISOS), DaMi, 080019, ECTS- Credits 6, Praktische
Informatik
Zeit und Ort: noch zu bestimmen
Erste Vorlesung: noch zu bestimmen
Die Vorlesungen werden als Kompaktkurs gegeben.
Assoziierte Vorlesung
im Wintersemester 2008/2009 von TIS@CAU
Die Vorlesung "Intelligente
Informationssysteme" findet donnerstags 8.15-9.45 und freitags 12.15-13.45 im
WS2008/09 statt.
Übungen zu Intelligenten
Informationssystemen werden betreut durch Dipl.Inf. Kai Jannaschk, Zeit: offen;
Raum: offen; erste Übung:
Data Mining beschäftigt sich mit dem
maschinellen Auffinden von Klassifikationsfunktionen,
Regeln und anderen formalisierbaren Zusammenhängen innerhalb von großen Datenmengen.
Typische Daten sind z.B. die Kaufaktivitäten von Kunden, Worthäufigkeiten in Spam-Emails
oder die Logs von Webserverzugriffen. Beispielhafte Anwendungen umfassen Aussortieren von
Spam-Emails, Aufspüren von Insiderhandel auf den Börsen, Klassifizieren von Zielpersonen
einer Marketingkampagne, oder das Erkennen von Anomalien im Betrieb von
Computersystemen. Spannendere Anwendungen sind die des Exzellenzcluster "Future
Ocean", wobie hier noch eine Aufbereitung aussteht.
Wir möchten uns in dieser Vorlesung vorwiegend mit den algorithmischen Grundlagen
des Data
Mining beschäftigen, jedoch diese im Kontext der Anwendungen kennen lernen. Zu den
Algorithmen gehören u.a. diverse Klassifikationstechniken, Assoziationsregeln, das Clustering,
und Methoden der Zeitreihenanalyse. Weitere wichtige Themen umfassen Datenaufbereitung,
Selektion signifikanter Attribute, und die Bewertung der Klassifikationsgüte.
Vorraussetzungen: Grundkenntnisse der Wahrscheinlichkeitsrechnung, Statistik und Logik,
Datenbanken I, Informatik I - IV
Literatur:
wird noch ergänzt
D. Hand, H. Mannila, P. Smyth. Principles of data mining. MIT Press, 2001
P.-N. Tan, M. Steinbach, V. Kumar. Introduction to data mining, Pearson 2006
D.T. Larose: Discovering Knowledge in Data, Wiley-Interscience, 2005.
T.Mitchell, Machine Learning, McGraw Hill, 1997.
Jiawei Han, M. Kamber: Data Mining: Concepts and Techniques. Morgan Kaufmann, 2001.
I.H. Witten, E.Frank: Data Mining. Morgan Kaufmann Publishers, 1999 (auch als deutsche
Ausgabe verfügbar), oder 2005 (2nd edition).
Nong Ye (editor), The Handbook of data mining, Lawrence Erlbaum Associates Publishers,
2003.
O. Maimon, L. Rokach (eds.), The data mining and knowledge discovery handbook, Springer
2005
O.H. Pilkey, L. Pilkey-Jarvis. Useless arithmetic - Why environmental scientists can't
predict
the future. Columbia Press 2007.
S. Bandyopadhyay, U. Maulik, L.B. Holder, D.J.Cook, Advanced methods for knowledge
discovery from complex data. Springer 2005.
D. De Vaus, Analysing social science data. Sage, 2002.
T.A. Runkler, Information mining. Vieweg 2000.
V.N. Vapnik, Algorithms for dependence discovery, Nauka, 1984.
M. Ester, J. Sander, Knowledge discovery in databases, Springer 2000.
M. Antony, N. Biggs, Computational learning theory, Cambridge Press 1992.
P. Fischer, Algorithmisches Lernen, Teubner 2000.
N. Lavrac, S. Dzeroski, Inductive Logic Programming: Techniques and Applications.
Ellis
Horwood, 1994, (freier Download).
Tools:
KXen (in den TIS-Labs und students editions)
Weka 3.4 Software, http://www.cs.waikato.ac.nz/ml/weka/
Skript:
Es wird kein Skript extra erstellt. Es wird erwartet, daß entweder ISOS-Studierende
die
Vorlesungen besuchen oder sich die Themenkomplexe selbst erarbeiten anhand der
bekantgebenenen Literutur der einzelnen Themenschwerpunkte.
Alternativ kann auch die assoziierte Vorlesung "Intelligente Informationssysteme"
besucht
werden, die sich mit der Anwendung von data mining Methoden u.a. beschäftigen wird.
Sprache:
on demand either German or English
Übersicht und
Gliederung: