Personal tools
You are here: Home Teaching Winter 2003 Maschinelles Lernen und Data Mining in der Bioinformatik II
Document Actions

Maschinelles Lernen und Data Mining in der Bioinformatik II

Veranstaltungstyp Vorlesung (2 SWS) + Übung (1 SWS)
ects 4.0
Dozent Stefan Kramer  (Vorlesung)
Ullrich Rückert (Übung)
Zeit Dienstag, 16:00-18:00 (Vorlesung)
Dienstag, 18:00-19:00 (Übung)
Turnus wöchentlich
Raum Seminarraum MI 03.13.010
Unterrichtssprache Deutsch
Materialien
(anmeldung erforderlich)
Vorlesungsfolien
Übungsblätter
Bibliographie
Tool: Aleph
Tool: ACE

 

 

 

 

 

 

 

 


Die Analyse von experimentellen und anderen Daten (z.B. Text) ist eine zentrale Aufgabe in der Bioinformatik. Das Ziel dabei ist, Muster und Regelmäßigkeiten in Daten zu erkennen, die neue wissenschaftliche Erkenntnisse ermöglichen. Die Muster und Regelmässigkeiten können prädiktiv sein (wie z.B. bei Klassifikations- oder Regressionsproblemen) oder deskriptiv (wie z.B. bei Problemen, bei denen es "nur" um das Finden von Abhängigkeiten in Daten geht). Zur Lösung der obigen Probleme wird in den letzten Jahren immer häufiger auf Algorithmen und Techniken des Maschinellen Lernens und des Data Mining zurückgegriffen. Das Maschinelle Lernen beschäftigt sich mit Algorithmen, die durch Erfahrung ihre Fähigkeit, eine Aufgabe zu lösen, verbessern können. Als "Data Mining" bezeichnet man den Datenanalyseschritt im Prozess der Entdeckung neuen Wissens in Datenbanken ("Knowlege Discovery in Databases"). Algorithmen des Maschinellen Lernens werden oft im Data Mining eingesetzt. Ziel dieser Vorlesung ist, aktuelle Anwendungen des Maschinellen Lernens und des Data Mining in der Bioinformatik systematisch vorzustellen.

Der Schwerpunkt der Vorlesung liegt auf Methoden, die fuer die Datenanalyse in der Bioinformatik von besonderer Bedeutung sind. Einerseits haben wir in der Bioinformatik oftmals mit komplex strukturierten Objekten zu tun, die noch dazu untereinander in Beziehung stehen. Daher fokussieren wir im ersten Teil auf Techniken der Induktiven Logischen Programmierung und des Relationalen Data Mining. Andererseits sind biologische Daten haeufig mit Mess- oder Eingabefehlern behaftet, wodurch probabilistische Verfahren notwendig werden. Folglich behandeln wir in der Vorlesung eine Reihe solcher Methoden: Bayes'sche Netze, HMMs und Ensembles (Bagging, Boosting, Stacking, Random Forests, etc). Optional werden in der Veranstaltung weitere ausgewaehlte Kapitel wie Transduktion und Co-Training diskutiert.

Die Teilnahme an der Vorlesung Maschinelles Lernen und Data Mining in der Bioinformatik in Sommersemester 2003 ist nicht Voraussetzung für die Teilnahme an dieser Veranstaltung