|
|
![]()
| Vorlesung | Übungen | |
| SWS | 4 | 2 |
| Credits | 4 | 4 |
| Raum | Takustr.9 SR 005 |
MPI-MG Ihnestrasse 63-73 PC Pool 3. Stock |
| Dozent | Rainer Spang |
Claudio Lottaz Utz Pape Stefan Bentink Jochen Jäger |
| Neu + wichtig |
| Beschreibung |
Die Vorlesung gibt eine Einführung in die statistische Analyse genomischer Daten. Neben der Entwicklung theoretischer Grundlagen steht vor allem der praktische Umgang mit realen Daten im Vordergrund. Hierzu wird von Beginn an das Auswerten von Datensätzen aus der Bioinformatik mit der statistischen Software R demonstriert und geübt.
| Termine |
| Vorlesung ab 12.4.05 | |||
| DI | 8:30 - 10:00 (st) | ||
| DO | 8:30 - 10:00 (st) | ||
| Abschlussklausur 20.7.05 | MI | 8:30 - 10:00 (st) |
| Übungen (Start am 21.04.05) | |||
| 1. Übungsgruppe (Utz Pape) Ort: FU, Arnimalle 3 | MO | 08:00 - 10:00 [Teilnehmerliste (Matr.-Nr.)] | |
| 2. Übungsgruppe (Jochen Jäger) Ort: MPI, Ihnestr. 73 | DO | 10:00 - 12:00 [Teilnehmerliste (Matr.-Nr.)] | |
| 3. Übungsgruppe (Stefan Bentink) Ort: MPI, Ihnestr. 73 | FR | 10:00 - 12:00 [Teilnehmerliste (Matr.-Nr.)] | |
| Schriftliche Tests zu den Übungen | |||
| (1) 12.5.05 | DO | zu Beginn der Vorlesung | |
| (2) 14.6.05 | DI | zu Beginn der Vorlesung | |
| Abgabe der Projektarbeiten | |||
| (1) 31.5.05 | DI | ||
| (2) 28.6.05 | DI |
| Programm der Vorlesung |
| Kapitel | Thema | Statistik |
| 1 | Shakespeare, Goethe und das Genom | Relative Häufigkeiten |
| 2 | Einführung in R | |
| 3 | Erweiterungen von R | |
| 4 | Der vierseitige DNA Würfel | Zufallsexperimente |
| 5 | G-Protein gekoppelte Rezeptoren | Mittelwert und Streuung |
| 6 | Computerproteine | Zufallsvariablen |
| 7 | Splice-Stellen | Likelihood |
| 8 | Globine in Menschen und Ratten | |
| 9 | Mehr über konservierte Sequenzen | |
| 10 | Genexpressionsmessung | |
| 11 | Lokale Sequenzähnlichkeit | |
| 12 | Datenbanksuche mit BLAST | |
| 13 | Molekulare Eigenschaften des Brustkrebs | Schätzen |
| 14 | Diagnostische Markergene | Klassifikation |
| 15 | Diagnostische Signaturen | Klassifikation |
| 16 | Microarrays | Klassifikation |
| Übungsschein |
Übungszettel und Material zu den Übungen finden Sie hier.
| Vorlesungsschein |
| *Krankheit ausgenommen. Diese muss jedoch durch ein ärztliches Attest nachgewiesen werden. |
| Programmieren in R |
Wir werden sowohl in der Vorlesung als auch in den Übungen und Hausaufgaben die Programmiersprache R verwenden. R ist sowohl Programmiersprache als auch ein statistisches Programmpaket inklusive vieler Routinen zur Datenvisualisierung. Sie können R kostenlos von http://www.r-project.org/ erhalten und auf Ihrem Rechner installieren.
Nicht nur die Software, auch die Handbücher und Tutorials sind umsonst: An Introduction to R ist auf 100 Seiten die offizielle Einführung in die Sprache R. Wer lieber auf deutsch liest, sollte in Günther Sawitzkis Einführung in S schauen (R = Gnu S). Bücher zu R gibt es auch, besonders empfehlenswert ist: Peter Dalgaard, Introductory Statistics with R, Springer 2002.
| Literatur |
Die Folien aus der Vorlesung werden auf dieser Webseite abgelegt. Ein Skript gibt es nicht.
Allgemeine Lehrbücher der Statistik sind viele geschrieben worden, aber keines, das der Ausrichtung dieser Vorlesung entspricht. Trotzdem gibt es natürlich viel Literatur, die Sie begleitend zur Vorlesung lesen können, um so Statistik noch einmal aus einem anderen Blickwinkel erklärt zu bekommen. Sie sollten selbst in die Bibliothek stöbern gehen und sehen was Ihnen am besten gefällt. Trotzdem einige Empfehlungen:
- Motivation -
Martin Vingron
Bioinformatics needs to adopt statistical thinking
Bioinformatics, Vol.17 Nr.5 2001, pages 389-390 [PDF]
- Einführende Literatur -
Bernhard Klar
Datenanalyse und Graphik mit R
Werner A. Stahel
Statistische Datenanalyse - Eine Einführung für Naturwissenschaftler
Vieweg
Empfehlenswertes deutschsprachiges Lehrbuch. Deckt den Großteil der Vorlesungsinhalte gut ab.
Freedman, Pisani, Purves
Statistics
W.W. Norton
Ein Klassiker. Dieses Buch ist auf elementarsten mathematischen Niveau und gibt trotzdem eine sehr tief gehende Einführung in statistisches Denken. Für jeden verständlich und für niemanden langweilig. Wer sich vor englischen Büchern nicht scheut, sollte dieses lesen.
Donald A Berry
Statistics. A Bayesian Perspective
Wadsworth
Genauso elementar wie Freedman, Pisani, Purves aber aus einem völlig anderen Blickwinkel geschrieben gibt dieses Buch eine leicht verständliche Einführung in die Statistik der Bayesschen Schule.
- Weiterführende Literatur -
Deborah Nolan, Terry Speed
Stat Labs
Springer Texts in Statistics
Dieses englische Buch ist ähnlich aufgebaut wie die Vorlesung. Jedes Thema wird anhand eines praktischen Datenanalyseproblems eingeführt. Die Beispiele stammen meist nicht aus der Bioinformatik. Die Auswahl der statistischen Inhalte ist auch nicht auf einen Bioinformatikstudiengang ausgerichtet und sind im Durchschnitt schwieriger als in der Vorlesung. Trotzdem eines der schönsten Statistikbücher auf dem Markt.
Warren J. Ewens, Gregory R. Grant
Statistical Methods in Bioinformatics
Springer
Das unseres Wissens nach einzige Statistikbuch, das sich direkt an Bioinformatiker richtet. Setzt aber weit mehr Mathematik voraus als die Vorlesung. Ideal für alle, die sich in der Vorlesung unterfordert fühlen.
Bernard W. Lindgren
Statistical Theory
Chapman and Hall
Ein klassisches Statistik-Buch für Statistiker. Wer immer noch Langeweile hat ...
| Links |
Homepage der Gruppe Computational Diagnostics der Abteilung Computational Molecular Biology am Max-Planck-Institut für Molekulare Genetik.
Der Studiengang Bioinformatik an der FU Berlin.