Computational Diagnostics Group compdiag MPI for Molecular Genetics
 

Genomische Datenanalyse SoSe2005

19 701 Einführung in die Statistik für Bioinformatiker

Vorlesung Übungen
SWS 4 2
Credits 4 4
Raum Takustr.9
SR 005
MPI-MG
Ihnestrasse 63-73
PC Pool 3. Stock
Dozent Rainer Spang Claudio Lottaz
Utz Pape
Stefan Bentink
Jochen Jäger

Neu + wichtig

Beschreibung

Die Vorlesung gibt eine Einführung in die statistische Analyse genomischer Daten. Neben der Entwicklung theoretischer Grundlagen steht vor allem der praktische Umgang mit realen Daten im Vordergrund. Hierzu wird von Beginn an das Auswerten von Datensätzen aus der Bioinformatik mit der statistischen Software R demonstriert und geübt.

Termine

Vorlesung ab 12.4.05   
  DI8:30 - 10:00 (st)
DO8:30 - 10:00 (st)
Abschlussklausur 20.7.05MI8:30 - 10:00 (st)

Übungen (Start am 21.04.05)   
1. Übungsgruppe (Utz Pape)
Ort: FU, Arnimalle 3
MO08:00 - 10:00 [Teilnehmerliste (Matr.-Nr.)]
2. Übungsgruppe (Jochen Jäger)
Ort: MPI, Ihnestr. 73
DO10:00 - 12:00 [Teilnehmerliste (Matr.-Nr.)]
3. Übungsgruppe (Stefan Bentink)
Ort: MPI, Ihnestr. 73
FR10:00 - 12:00 [Teilnehmerliste (Matr.-Nr.)]
Schriftliche Tests zu den Übungen   
(1) 12.5.05DOzu Beginn der Vorlesung
(2) 14.6.05DIzu Beginn der Vorlesung
Abgabe der Projektarbeiten   
(1) 31.5.05DI
(2) 28.6.05DI

Programm der Vorlesung

Kapitel Thema Statistik
1 Shakespeare, Goethe und das Genom Relative Häufigkeiten
2 Einführung in R
3 Erweiterungen von R
4 Der vierseitige DNA Würfel Zufallsexperimente
5 G-Protein gekoppelte Rezeptoren Mittelwert und Streuung
6 Computerproteine Zufallsvariablen
7 Splice-Stellen Likelihood
8 Globine in Menschen und Ratten
9 Mehr über konservierte Sequenzen
10 Genexpressionsmessung
11 Lokale Sequenzähnlichkeit
12 Datenbanksuche mit BLAST
13 Molekulare Eigenschaften des Brustkrebs Schätzen
14 Diagnostische Markergene Klassifikation
15 Diagnostische Signaturen Klassifikation
16 Microarrays Klassifikation

Übungsschein

Übungszettel und Material zu den Übungen finden Sie hier.

Vorlesungsschein
*Krankheit ausgenommen. Diese muss jedoch durch ein ärztliches Attest nachgewiesen werden.

Programmieren in R

Wir werden sowohl in der Vorlesung als auch in den Übungen und Hausaufgaben die Programmiersprache R verwenden. R ist sowohl Programmiersprache als auch ein statistisches Programmpaket inklusive vieler Routinen zur Datenvisualisierung.  Sie können R kostenlos von http://www.r-project.org/ erhalten und auf Ihrem Rechner installieren.

Nicht nur die Software, auch die Handbücher und Tutorials sind umsonst: An Introduction to R ist auf 100 Seiten die offizielle Einführung in die Sprache R. Wer lieber auf deutsch liest, sollte in Günther Sawitzkis Einführung in S schauen (R = Gnu S). Bücher zu R gibt es auch, besonders empfehlenswert ist: Peter Dalgaard, Introductory Statistics with R, Springer 2002.

Literatur

Die Folien aus der Vorlesung werden auf dieser Webseite abgelegt. Ein Skript gibt es nicht.

Allgemeine Lehrbücher der Statistik sind viele geschrieben worden, aber keines, das der Ausrichtung dieser Vorlesung entspricht. Trotzdem gibt es natürlich viel Literatur, die Sie begleitend zur Vorlesung lesen können, um so Statistik noch einmal aus einem anderen Blickwinkel erklärt zu bekommen. Sie sollten selbst in die Bibliothek stöbern gehen und sehen was Ihnen am besten gefällt. Trotzdem einige Empfehlungen:

- Motivation -

Martin Vingron
Bioinformatics needs to adopt statistical thinking
Bioinformatics, Vol.17 Nr.5 2001, pages 389-390 [PDF]

- Einführende Literatur -

Bernhard Klar
Datenanalyse und Graphik mit R

Werner A. Stahel
Statistische Datenanalyse - Eine Einführung für Naturwissenschaftler
Vieweg

Empfehlenswertes deutschsprachiges Lehrbuch. Deckt den Großteil der Vorlesungsinhalte gut ab.

Freedman, Pisani, Purves
Statistics
W.W. Norton

Ein Klassiker. Dieses Buch ist auf elementarsten mathematischen Niveau und gibt trotzdem eine sehr tief gehende Einführung in statistisches Denken. Für jeden verständlich und für niemanden langweilig. Wer sich vor englischen Büchern nicht scheut, sollte dieses lesen.

Donald A  Berry
Statistics. A Bayesian Perspective
Wadsworth

Genauso elementar wie Freedman, Pisani, Purves aber aus einem völlig anderen Blickwinkel geschrieben gibt dieses Buch eine leicht verständliche Einführung in die Statistik der Bayesschen Schule.

- Weiterführende Literatur -

Deborah Nolan, Terry Speed
Stat Labs
Springer Texts in Statistics

Dieses englische Buch ist ähnlich aufgebaut wie die Vorlesung. Jedes Thema wird anhand eines praktischen Datenanalyseproblems eingeführt. Die Beispiele stammen meist nicht aus der Bioinformatik. Die Auswahl der statistischen Inhalte ist auch nicht auf einen Bioinformatikstudiengang ausgerichtet und sind im Durchschnitt schwieriger als in der Vorlesung. Trotzdem eines der schönsten Statistikbücher auf dem Markt.

Warren J. Ewens, Gregory R. Grant
Statistical Methods in Bioinformatics
Springer

Das unseres Wissens nach einzige Statistikbuch, das sich direkt an Bioinformatiker richtet. Setzt aber weit mehr Mathematik voraus als die Vorlesung. Ideal für alle, die sich in der Vorlesung unterfordert fühlen.

Bernard W. Lindgren
Statistical Theory
Chapman and Hall

Ein klassisches Statistik-Buch für Statistiker. Wer immer noch Langeweile hat ...
Links

Homepage der Gruppe Computational Diagnostics der Abteilung Computational Molecular Biology am Max-Planck-Institut für Molekulare Genetik.

Der Studiengang Bioinformatik an der FU Berlin.

 

Anmerkungen und Fragen zu dieser Seite bitte an Jochen Jäger.
Letzte Änderung: 12. October 2005

Valid HTML 4.0! Valid CSS!