
Genomische Datenanalyse SoSe2005
Übungen
Hier finden Sie die in den Übungsgruppen behandelten
Themen, die ausgeteilten Zettel und weiteres Material.
Projekte
Projekt 1: Sequenzanalyse
- Ausgabe: 17. Mai 2005
- Abgabe: 31. Mai 2005
- Projektbeschreibung
- Daten und Packages zum Projekt
-
Das Biostrings Package von Bioconductor ist für dieses
Projekt sehr nützlich. Es ist unabhängig von
übrigen Bioconductor Packages und kann deshalb isoliert
installiert werden. Wir haben Versionen zur Installation
unter Linux und unter Windows
bereit gelegt. Auf Linux Rechnern können Sie Packages
auch lokal installieren:
% R CMD INSTALL -l ~/lib/R Biostrings_1.0.0.tar.gz
Dann installiert R in lib/R in Ihrem
Home-Verzeichnis und Sie brauchen keine Schreibrechte auf der
globalen Installation von R. Ein so installiertes Package
müssen Sie in R wie folgt aufrufen:
> library(Biostrings, lib.loc="~/lib/R")
Unter Windows können Sie die Option "Install from local
zip files..." aus dem "Package" Menu benutzen.
Projekt 2: Microarray Datenanalyse
Klausuren zu den Übungen
Erste Klausur zu den Übungen
- Datum: 12. Mai 2005
- Stoff: Übungsblätter 1 bis 3
- Resultate der Klausur
Die Gesamtnote des Übungsscheins setzt sich aus dem Notenmittel der beiden
Übungsklausuren zusammen. Um die beiden
Übungsklausuren fairer mitteln zu können haben wir ausnahmsweise
auch die Zwischennoten 4.3 und 4.7 zugelassen. In der Gesamtnote
wird es jedoch nur 1.0-4.0 als bestanden und 5.0 als nicht
bestanden geben.
Zweite Klausur zu den Übungen
- Datum: 14. Juni 2005
- Stoff: Projekt 1 und Übungsblätter 4 bis 8 inklusive
Zusatz über lineare Algebra
-
Resultate der zweiten Klausur
zu den Übungen sind jetzt online. Wer insgesamt
durchgefallen ist, kann nicht zur Klausur zur Vorlesung
antreten. Dafür gilt man aber auch nicht als angemeldet zur
Vorlesung, also gibt es keine zwei, sondern nur einen Malus-Punkt.
Übungen
Übungsblatt 1
- Ausgabe: 14. April 2005
- Besprechung: ab 21. April 2005
- Übungszettel
-
Eine wichtige Bemerkung zur Bilder-Reproduktion: Leider haben
wir nicht mehr die Original-Daten auf denen die Bilder basieren,
daher wird es passieren, dass die erzeugten Plots nicht
identisch, sondern nur sehr ähnlich aussehen
werden. Ausserdem genügt es, die Bilder, die auf den
Goethe-Shakespeare Daten beruhen, zu reproduzieren.
- Einführung in R [ pdf ]
- Präsentation von der
ersten Vorlesungsstunde
- Daten für die Bilder
Reproduktion. Entpacken z.B. mit tar xvf data.tar
- Code zum Einlesen der
Daten. Es genügt, sich die beiden Funktionen
access.data() und do.something(vpoem)
anzuschauen. Die eigentliche Routine zum Einlesen der Daten
repro.data(spath) musst Du nicht verstehen, um die
Aufgabe zu erfüllen.
- Hier noch eine andere Möglichkeit, die Daten direkt aus dem Netz in R zu laden:
loadURL("http://lectures.molgen.mpg.de/statistik/material/1/Gedichte.rdat")
Übungsblatt 2
- Ausgabe: 21. April 2005
- Besprechung: ab 28. April 2005
- Übungszettel 2 und
Übungszettel 2b
-
Damit das Skript getNCBI funktioniert muss in R das package Biostrings
installiert sein (dazu z.B. in R folgenden Befehl eingeben:
install.packages(Biostrings,CRAN=getOption("BIOC"))).
Übungsblatt 3
Übungsblatt 4
- Ausgabe: 5. Mai 2005
- Besprechung: ab 12. Mai 2005
- Übungszettel 4
-
Hinweis für Windows Benutzer: loadURL funktioniert
nur, wenn mode="wb" angegeben wird. z.B.
>
loadURL("http://lectures.molgen.mpg.de/statistik/material/4/datenUe4.rda", mode="wb")
Übungsblatt 5
Übungsblatt 6
Übungsblatt 7
Übungsblatt 8
Übungsblatt 9
Übungsblatt 10
Übungsblatt 11
- Ausgabe: 23. Juni 2005
- Besprechung: ab 30. Juni 2005
- Musterlösung kommt am Montag 4. Juli online
Repetitorium
- Besprechung: ab 7. Juli 2005