Übungszettel 1
Abgabe: 30. Oktober
Technologie
1. Welche Verfahren zum Messen der Genexpression
kennen Sie (mindestens 5)? Nennen Sie Vor- und Nachteile.
2. Nennen Sie technische Einflussfaktoren, die
Messwerte verfälschen können.
3. Planen Sie ein Experiment, mit dem die exakte
Molekülanzahl bzw. –konzentration einer bestimmten mRNA-Spezies pro
Zelle bestimmt werden kann. Welchen Voraussetzungen muss Ihre
Messapparatur dafür genügen? Achtung:
Die meisten Messverfahren liefern eine komplexe Abbildung der
Molekülzahl auf eine Signalintensität. Diese Abbildung ist von vielen
technischen Einflussgrössen abhängig, unter anderem von der Basenfolge
der mRNA.
Beschreibende Statistik, visuelle
Datenanalyse
- Anpassen von Verteilungen an Daten
- Beschreiben Sie das Ziel von Anpassungen mit eigenen
Worten. Was gewinnt man, wenn sich die Daten näherungsweise einer
bekannten Verteilung (z.B. der Normalverteilung) gehorchen?
- Fitten Sie beispielhaft Verteilungen an Daten (Hinweise) und visualisieren Sie das Ergebnis
(R-Funktionen: hist, qqplot)
- Wie lässt sich die Güte der Anpassung mathematisch
beschreiben?
- *Was sagt der Kolmogorov-Smirnov-Test in diesem
Zusammenhang aus und warum schlägt er bei Microarray-Daten fehl?
- Datenanalyse von cDNA-Microarrays
- Arbeiten Sie Punkt 1-3 des Aufgabenblattes „Exploring
cDNA data“ ab. (Hinweise)
- Stellen Sie die Daten ausgewählter Arrays in
unterschiedlicher Art und Weise dar. Nutzen und verfeinern Sie die
R-Funktionen plot, boxplot, hist, ecdf {library(stepfun)}, qqplot,
pairs. Können Sie Artefakte ausmachen?
- Vergleichen Sie die Rohintensitäten (CH1I, CH2I) und
die hintergrundkorrigierten Werte (CH1D := CH1I-CH1B, CH2D :=
CH2I-CH2B). Berechnen Sie auch die sogenannten LogRatios
(log(CH1D/CH2D) Beschreiben Sie Ihre Beobachtungen und belegen Sie
diese durch geeignete Graphiken.
Wieviel Zeit haben Sie
für die Lösung des Übungszettels aufgewendet?
Hinweise
zu 1.b) Es
sollen einige Beispiele nachvollzogen bzw. konstruiert werden. Nachdem
Sie R gestartet haben, gehen Sie so vor:
>library(MASS)
>help.start()
Suchen Sie nach der Dokumentation für die Funktion
fitdistr. Probieren Sie die
angegebenen Beispiele aus und modifizieren Sie diese.
...
>x <- rgamma(100, shape = 5, rate = 0.1)
## "rgamma" zieht zufällig 100 Zahlen aus einer Gamma-Verteilung
>fitdistr(x, "gamma")
## Die Zufallsziehung wird an die theoretische Gamma-Verteilung angepasst.
zu 2.a) Zum
Bearbeiten dieser Aufgabe brauchen Sie die R-Software (Version 1.7.1),
R-Packete Bioconductor und arrayMagic und schliesslich einen
eingeschränkten Datensatz von Arrayexperimenten.
- Wenn Sie die Aufgaben am MPI lösen, sind alle benötigten Packete
installiert. Die Daten finden Sie unter
"/home/cmb/lectures/htdocs/Microarray_WS0304/lymphoma/data"
- Wollen Sie die Aufgaben an einem anderen Ort lösen, müssen Sie
sich R und die Packete Bioconductor und arrayMagic installieren.
- Laden Sie die Dateien runter und folgen Sie den
Anweisungen des Manuals
(add-on-packages, installing packages).
- Der Pfad für die installierten Packete kann in einer Datei
namens "~/.Renviron" mit folgender Zeile gesetzt werden:
"R_LIBS=/.../your_library_directory/".
- Die Daten erhalten Sie hier
(entpacken mit 'gunzip' und 'gtar xvf'). Anschliessend sollten die
Dateien unter ../lymphoma/data zu finden sein.