Übungszettel 1

Abgabe: 30. Oktober

 

Technologie

1.     Welche Verfahren zum Messen der Genexpression kennen Sie (mindestens 5)? Nennen Sie Vor- und Nachteile.

2.     Nennen Sie technische Einflussfaktoren, die Messwerte verfälschen können.

3.     Planen Sie ein Experiment, mit dem die exakte Molekülanzahl bzw. –konzentration einer bestimmten mRNA-Spezies pro Zelle bestimmt werden kann. Welchen Voraussetzungen muss Ihre Messapparatur dafür genügen? Achtung: Die meisten Messverfahren liefern eine komplexe Abbildung der Molekülzahl auf eine Signalintensität. Diese Abbildung ist von vielen technischen Einflussgrössen abhängig, unter anderem von der Basenfolge der mRNA.

Beschreibende Statistik, visuelle Datenanalyse

  1. Anpassen von Verteilungen an Daten
    1. Beschreiben Sie das Ziel von Anpassungen mit eigenen Worten. Was gewinnt man, wenn sich die Daten näherungsweise einer bekannten Verteilung (z.B. der Normalverteilung) gehorchen?
    2. Fitten Sie beispielhaft Verteilungen an Daten (Hinweise) und visualisieren Sie das Ergebnis (R-Funktionen: hist, qqplot)
    3. Wie lässt sich die Güte der Anpassung mathematisch beschreiben?
    4. *Was sagt der Kolmogorov-Smirnov-Test in diesem Zusammenhang aus und warum schlägt er bei Microarray-Daten fehl?
  2. Datenanalyse von cDNA-Microarrays
    1. Arbeiten Sie Punkt 1-3 des Aufgabenblattes „Exploring cDNA data“ ab. (Hinweise)
    2. Stellen Sie die Daten ausgewählter Arrays in unterschiedlicher Art und Weise dar. Nutzen und verfeinern Sie die R-Funktionen plot, boxplot, hist, ecdf {library(stepfun)}, qqplot, pairs. Können Sie Artefakte ausmachen?
    3. Vergleichen Sie die Rohintensitäten (CH1I, CH2I) und die hintergrundkorrigierten Werte (CH1D := CH1I-CH1B, CH2D := CH2I-CH2B). Berechnen Sie auch die sogenannten LogRatios (log(CH1D/CH2D) Beschreiben Sie Ihre Beobachtungen und belegen Sie diese durch geeignete Graphiken.

 

Wieviel Zeit haben Sie für die Lösung des Übungszettels aufgewendet?

Hinweise

zu 1.b) Es sollen einige Beispiele nachvollzogen bzw. konstruiert werden. Nachdem Sie R gestartet haben, gehen Sie so vor:
    >library(MASS)
    >help.start() 
Suchen Sie nach der Dokumentation für die Funktion fitdistr. Probieren Sie die angegebenen Beispiele aus und modifizieren Sie diese.
...
>x <- rgamma(100, shape = 5, rate = 0.1)
## "rgamma" zieht zufällig 100 Zahlen aus einer Gamma-Verteilung
>fitdistr(x, "gamma")
## Die Zufallsziehung wird an die theoretische Gamma-Verteilung angepasst.

zu 2.a) Zum Bearbeiten dieser Aufgabe brauchen Sie die R-Software (Version 1.7.1), R-Packete Bioconductor und arrayMagic und schliesslich einen eingeschränkten Datensatz von Arrayexperimenten.
  1. Wenn Sie die Aufgaben am MPI lösen, sind alle benötigten Packete installiert. Die Daten finden Sie unter "/home/cmb/lectures/htdocs/Microarray_WS0304/lymphoma/data"
  2. Wollen Sie die Aufgaben an einem anderen Ort lösen, müssen Sie sich R und die Packete Bioconductor und arrayMagic installieren.
    1. Laden Sie die Dateien runter und folgen Sie den Anweisungen  des Manuals (add-on-packages, installing packages). 
    2. Der Pfad für die installierten Packete kann in einer Datei namens "~/.Renviron" mit folgender Zeile gesetzt werden: "R_LIBS=/.../your_library_directory/".
    3. Die Daten erhalten Sie hier (entpacken mit 'gunzip' und 'gtar xvf'). Anschliessend sollten die Dateien unter ../lymphoma/data zu finden sein.