Lectures by the Computational Molecular Biology Department at the Max Planck Institute for Molecular Genetics

Analyse von DNA-Microarrays SoSe2004

Softwarepraktikum, Begleitseminar


Softwarepraktikum Seminar
Nr. 19 716 19 717
SWS 4 2
Credits 9 3
Termine Mi. 15 - 16 Uhr Mi. 16:15-17:45
Ort MPI for Molecular Genetics
Ihnestr. 73, 3rd floor
PC-lab, seminar room
Betreuer
Martin Vingron, Holger Klein
Tel. 8413 1151, MPI Raum 347

Softwarepraktikum


Aim:  Developement of software for clustering and visualization of microarray data.
Tools: C (or Python or Java), R
Es kann im PC-Pool des MPI gearbeitet werden. Dort sollten die benötigten Programme installiert sein. Dateien, die Sie gesichert wissen wollen, können sie im Praktikumsverzeichnis /project/sopra04/vingron ablegen. Ansonsten können Sie auch zu Hause oder an der Uni arbeiten. Wichtig ist, dass Sie am Ende ein lauffähiges Programm präsentieren können. Nchfragen zu technischen Details bitte an Stefan Röpcke.

Task

  • Download of the Spellman et al yeast cell cycle data
(http://genome-www.stanford.edu/cellcycle/ and here, in particular, the tab-delimited data)
  • Somebody must give a presentation on the paper and the dataset on Thu, March 22!
  • Write a program to plot the time course for a given set of genes (in R?)
  • Write code in C to cluster the genes:
    • Implement different distance measures (Euclidian, normalized Euclidian, correlation - refer to script from course)
    • Implement different clustering algorithms (k-means, single linkage clustering, possible SOMs)
    • Write code in R to visualize the clusters
    • Compare and interpret (cell cycle!) results from different distance measures and clustering algorithms
    • Each participant must give a short presentation on his/her results
  • Other goodies:
  • Put data in a mysql database and access it from there using R
  • Cluster the clustering results
  • Identify periodically expressed genes
  • Search for upstream DNA motifs among genes in a cluster
  • Apply your methods to other data sets, e.g. human cell cycle (fibroblasts, HeLa cells).


Voraussetzungen:  erfolgreicher Besuch der Vorlesung Algorithmische Bioinformatik, Grundkenntnisse in Statistik


Bearbeitung, Zeitrahmen: Start ist am Mi. 14. April, 16h s.t.
Besprechung jeweils Mittwoch 15h (Ausnahme: statt Mi 21.4. am Do. den 22.4).
Abschlußbesprechung wird am 19. Mai sein.
Abgabe der Ausarbeitungen bis 30. 5.


Benotung: Mindestanforderung ist ein erfolgreich implementierter Clustering-Algorithmus und die Visualisierung der Ergebnisse. Ein Vortrag über die Resultate.
Verbesserung der Note: Qualität und Umfang der geleisteten Arbeit, Hinzunahme von
Goodies.




Begleitseminar
  • Seminarplan
  • Anwesenheit gebietet die Höflichkeit (siehe Scheinkriterien).
  • Die Seminare sollen vorallem dazu dienen, das Vortragen zu lernen. Es besteht die Möglichkeit, den Vortrag mit einer Videokamera aufzunehmen.
  • Die Themen werden bei der Vorbesprechung am 14.4. vergeben.

Literatur

  • Parmigiani G, Garrett ES, Irizarry RA, Zeger SL: "The Analysis of Gene Expression Data", 2003 Springer Verlag New York

Links

Homepage der Abteilung Computational Molecular Biology am Max-Plack-Institut für Molekulare Genetik.

Zum Studiengang Bioinformatik an der FU Berlin.

 

Anmerkungen und Fragen zu dieser Seite bitte an Stefan Röpcke. Letzte Änderung: 25. 3. 2004