Bioinformatik: The Next Generation Prof. Dr. Caroline Friedel Lehr- und Forschungseinheit Bioinformatik
Was ist Bioinformatik? Theoretische und Praktische Informatik Statistik, Mathematik Molekularbiologie, Biochemie, Genetik, Evolutionsbiologie, … „Die Bioinformatik ist eine interdisziplinäre Wissenschaft, die Probleme aus den Lebenswissenschaften mit theoretischen computergestützten Methoden löst“ Wikipedia
Informatik → Methoden: • Algorithmen • Theoretische Informatik • Datenbanken • Softwareentwicklung Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
Biologie → Anwendungen: • Genomsequenzierung • Genexpressionsanalyse • Biologische Netzwerke • … 2
Der Klassiker: Sequenzsuche CATTATCTGTTTTTGCTATTAATGTCATACCTGCTATTCAGACAAATCAATTTGCTCTCTTAATAAAGGATG AGCTTCCTGTAGCTTTTTGTAGCTGGGCCAGTTTAGATCTGGAATGTGAGGTAAAATATATAAATGAT
• BLAST= Basic Local Alignment Search Tool
Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
3
Der Anfang der Bioinformatik • Erste Anwendungen: – Gen- und Proteindatenbanken, Proteinstrukturen, etc. – Sequenzanalyse und -vergleiche • Der Durchbruch: – Genomsequenzierung – Shotgun sequencing – Assemblierung notwendig – Menschliches Genom (Celera) • > 27 Mio Reads (~550 bp) • > 20.000 CPU Stunden • 300 Mio $ Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
4
Was noch? •
Gen-Vorhersage und Annotation
•
Analyse der GenomStruktur und Evolution
• Proteinfunktion: Vorhersage und Analyse
Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
5
15./16. Februar 2001: Die ersten Drafts
Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
6
Nach dem Genom • Ursprüngliche Hoffnung: Genomsequenz verbessert Verständnis von – Menschlicher Evolution – Ursachen von Krankheiten – Wechselspiel zwischen Umwelt und Vererbung
• Stattdessen eher nur mehr Fragen – Viel weniger Gene als erwartet: ~20,000 anstatt > 100,000 – 96-99% Ähnlichkeit zwischen Mensch und Schimpanse. Woher kommt der Unterschied ? – Nur wenige Krankheiten durch einzelne Mutationen und Gene verursacht
• Komplexität durch Interaktion zwischen Genom und Umwelt Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
7
Nach dem Genom
Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
8
Nach dem Genom – Die Ära der Omics • • • • • • • •
Omics = Genomweite Studien Genomics = Alles was es im Genom gibt Transcriptomics = Alle Transkripte / mRNA Proteomics = Alle Proteine Interactomics = Alle Interaktionen Metabolomics = Alle Metabolite Kinomics = Alle Kinasen …
Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
9
Next-Generation-Sequencing: Das Comeback der Sequenzierung • Schnell und einfach zu bedienen • Hoher Durchsatz • ⇒Sequenzieren wird immer billiger
Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
10
Genome über Genome • Eukaryoten: 1842 (2015) • Prokaryoten: 30684 (2015) • Viren: 4465 (2015)
Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
11
Genome über Genome
2504
Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
12
Next-Generation-Sequencing: Das Comeback der Sequenzierung • Nicht mehr nur Genom-Sequenzierung sondern auch – RNA-Sequenzierung (RNA-seq) – ChIP-seq – DNase-seq – Ribsome profiling – …
Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
13
Beispiel-Fragestellung: RNA Sequenzierung (RNA-seq) Eingabe: Kurze SequenzierReads Alignment gegen das Genom
Welche mRNAs gibt es?
Wie häufig sind sie?
Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
14
ENCODE • The ENCODE Project: ENCyclopedia Of DNA Elements
Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
15
ENCODE
Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
16
Big Data • • • •
1,600 Arten von Experimenten 147 Gewebearten >15 Billionen Bytes Rohdaten = 15 Terabyte >300 Computerjahre für die Analyse
Datenmenge pro Run Dauer Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
17
Next-Generation-Sequencing: Das Comeback der Bioinformatik
Ohne Bioinformatik geht in der (experimentellen) Biologie nichts mehr Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
18
Wofür braucht man Bioinformatik ? • Datenverwaltung – Speichern – Indizieren – Integration
Datenbanken
• Datenverarbeitung – z.B. Assemblierung – Read-Mapping – Normalisierung
• Analyse und Interpretation Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
Software / Webserver Biologische Erkenntnisse 19
Ziel: Von Daten zur Systembiologie • Möglichst vollständige Beschreibung eines biologischen Systems Detailgrad
Größe des Systems Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
20
Arbeitsfeld Biologie
Informatik
Softwareentwicklung Datenbanken Entwicklung neuer Methoden Anwendung: Verwendung existierender Methoden Experimentelle Arbeit mit bioinformatischer Unterstützung Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
21
Jobaussichten • Wissenschaft • Biotechnologie-Unternehmen: – Illumina, Applied Biosystems, Affymetrix, Eurofins, etc.
• Pharmazeutische Forschung: – Boehringer-Ingelheim, Bayer Schering, Roche, etc.
• Softwareentwicklung – Genomatix, Biomax, etc.
• Unternehmensberatung Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
22
Studienplan Bioinformatik Bachelor Informatik
Mathematik, Bioinformatik Statistik
Biologie, (Bio)chemie
1 Programmierung
Analysis
Einführung in die Bioinformatik I
Chemie Biologie
2 Algorithmik
Logik & Diskrete Strukturen
Einführung in die Bioinformatik II Problem-Based Learning
Biologie Biochemie Grundlagen
Problem-Based Learning Programmier-Praktikum
Biochemie Grundlagen
Stochastik & Algorithm. Bioinformatik I Statistik
Fortgeschr. Biochemie
3 Datenbanken Lineare Algebra 4 Theoretische Informatik 5
Algorithm. Bioinformatik II Praktikum
6
Weiterf. Bioinfo., Prakt. Arbeit & Bachelorarbeit
Wahlpflichtveranstaltungen
Praktikum
23
Zulassung • Eignungsfeststellungsverfahren (EFV) • Bewerbung bis zum 15. Juli – – – –
Ausgefüllter Bewerbungsbogen (online) kurzer tabellarischer Lebenslauf Kopie des Abiturzeugnisses Kurzaufsatz, warum man Bioinformatik studieren will
• Auswertung – Abiturnote – Besonders Fächer: Mathematik, Biologie, Informatik, Chemie, Physik, Deutsch, Englisch ⇒ Annahme oder Auswahlgespräch
• Auswahlgespräch – Bewertung: Abiturnote und Ergebnis des Auswahlgesprächs Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
24
Annahmequoten Beworben Angenommen
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015
180 160 140 120 100 80 60 40 20 0
Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
25
Professoren Lehrstühle Zimmer
Professoren für Bioinformatik
Assoziierte Gruppen
Heun
Friedel
Antes
Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
Mewes
Frishman
Metzler
Rost
N.N. Gagneur
Theis 26
Standorte
Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
27
Standorte
Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
28
Studierende 300
Master
Bachelor
Diplom
250 200 150 100
0
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015
50
Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
29
Weitere Informationen • Web-Seite zum gemeinsamen Studiengang: – www.bioinformatik-muenchen.de/
• Web-Seite zum EFV mit Formularen: – https://www.bio.ifi.lmu.de/studium/studiengaenge_bioinformatik/
• Fachschaft Bioinformatik: – www.bioinformatik-muenchen.com/
• Facebook-Seite – http://www.facebook.com/Bioinformatik.Muenchen
• Informationsstand: HS A 120
Noch Fragen ? Prof. Dr. Caroline Friedel, Tag der offenen Tür der LMU
30