Gibt es zwei Klassen von Promotoren? Are there two classes of promoters?

Jahrbuch 2013/2014 | Vingron, Martin | Gibt es zw ei Klassen von Promotoren? Gibt es zwei Klassen von Promotoren? Are there two classes of promoters?...
8 downloads 2 Views 172KB Size
Jahrbuch 2013/2014 | Vingron, Martin | Gibt es zw ei Klassen von Promotoren?

Gibt es zwei Klassen von Promotoren? Are there two classes of promoters? Vingron, Martin Max-Planck-Institut für molekulare Genetik, Berlin Korrespondierender Autor E-Mail: [email protected]

Zusammenfassung Analysen der Sequenz von humanen Genen und deren Promotorsequenzen w eisen auf zw ei unterschiedliche Klassen von Promotoren hin. Mit diesen zw ei Klassen geht eine Reihe von Eigenschaften einher, die nahelegen, dass auch die Regulation der jew eiligen Promotoren entsprechende Unterschiede aufw eist. In diesem Artikel w erden die Sequenzeigenschaften und Merkmale der jew eiligen Klasse dargestellt. W ir zeigen, w ie mathematische Zusammenhänge, die man in den gesamtgenomischen Daten erkennen kann, auf biologische Mechanismen hinw eisen können.

Summary A mathematical analysis of human gene promoter sequences show s that these promoters fall into tw o distinct classes. A number of features correlate w ith these tw o classes, suggesting that this distinction is actually a reflection of different regulatory mechanisms. This article summarizes sequence features and biological properties specific for the promoters of the tw o classes. We explain how a mathematical analysis of w holegenome data could point tow ards particular biological mechanisms.

Einleitung Nachdem über viele Jahre das Interesse der Genomforschung auf der Bestimmung der Gene gelegen hat, rückte im letzten Jahrzehnt die Frage in den Mittelpunkt, w ie w elches Gen zu einem bestimmten Zeitpunkt oder unter bestimmten Bedingungen an- oder abgeschaltet w ird. Diese Kontrollebene w ird als Genregulation bezeichnet. Sie ist verantw ortlich dafür, dass in den verschiedenen Zellen eines Organismus unterschiedliche Proteine erzeugt w erden oder dass eine bestimmte Zelle zu unterschiedlichen Zeiten unterschiedliche Proteine erzeugt, um zum Beispiel auf eine Infektion mit einer Immunantw ort zu reagieren. Die Information, w ann w elches Gen exprimiert, das heißt, in ein Protein übersetzt w erden soll, ist bis zu einem gew issen Grad in der Buchstabenfolge des Genoms kodiert – allerdings nicht in der systematischen Art und Weise, in der die Proteine durch den genetischen Code definiert w erden. Das An- oder Abschalten von Genen geschieht durch sogenannte Transkriptionsfaktoren. Dies sind ebenfalls Proteine, die an die DNA unter anderem vor dem zu regulierendem Gen andocken und dessen Expression aktivieren oder unterdrücken © 2014 Max-Planck-Gesellschaft

w w w .mpg.de

1/5

Jahrbuch 2013/2014 | Vingron, Martin | Gibt es zw ei Klassen von Promotoren? können. In dem Forschungsbericht "Untersuchung von Bindungsstellen zur Aktivierung von Genen" für das Jahrbuch der Max-Planck-Gesellschaft 2005 w urde die Funktionsw eise der Transkriptionsfaktoren beschrieben [1]. Diejenigen Bereiche im Genom, in denen sich die Bindungsstellen der Transkriptionsfaktoren hauptsächlich befinden, w erden als Promotoren und Enhancer bezeichnet. Promotoren liegen nahe am Beginn eines Gens und kontrollieren es genau. Enhancer sind in ihrer Position zum regulierten Gen frei und können unter Umständen bis zu einer Million Basenpaaren entfernt liegen. Häufig befinden sich sogar noch andere Gene zw ischen einem Enhancer und dem von ihm kontrollierten Gen. Der Beitrag im diesjährigen Jahrbuch konzentriert sich auf die Promotoren im menschlichen Genom. In der Literatur w erden im Allgemeinen zw ei mögliche Charakteristika der Promotoren betont. Zum einen gibt es das TATA-binding protein (TBP), das an viele dieser Promotoren bindet. Sie verfügen alle über einen bestimmten Sequenzabschnitt, die TATA-Box – eine Abfolge der Basenpaare TATA -, an die TBP bindet. Ein anderes Charakteristikum vieler humaner Promotoren ist die sogenannte CpG-Insel (CpG island, CGI). Sie bezeichnet einen Sequenzbereich, in dem die Basenpaarfolge CG signifikant häufiger vorkommt als in anderen Bereichen der DNA. Das humane Genom nutzt dieses Dinukleotid eigentlich selten, sodass eine Häufung von CG-Abfolgen statistisch hervorsticht. Das „p“ in CpG betont die Phosphatbindung zw ischen den Basen, um eine Verw echslung mit der komplementären Abfolge GC auszuschließen.

Promotoren unterscheiden sich im CpG-Gehalt Abbildung 1 zeigt ein Histogramm mit der Dichte an CpGs in den Sequenzen der menschlichen Promotoren. Man w ürde erw arten, dass die Dichte an CpGs um einen Mittelw ert gleichmäßig variiert. Statt dessen sieht man zw ei Klassen von Promotoren, nämlich solche mit einer hohen Dichte an CpGs und solche mit niedrigem Gehalt an CpGs [2]. Diese Beobachtung w irft eine Reihe von Fragen auf, vor allem die nach den regulatorischen

Mechanismen

in

den

beiden

Klassen

von

Promotoren.

Funktionieren

die

beiden

Promotorklassen nach dem gleichen Muster oder gibt es unterschiedliche regulatorische Mechanismen?

A bb. 1: Histogra m m de r C pG-Dichte in m e nschliche n P rom otore n. LCP: Low C pG P rom otore n, HCP: High C pG P rom otore n. © Ma x -P la nck -Institut für m ole k ula re Ge ne tik /R oide r

Es gibt eine Reihe w eiterer Eigenschaften von Genen und Promotoren, die mit der gezeigten Zw eiteilung der Promotoren einhergehen. Zuerst ist festzustellen, dass die High-CpG-Promotoren (HCPs) genau jene Promotoren sind, die über eine CpG-Insel verfügen. Umgekehrt haben viele der Low -CpG-Promotoren (LCPs) eine TATA-Box-Bindungsstelle. Die TATA-Box gilt allgemein als ein Kennzeichen von gew ebespezifisch © 2014 Max-Planck-Gesellschaft

w w w .mpg.de

2/5

Jahrbuch 2013/2014 | Vingron, Martin | Gibt es zw ei Klassen von Promotoren? exprimierten Genen. Abbildung 2 zeigt das Auftreten einer TATA-Box in den Promotoren von Genen mit LCPPromotoren, die in verschiedenen Gew eben exprimiert w erden [3]. Die Höhe der Balken symbolisiert die Häufigkeit der vorhergesagten TATA-Box. Die rechte ebene Dimension zeigt die Sequenz in der Umgebung des Startpunkts der Transkription, also den Übergang vom Promoter in den kodierenden Bereich des betreffenden Gens.

Negative

Zahlen

beziehen

sich

auf

den

DNA-Bereich

vor

dem

Gen,

TSS

bezeichnet

den

Transkriptionsstart und positive Zahlen bezeichnen Positionen in bereits kodierenden Regionen des Gens. Auf der linken Achse sind diejenigen Gew ebe benannt, für die Gene beziehungsw eise Promotoren ausgew ählt und analysiert w urden. Zum Beispiel sieht man bei Genen, die in der Lunge exprimiert w erden, unmittelbar vor dem Transkriptionsstart einen hohen gelben Balken, also eine klare Präferenz für eine TATA-Box an dieser Stelle in diesen Genen. Die Abbildung insgesamt illustriert die Bedeutung der TATA-Box bei der Regulation von gew ebespezifisch

exprimierten

LCP

Genen.

Die

gleiche

Analyse

für

HCP-Gene,

auch

w enn

diese

gew ebespezifisch exprimiert sind, zeigt ein w eitaus schw ächeres Signal.

A bb. 2: Ausprä gung de s TATA-Box Motivs in hum a ne n P rom otore n m it nie drige m C pG-Ge ha lt, a ufge te ilt na ch de m je nige n Ge we be , in de m da s je we ilige Ge n e x prim ie rt wird (we ite re Erk lä runge n sie he Te x t). © Ma x -P la nck -Institut für m ole k ula re Ge ne tik , m odifizie rt na ch [3]

Gewebespezifische Regulation Neben der TATA-Box mit ihrem Bindungsprotein TBP gibt es zahlreiche w eitere sequenzspezifisch bindende Transkriptionsfaktoren. Als ein Beispiel sei hier MEF2 erw ähnt, der eine w ichtige Rolle bei der Regulation der Gene in Muskulatur und im Herzmuskelgew ebe spielt. Abbildung 3 zeigt in gleicher Weise w ie Abbildung 2 die Prominenz der MEF2-Bindungsstellen in LCP-Genen verschiedener Gew ebe. Man sieht, dass nur diejenigen Gene, die nachw eislich in Muskulatur oder Herzmuskelgew ebe exprimiert w erden, die MEF2-Bindungsstelle enthalten. W ird

die

entsprechende

Analyse

bei HCP-Genen

durchgeführt, fehlt

grundsätzlich

diese

Bindungsstelle und es gibt dementsprechend keinen Unterschied zw ischen ihrem Auftreten in denjenigen Genen, die in verschiedenen Gew eben exprimiert sind.

© 2014 Max-Planck-Gesellschaft

w w w .mpg.de

3/5

Jahrbuch 2013/2014 | Vingron, Martin | Gibt es zw ei Klassen von Promotoren?

A bb. 3: Ausprä gung de s Bindungsm otivs de s Tra nsk riptionsfa k tors MEF2 in hum a ne n P rom otore n m it nie drige m (link s) und hohe m (re chts) C pG-Ge ha lt, a ufge te ilt na ch Ge we be n, in de ne n da s je we ilige Ge n e x prim ie rt wird. © Ma x -P la nck -Institut für m ole k ula re Ge ne tik , m odifizie rt na ch [3]

Epigenetische Regulation Die beschriebenen Beobachtungen deuten auf unterschiedliche Kontrollmechanismen der LCPs und HCPs hin. Unterstützt w ird diese Annahme durch einen Blick auf eine w eitere Ebene der Genregulation. Neben den Sequenzmustern, die von Transkriptionsfaktoren erkannt w erden, gibt es biochemische Markierungen an den sogenannten Histonproteinen, die über w eite Strecken die DNA bedecken. Diese Markierungen können Acetylierungen,

Methylierungen

oder

andere

Modifikationen

sein.

Summarisch

w erden

sie

als

Histonmodifikationen bezeichnet, ihre genaue Beschreibung ergibt sich aus dem betreffenden Histon und der Position und Art der Modifikation (zum Beispiel Histon3-Lysin4-Acetylierung, H3K4ac). Man hat festgestellt, dass die Markierungen mit dem Aktivitätsstatus eines Promotors einhergehen. Daraus folgt, dass aus den Markierungen, die sich in einem Promotor befinden, über mathematische Methoden die Expression eines Gens vorhergesagt w erden kann. Es gibt eine Vielzahl solcher Modifikationen, von denen über 30 entlang des Genoms biochemisch in ihrer Stärke gemessen w urden. Mithilfe eines mathematischen Modells gelang es den Bioinformatikern des MaxPlanck-Instituts für molekulare Genetik zu bestimmen, w elche Modifikationen die meisten Informationen über die Expression der Gene tragen [4]. Wenn aber die Unterscheidung der Promotoren in HCPs und LCPs tatsächlich so fundamental ist, w ie die W issenschaftler meinen, sollte sich diese Zw eiteilung auf der Ebene der Modifikationen w iederfinden. Um dies zu überprüfen, stellten sie das mathematische Modell separat für die beiden Gruppen von Promotoren auf und bestimmten jew eils die informationstragenden Histonmodifikationen. In der Tat konnten sie nachw eisen, dass unterschiedliche Gruppen von Histonmodifikationen mit der Aktivierung in HCPs und LCPs verbunden sind. Dies erhärtet die Annahme, dass die beiden Gruppen von Promotoren unterschiedlich reguliert w erden. Noch sind die regulatorischen Mechanismen zur Expression von Genen nicht vollständig verstanden. Die Forscher der Abteilung Bioinformatik haben aber Hypothesen aufgestellt, w ie sie funktionieren könnten. Von den HCPs ist bekannt, dass die RNA-Polymerase, also jenes Enzym, das für die Transkription zuständig ist, die meiste Zeit am Promoter der HCP-Gene präsent ist - unabhängig davon, ob das Gen transkribiert w ird oder nicht. Bei den LCPs verhält sich die RNA-Polymerase anders. Wenn ein von einem LCP kontrolliertes Gen nicht aktiv ist, befindet sich auch keine RNA-Polymerase an dessen Promoter. Dieser (w eitere) Unterschied lässt vermuten, dass die Kommandos, die zur Aktivierung eines HCP-Gens führen, nur den eigentlichen Start des Transkriptionsvorgangs einleiten. Bei einem LCP-Gen hingegen muss vor der Aktivierung zuerst die Transkriptionsmaschinerie an ihren Einsatzort, den LCP-Promotor, geholt w erden. Dies könnte der Hintergrund © 2014 Max-Planck-Gesellschaft

w w w .mpg.de

4/5

Jahrbuch 2013/2014 | Vingron, Martin | Gibt es zw ei Klassen von Promotoren? für die unterschiedlichen Histonmodifikationen sein. Gleichzeitig nimmt man an, dass HCP-Gene häufig in vielen Gew eben exprimiert w erden - folglich ist bei ihnen die gew ebespezifische Regulation w eniger w ichtig als bei LCPs. Die heute verfügbaren Sequenzdaten zusammen mit einer Vielzahl biochemischer Messungen ermöglichen Analysen w ie die hier beschriebenen. In der Summe lassen sich daraus Hypothesen über biochemische Mechanismen aufstellen oder untermauern, die dann w iederum zu neuen Experimenten und w eiteren Einsichten führen. Diese Form des Studiums der Genregulation w ird regulatory genomics genannt und ist eines der aktuellen und spannendsten Gebiete der Molekulargenetik und Genomforschung.

Literaturhinweise [1] Vingron M. Untersuchung von Bindungsstellen zur Aktivierung von Genen Jahrbuch der Max-Planck-Gesellschaft 2005 [2] Saxonov, S.; Berg, P.; Brutlag, D. L. A genome-wide analysis of CpG dinucleotides in the human genome distinguishes two distinct classes of promoters Proceedings of the National Academy of Sciences USA 103, 1412-1417 (2006) [3] Roider, H. G.; Lenhard, B.; Kanhere, A.; Haas, S. A.; Vingron, M. CpG-depleted promoters harbor tissue-specific transcription factor binding signals - implications for motif overrepresentation analyses Nucleic Acids Research 37, 6305-6315 (2009) [4] Karlić, R.; Chung, H. R.; Lasserre, J.; Vlahovicek, K.; Vingron, M. Histone modification levels are predictive for gene expression Proceedings of the National Academy of Sciences USA 107, 2926-2931 (2010)

© 2014 Max-Planck-Gesellschaft

w w w .mpg.de

5/5

Suggest Documents