Stochastic Hybrid Systems for DNA Replication Modeling

Doctoral Thesis ETH Zürich No. 19049 Stochastic Hybrid Systems for DNA Replication Modeling A dissertation submitted to the ETH Zürich for the degree...
1 downloads 1 Views 71KB Size
Doctoral Thesis ETH Zürich No. 19049

Stochastic Hybrid Systems for DNA Replication Modeling A dissertation submitted to the ETH Zürich for the degree of Doctor of Sciences presented by KONSTANTINOS KOUTROUMPAS Diploma of Electrical and Computer Engineering University of Patras born 01.01.1982 in Athens citizen of Greece accepted on the recommendation of Prof. Dr. John Lygeros, examiner Prof. Dr. Giancarlo Ferrari Trecate , co-examiner Dr. Heinz Köppl, co-examiner 2010

Abstract DNA replication, the process of duplication of the cell’s genetic material, is central to the life of every living cell. To ensure that the cell’s genetic information is maintained, every base of the genome must be replicated once and only once before cell division. In eukaryotic cells, DNA replication initiates from multiple points along the chromosomes, called origins of replication. Following initiation from a given origin, replication continues bi-directionally along the genome, giving rise to two replication forks moving in opposite directions. While in bacteria and some eukaryotes DNA replication is rather predictable, in most eukaryotes it involves considerable uncertainty, both in the location and in the time of activation of the origins. The presence of uncertainty in such a fundamental process is intriguing and raises questions such as why do cells tolerate this uncertainty, how do they regulate it, and how do they ensure that the process is completed in a timely manner despite of it. One of the questions that have attracted considerable attention in this context is the so-called random completion problem, the observation that the randomness inherent in the DNA replication process should imply replication times longer than what conventional experimental wisdom would suggest. An important tool in answering such questions has been the development of mathematical and computational models that capture the dynamics and stochastic phenomena underlying DNA replication. Mathematical modeling of biochemical processes has attracted considerable attention in recent years. Development of mathematical models that describe gene and protein interactions in a precise and unambiguous manner is recognized as one of the major challenges facing the biology research community today. Such mathematical models allow computer-based simulation and analysis of biochemical processes that can be used for rapid verification or falsification of biological hypotheses, replacing in certain cases costly and time-consuming in vitro or in vivo experiments. Moreover, in silico, in vitro and in vivo experiments can be used together in a feedback arrangement: mathematical model predictions can assist in the design of in vitro and in vivo experiments, the results of which can in turn be used to improve the fidelity of the mathematical models. In this thesis a stochastic hybrid model for the process of DNA replication is proposed. We demonstrate how a formal model of DNA replication can be developed in the framework of Piecewise Deterministic Markov Processes and how the model can be coded in simulation. The model in xv

principle applies to any organism for which knowledge of the process of origin selection and activation is available and can capture different modes of DNA replication in different organisms. Moreover, we propose an alternative model encoding one of the biological hypotheses proposed for explaining the random gap problem, the firing propensity redistribution model. Formalization of the model as a Piecewise Deterministic Markov Process allowed the use of Monte–Carlo simulations to perform predictions and statistically analyze the properties of the process in Schizosaccharomyces pombe. The simulation study demonstrates that the redistribution model not only consists a possible solution to the random completion problem but also matches better experimental data without introducing complex mechanisms. Finally, verification tools developed for hybrid systems are used to verify that the proposed models capture the mechanisms of the DNA replication process. We start by adapting the stochastic hybrid model to the Hybrid Input/Output Automaton formalism. Induction proofs are then used to show that important properties of the process are preserved by the model. Our results demonstrate that the model is indeed a faithful representation of the physical reality and lend theoretical support for the predictions of the model.

xvi

Zusammenfassung DNA Replikation, der Vermehrungsprozess des genetischen Zellmaterials, ist ein zentraler Aspekt für das Leben jeder lebenden Zelle. Um sicher zu stellen, dass die genetischen Informationen einer Zelle erhalten bleiben, muss die Basis des Genoms vor der Zellteilung genau einmal repliziert werden. In eukaryotischen Zellen startet die DNA Replikation an mehreren Punkten entlang des Chromosoms, den sogenannten Ursprungspunkten der Replikation. Der Initiierung der DNA Replikation an den Ursprungspunkten folgend verläuft die Replikation beidseitig entlang des Genoms, so dass zwei Replikationsgabelungen entstehen, die sich in die entgegengesetzte Richtung ausbreiten. Während die DNA Replikation bei Bakterien und einigen Eukaryoten gut vorhersehbar ist, unterliegt sie bei den meisten Eukaryoten beträchtlichen Unsicherheiten, sowohl was den Orte als auch die Zeiten der Aktivierung der Ursprungspunkte betrifft. Das Auftreten von Unsicherheit in diesem fundamentalen Prozess ist erstaunlich und wirft unterschiedlichste Fragen auf, unter anderem, warum Zellen diese Unsicherheit tolerieren, wie sie sie kontrollieren aber auch wie sie sicherstellen, dass der gesamte Prozess trotzdem rechtzeitig abgeschlossen wird. Eine Fragestellung die in diesem Zusammenhang besondere Aufmerksamkeit erlangt hat und als stochastischen Vervollständigungsproblems’ bezeichnet wird, betrifft die Beobachtung, dass die Zufälligkeit im DNA Replikationsprozess zu längeren Replikationszeiten führen sollte als die experimentelle Erfahrung lehrt. Ein wichtiges Werkzeug für die Beantwortung solcher Fragen ist die Entwicklung von mathematischen Rechenmodellen die dynamischen und stochastischen Phänomene der DNA Replikation erfassen. Die mathematische Modellierung biochemischer Prozesse hat in den letzten Jahren bemerkenswerte Beachtung gefunden. Die Entwicklung mathematischer Modelle, welche Interaktionen zwischen Genen und Proteinen präzise und eindeutig beschreiben, wird heute als eine der grossten Herausforderungen der biologischen Forschung wahrgenommen. Derartige mathematische Modelle ermoglichen eine Computer basierte Simulation und Analyse biochemischer Prozesse, die für eine schnelle Verifikation bzw. Falsifikation biologischer Hypothesen verwendet werden konnen, um in manchen Fällen teure und langwierige in vitro oder in vivo Experimente zu ersetzen. Darüber hinaus können In-silico-, In-vitro- und In-vivio-Experimente mittels Rückführungs-Anordnung kombiniert und gemeinsam genutzt werden: Mathematische, modellbasierte Vorhersagen können für den Entwurf von xvii

In-vitro- und In-vivo-Experimenten zur Hilfe genommen werden. Deren Ergebnisse wiederum können dazu genutzt werden, die Genauigkeit der mathematischen Modelle zu erhöhen. In dieser Arbeit wird ein stochastisches, hybrides Modell für den DNAReplikationsprozess vorgestellt. Wir zeigen, wie im Rahmen eines stückweise deterministischen Markov Prozesses ein formales Modell für DNAReplikation entwickelt werden kann und wie dieses zu Simulationszwecken implementiert werden kann. Das Modell gilt im Prinzip für jeden Organismus, für welchen Kenntnisse über den Prozess der Auswahl und Aktivierung des Ursprungs zur Verfügung stehen und es kann verschiedene Modi der DNA-Replikation in verschiedenen Organismen umfassen. Desweiteren schlagen wir ein alternatives Modell vor, das eine der biologischen Hypothesen für die Erklärung des stochastischen Vervollständigungsproblems und der Umverteilung der Feuerungsneigung beinhaltet. Die Formalisierung des Modells als stückweise deterministischen MarkovProzess ermoglicht die Verwendung von Monte-Carlo Simulationen um Vorhersagen zu treffen und die Eigenschaften des Prozesses in Schizosaccharomyces pombe statistisch zu analysieren. Wie eine Simulationsstudie zeigt, beinhaltet das Umverteilungsmodell nicht nur eine zulässige Losung des stochastischen Vervollständigungsproblems, sondern liefert darüber hinaus Daten mit guter Übereinstimmung zu denen des Experimentents, ohne dabei komplexe Mechanismen zu benützen. Zum Schluss werden speziell entwickelte Testmodelle für hybride Systeme verwendet, um zu überprüfen, ob die zuvor entwickelten Modelle die Mechanismen der DNA Replikation hinreichend gut beschreiben. Dazu muss zunächst das stochastische hybride Modell in die Form eines hybride Eingangs-/Ausgangs Automaton gebracht werden. Durch Induktion kann dann gezeigt werden, dass wichtige Eigenschaften des Prozesses in dem Modell erhalten bleiben. Die Ergebnisse bestätigen, dass das Modell tatsächlich eine wirklichkeits- getreue Abbildung des physikalischen Prozesses darstellt, und unterstreichen dadurch die theoretische Verlässlichkeit seiner Vorhersagen.

xviii

Suggest Documents