Extension des modèles stochastiques de substitution de nucléotides et son implémentation informatique
| Titre | Extension des modèles stochastiques de substitution de nucléotides et son implémentation informatique |
| Type de publication | Thèse |
| Nouvelles publications | 2011 |
| Auteurs | Benard, Emmanuel |
| Directeurs | Michel, Christian |
| Rapporteurs | Bernot, Gilles, Denise Alain |
| Examinateurs | Bechmann, Dominique, Contassot-Vivier Sylvain |
| Université et/ou école doctorale | Université de Stasbourg |
| Diplôme | Doctorat |
| Résumé | Le premier modèle stochastique d'évolution de séquences génétiques a été proposé par Jukes et Cantor en 1969. Dans ce modèle, le processus d'évolution repose sur des substitutions de nucléotides de telle sorte que toutes les substitutions possible interviennent avec la même probabilité. Ce premier modèle a ensuite été généralisé avec la prise en compte de plusieurs paramètres de substitution, comme les modèles de Kimura à deux (1980) et trois paramètres de substitution (1981). Plus récemment, ces modèles de Jukes et Cantor et de Kimura ont été étendu aux dinucléotides et trinucléotides (Frey et Michel, 2006 ; Michel, 2007) avec le développement de modèles permettant le calcul de probabilités d'occurrence analytiques de dinucléotides et trinucléotides à partir d'un vecteur de probabilités d'occurrence initiales et de paramètres de substitution. L'étude évolutive de motifs réalisée avec ces modèles peut être conduite dans les sens d'évolution direct (passé-présent) et inverse (présent-passé). Pendant cette thèse, nous nous sommes intéressés à l'extension des modèles analytiques de substitution de nucléotides (de type Kimura 1981) à des motifs génétiques de taille quelconque à l'aide d'une technique différente de l'approche classique, par l'utilisation d'opérateurs de Kronecker (somme et produit) des matrices de substitution. Une partie a été consacrée au développement d'une application web SEGM (Stochastique Evolution of Genetic Motifs), proposant aux communautés de biologistes et de bioinformaticiens le calcul des solutions analytiques des probabilités d'occurrence de motifs génétiques de taille 1 à 5 ainsi que des courbes d'évolution de ces probabilités, dans les deux sens d'évolution direct et inverse. Par ailleurs, une étude statistique de génomes eucaryotes et procaryotes a permis l'identification en 1996 par Arquès et Michel d'un code circulaire trinucléotide X0 au sein de ces génomes. Nous nous sommes intéressés à l'étude évolutive des codons du code circulaire X0 en développant un modèle numérique d'évolution inverse de trinucléotides avec blocage dynamique des substitutions. Nous présentons les résultats obtenus. |
| English Abstract | A stochastic evolution model of genetic sequences was first proposed by Jukes and Cantor in 1969. The evolution process in this model is handled by nucleotide substitutions, both of them occurring with the same probability (one substitution parameter). Jukes and Cantor's model was then generalised by Kimura in 1980 and 1981 respectively with two and three substitution parameters. More recently, these nucleotide substitution models were extended to dinucleotides and trinucleotides (Frey and Michel, 2006 ; Michel, 2007). These extensions allow the computation of analytical occurrence probabilities of dinucleotides and trinucleotides from a vector of initial occurrence probabilities and substitution parameters. The evolutionary computations can be carried out both in the direct (past-present) and inverse (present-past) evolutionary directions. During this thesis, we worked on the extension of the nucleotide substitution analytical models with three parameters (Kimura, 1981) to genetic motifs of any size using a different method from the classical approach, more precisely with the use of Kronecker sums and products of nucleotide substitution matrices. Then, we developed a web application SEGM (Stochastic Evolution of Genetic Motifs) for bioinformatics and biological communities, offering the possibility to compute analytical solution of occurrence probabilities of genetics motifs of size 1 to 5 and to plot evolution curves of these probabilities. Moreover, a statistical study of eukaryote and prokaryote genomes held in 1996 by Arquès and Michel identified a trinucleotide circular code X0 in these genomes. We developed an inverse numerical substitution model for trinucleotides with dynamic substitution blocking to study the inverse evolution of codons of the circular code X0. We show the results of this study. |
