Modèles et Algorithmes pour l’évolution biologique

Informations générales
Nom
CHABROL
Prénom
Olivier
Diplôme
Thèse
Année
2017
Détails de la thèse/HDR
Jury
Bastien Boussau
Eric Rivals
Etienne Pardoux
Julie Thompson
Mathieu raffinot
Directeur (pour les thèses)
Gilles Didier
Manuela Royer-Carenzi
Pierre Pontarotti
Résumé en français
Cette thèse aborde plusieurs questions relatives à l’évolution biologique au moyen de modèles mathématiques et d’algorithmes de calcul les utilisant. Elle se trouve donc à l’intersection des mathématiques, de l’informatique et de la biologie.

La première partie est consacrée au travail que j’effectue en tant qu’ingénieur en bioinformatique et qui a donné lieu à sept articles en collaboration. Elle est principalement constituée de l’un de ces sept articles, qui est représentatif de mon activité dans ce cadre et dans lequel divers outils d’analyse sont utilisés afin d’étudier l’adaptation des coraux aux changements de température. Plus précisément, il s’agit de déterminer si la tolérance aux changements de température que l’on observe chez les coraux vivants à de faibles profondeurs a été spécifiquement sélectionnée au cours de leur évolution ou si cette tolérance est partagée par toutes les espèces de coraux, y compris celles vivant à des profondeurs où il n’y a pas, où très peu, de variations de température.

La question principale étudiée dans la thèse est la mise en évidence de signatures moléculaires de la convergence évolutive qui est le phénomène par lequel des espèces éloignées développent indépendamment des caractères similaires. Nous proposons une approche originale permettant de détecter les positions des protéines potentiellement impliquées dans la convergence d’un caractère binaire donné. Celle-ci repose sur une mesure du “niveau de convergence” des positions, qui est une espérance déterminée sous des modèles Markoviens d’évolution protéique. Nous donnons un algorithme de calcul polynomial de cet indice et montrons (i) qu’il discrimine mieux que les méthodes précédentes, les positions convergentes des
“neutres” sur des simulations et (ii) que notre approche donne des résultats qui font sens biologiquement sur un exemple réel. En effet, appliquée à un jeu de données relatif à l’apparition indépendante de l’écholocation chez les dauphins et les chauve-souris, celle-ci détecte un nombre significativement important de gènes liés à l’audition, ce qui constitue une validation de notre approche.

Dans le but de pouvoir traiter à terme de la convergence de caractères continus, comme le poids ou la taille, nous nous sommes ensuite intéressés à la détection de changements de tendance évolutive le long d’un arbre représentant l’évolution des espèces. Nous proposons une nouvelle méthode qui, à notre connaissance, est la première à être basée sur un principe de parcimonie où l’on cherche à déterminer la position du changement permettant de minimiser un certain coût évolutif sur l’arbre. Les résultats obtenus sur deux jeux de données sont d’une part cohérents
au regard des connaissances biologiques mais aussi tout à fait comparables à ceux obtenus à partir de méthodes basées sur des modèles stochastiques.